SAS - 数据集



可供 SAS 程序用于分析的数据称为 SAS 数据集。它使用 DATA 步创建。SAS 可以读取各种文件作为其数据源,例如 **CSV、Excel、Access、SPSS 以及原始数据**。它还提供了许多内置数据源可供使用。

  • 如果 SAS 程序使用数据集并在运行会话后将其丢弃,则这些数据集称为 **临时数据集**。

  • 但如果将其永久存储以供将来使用,则称为 **永久数据集**。所有永久数据集都存储在特定库中。

SAS 数据集以行和列的形式存储,也称为 SAS 数据表。下面我们看到永久数据集的示例,这些示例是内置的以及从外部来源读取的。

SAS 内置数据集

这些数据集已在安装的 SAS 软件中可用。它们可以被探索并用于制定数据分析的示例表达式。要探索这些数据集,请转到 **库 -> 我的库 -> SASHELP**。展开后,我们会看到所有可用内置数据集名称的列表。

data_sets_1_explore

让我们向下滚动以找到名为 **CARS** 的数据集。双击此数据集会在右侧窗口窗格中打开它,我们可以在其中进一步探索它。我们还可以使用右侧窗格下的最大化视图按钮最小化左侧窗格。

data_sets_2_CARS

我们可以使用底部的滚动条向右滚动以浏览表中的所有列及其值。

data_sets_3_CARS_explore

导入外部数据集

我们可以使用 SAS Studio 中提供的导入功能将我们自己的文件导出为数据集。但是这些文件必须存在于 SAS 服务器文件夹中。因此,我们必须使用 **服务器文件和文件夹** 下的上传选项将源数据文件上传到 SAS 文件夹。

data_sets_4_1_loacl_files_to_server

接下来,我们通过导入在 SAS 程序中使用上述文件。为此,我们使用选项 **任务 -> 实用程序 -> 导入数据**,如下所示。双击“导入数据”按钮,在右侧打开窗口以选择数据集的文件。

接下来,单击右侧窗格中导入数据程序下的 **选择文件** 按钮。以下是可以导入的文件类型列表。

data_sets_5_import_files

我们选择存储在本地系统中的“employee.txt”文件,并将其导入,如下所示。

data_sets_4_2_import_utility

查看导入的数据

我们可以通过使用“运行”选项运行生成的默认导入代码来查看导入的数据。

data_sets_6_view_imported_data

我们可以使用与上述相同的方法导入任何其他文件类型,并在各种 SAS 程序中使用它。

广告