SAS - 变量



通常,SAS 中的变量表示它正在分析的数据表中的列名。但它也可以用于其他目的,例如在编程循环中用作计数器。在本章中,我们将了解 SAS 变量作为 SAS 数据集列名的用法。

SAS 变量类型

SAS 有如下三种类型的变量:

数值变量

这是默认的变量类型。这些变量用于数学表达式。

语法

INPUT VAR1 VAR2 VAR3; 		#Define numeric variables in the data set.

在上面的语法中,INPUT 语句显示了数值变量的声明。

示例

INPUT ID SALARY COMM_PERCENT;

字符变量

字符变量用于不用于数学表达式的值。它们被视为文本或字符串。通过在变量名末尾添加一个 $ 符号和一个空格,变量就变成了字符变量。

语法

INPUT VAR1 $ VAR2 $ VAR3 $; 	#Define character variables in the data set.

在上面的语法中,INPUT 语句显示了字符变量的声明。

示例

INPUT FNAME $ LNAME $ ADDRESS $;

日期变量

这些变量仅被视为日期,并且需要采用有效的日期格式。通过在变量名末尾添加日期格式和一个空格,变量就变成了日期变量。

语法

INPUT VAR1 DATE11. VAR2 MMDDYY10. ; #Define date variables in the data set.

在上面的语法中,INPUT 语句显示了日期变量的声明。

示例

INPUT DOB DATE11. START_DATE MMDDYY10. ;

SAS 程序中变量的用法

以上变量在 SAS 程序中的使用方式如下例所示。

示例

以下代码显示了如何在 SAS 程序中声明和使用三种类型的变量

DATA TEMP;
INPUT ID NAME $ SALARY DEPT $ DOJ DATE9. ;
FORMAT DOJ DATE9. ;
DATALINES;
1 Rick 623.3 IT 02APR2001
2 Dan 515.2 OPS 11JUL2012
3 Michelle 611 IT 21OCT2000
4 Ryan 729 HR 30JUL2012
5 Gary 843.25 FIN 06AUG2000
6 Tusar 578 IT 01MAR2009
7 Pranab 632.8 OPS 16AUG1998
8 Rasmi 722.5 FIN 13SEP2014
;
PROC PRINT DATA = TEMP;
RUN;

在上面的示例中,所有字符变量后都声明了 $ 符号,日期变量后都声明了日期格式。上述程序的输出如下。

SAS_BS_variable_output

使用变量

变量在数据分析中非常有用。它们用于应用统计分析的表达式。让我们来看一个分析名为 CARS 的内置数据集的示例,该数据集位于 库 → 我的库 → SASHELP 下。双击它以浏览变量及其数据类型。

variable_1_explore_car

接下来,我们可以使用 SAS studio 中的任务选项生成其中一些变量的汇总统计信息。转到 任务 -> 统计 -> 汇总统计 并双击它以打开如下所示的窗口。选择数据集 SASHELP.CARS 并选择三个变量 - MPG_CITY、MPG_Highway 和 Weight 在分析变量下。选择变量时按住 Ctrl 键单击。单击运行。

variable_2_select_summary_car

完成上述步骤后,单击结果选项卡。它显示所选三个变量的统计汇总。最后一列表示分析中使用的观测值(记录)的数量。

variable_3_summary_result_car
广告