SAS - 数据集格式化



有时我们希望以与数据集中的格式不同的格式显示分析数据。例如,我们希望为包含价格信息的变量添加美元符号和两位小数。或者我们可能希望以全部大写形式显示文本变量。我们可以使用FORMAT应用内置的 SAS 格式,并使用PROC FORMAT应用用户定义的格式。此外,单个格式可以应用于多个变量。

语法

应用内置 SAS 格式的基本语法如下:

format variable name format name

以下是所用参数的描述:

  • 变量名是数据集中使用的变量名。

  • 格式名是要应用于变量的数据格式。

示例

让我们考虑一下下面包含组织员工详细信息的 SAS 数据集。我们希望以大写形式显示所有姓名。format 语句用于实现此目的。

DATA Employee; 
   INPUT empid name $ salary DEPT $ ; 
   format name $upcase9. ;
DATALINES; 
1 Rick 623.3	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;
   PROC PRINT DATA = Employee; 
RUN; 

执行上述代码后,我们将获得以下输出。

format1

使用 PROC FORMAT

我们还可以使用PROC FORMAT格式化数据。在下面的示例中,我们为变量 DEPT 分配新值,扩展部门的名称。

DATA Employee; 
   INPUT empid name $ salary DEPT $ ; 

DATALINES; 
1 Rick 623.3 IT 		 
2 Dan 515.2 OPS
3 Mike 611.5 IT 	
4 Ryan 729.1 HR 
5 Gary 843.25 FIN 
6 Tusar 578.6 IT 
7 Pranab 632.8 OPS
8 Rasmi 722.5 FIN 
;
proc format;
value $DEP 'IT' = 'Information Technology'
      'OPS'= 'Operations' ;
RUN;
   PROC PRINT DATA = Employee; 
   format name $upcase9. DEPT $DEP.; 
RUN; 

执行上述代码后,我们将获得以下输出。

format2
广告