这一节我学的是SAS如何产生新变量,其中涉及到了很多细节,让我不紧翻起了🙄,emmmmm,算了,还是老实的做笔记吧。
利用表达式或函数直接产生新变量
- 基本格式:
变量名=表达式或函数 ;
注意若变量名是已有变量,表示用新值代替原有值,表达式的范围很广,常见的运算符如下:
sas中常见的运算符.jpg注意SAS中,不等于符是“^=”不是“!=”,新变量要放在“input”和“cards”之间。另外,如果使用比较运算,SAS会根据比较的结果产生0和1。
- 日期常量
日期常量要写成“日月年”d这种格式,月是英文的前三个字母。
利用if-then语句产生新变量
- 基本格式:
if 表达式 then 新变量= ... ; else 新变量= ... ;
利用retain语句和累加语句产生新变量
SAS读取数据时有一特点,就是有遗忘症,它每读完一条观测返回到data语句的时候,会忘掉刚才读取的值,因此若想实现累加效果,需要用到retain
语句或者累加语句。
- retain语句的基本格式:
retain 变量1 <初始值> 变量2 <初始值> ...... ;
它的作用是生成一个变量,指定它的初始值,并保留该变量每次计算的结果,若没有指定初始值,默认为缺失值。
- 累加语句的基本格式:
变量+表达式
它的作用时产生一个累加的变量值,注意是没有左边的“变量=”部分,直接写右边的表达式,它的默认值为0。另外,累加语句表达式中第一个出现的变量就是新产生的变量名。
利用do循环语句产生新变量
- 简单的do循环语句的一般形式:
do 变量=初始值 to 最终值 <by 增加值> ;
SAS语句 ;
output ;
end ;
do语句适用于有规律的变量,比如1~12月。初始值、最终值、增加量可以是数值,也可以是字符。若没有增加值,则默认为1。下面是几个常见的do 循环语句的格式:
do循环语句的格式.png
指定新变量的类型与长度
新变量是需要提前指定与之对应的变量类型和长度,SAS中主要是用length语句,它的格式如下:
length 变量1 <$> 长度1 变量2 <$> 长度2 ... ;
如果新变量是字符型,需要加上"$"符号,数值型变量的长度可以指定3~8,字符型变量的长度则可以指定1~32767。另外,length语句一定要在新变量产生之前就设定好,否则不起作用。
需要特别注意:SAS中,字符型变量的长度是由第一个遇到的值得长度决定的,而且字符变量一旦产生,它的长度就无法改变。举例说明:
forEx.png在左例中,由于事先未指定lx2的长度,而且lx2第一个遇到的值是“无效”,所以它的长度就固定在了4,因此最后打印出来的lx2列也只能有2个汉字。
网友评论