第三章 开发你的数据
3.1创建并重新定义变量
可以通过分配语句来创建并重新定义变量,基本形式为:
Vari able=expression
Variable是变量名,expression可以是常量、其他变量、或者数学表达式。分配语句的基本
类型有:
Expression是数学表达式,需要遵循运算法则,先算指数、再算乘除、之后是加减。可以用括号改变运算等级。例子如下是一个农产品估重数据,每位农民要求对他们的番茄、南瓜、豌豆、葡萄进行估重:
这个程序包含了5句分配语句,第一个将14赋值给zone,第二个使type等于一个字符串常量……打印出的结果中,既包括旧变量,又包括新变量:
由于观测值susan的peas变量出现了缺失值,因此这个观测值的total和pertom变量也出现了缺失值。日志窗口的说明如下:
NOTE: Mi ssing values were generated as a result of performing an operation onmi ssi ng val ues.
3.2使用SAS函数
SAS有400多个函数,主要涵盖如下领域:
函数基本形式:function-name(argument,argument,…),所有的函数都需要括号,即使没有参数。下面的程序计算使用MDY函数,MDY函数需要三个参数:月、日、年。
Bi rthday=MDY(MonthBorn,DayBorn,YearBorn);
函数可以嵌套,即一个函数可以是另一个函数的参数。比如:NewValue=INT(LOG(10));例子有一个南瓜雕刻比赛的数据,pumpkin.dat数据包含了参赛者的名字、年龄、雕刻的南瓜类型、报名日期、五位裁判给出的分数。
AvgScore使用均值函数创建的变量,计算参数的均值,这与直接相加再除以5不同的地方在于,当参数中出现缺失值时,直接相加再除的方法返回缺失值,而均值函数计算非缺失参数的均值。
DayEntered变量使用DAY函数,返回日期在一个月里的天数。
Type用大写转换函数将原来的字母转换成大写字母。
结果是:
网友评论