以后尽量采用今天这样截图的形式,通过将SAS和R的语法进行对比,这样大家更能直观地看出区别。
一:对数据框进行基本处理,比如数据的筛选
左边为SAS,右边是R,记得粘到R studio运行。SAS对数据处理的形式是多样的,比如筛选数据可以用where和if,但是为了省事,我只采用一种方法。
R对数据的处理形式也是多样的,但是感觉R更丰富一些。
![](https://img.haomeiwen.com/i1998906/d5f71e6b4603662d.png)
二:数据集的排序
需要注意的是,如果数据集是根据单个变量进行排序,可以通过order函数和Sex,Age这样写(或者说我不知道)。
而是通过attach函数实现,对于这个attach,我的个人理解是类似SAS里面的数据集存储在逻辑库里,如果你需要对数据集里面的变量进行处理,你得把这个数据集先读取出来。而attach函数的的作用就是把数据框添加到R的搜索路径中。
![](https://img.haomeiwen.com/i1998906/74f6d20bd642a01b.png)
这边需要注意一点是,在SAS中,如果需要根据变量倒序排序,得单独对变量加descending,但是在R中,倒序的函数是decreasing,而且是对多个变量同时进行倒序(目前不知能不能像SAS只对某几个变量倒序),比如说我只想对sex,age排序,然后sex是倒序排序,在R中,目前这样看好像是不行的。
三:去除重复值
看到R在查找和去除重复值方面有这么多功能,显得花里胡哨的,SAS中的dupout类似查找重复值,但是不会显示重复值在第几行。
![](https://img.haomeiwen.com/i1998906/6b418bc6941ed043.png)
四:在数据框里添加变量或者删除变量
上面的keep更合理地解释应该是保存变量,而不是筛选变量。
![](https://img.haomeiwen.com/i1998906/c48e6697b895c554.png)
上面是对数据框的一些基本操作,了解这些,应该就能对单个数据集进行一些初步的处理了,之后我们开始数据集的拼接合并那些。
网友评论