- R包的小抄
- R包:tidyr
- 功能:【data clean】
- (1)数据框的变形
- (2)处理数据框中的空值
- (3)根据一个表格衍生出其他表格
- (4)实现行或列的分割和合并
- key-value--“键值对” ,表示一种对应关系。
- Reshape Data
- (1). gather() moves column names into a key column, gathering the column values into a singel value column. 简而言之:excel->spss
- gather(数据框名,需合并的列名(2个),合并后的key列名,value列名
- eg: 三条命令运行结果一致
gather(a,X1999,X2000,key = "year",value = "cases")
gather(a,"year","cases",-country) #-country的意思就是合并除country外剩下的列。
gather(a, "year","cases",X1999,X2000)
- eg: 三条命令运行结果一致
- gather(数据框名,需合并的列名(2个),合并后的key列名,value列名
- (2). spread spss->excel
- (1). gather() moves column names into a key column, gathering the column values into a singel value column. 简而言之:excel->spss
- Handle Missing Values
- (1). 删除含NA的整行
drop_na()
drop_na(数据框名,有NA的列名) - (2). 根据上一行的数值填充
fill()
fill(数据框名,有NA的列名) - (3). 空值填入特定数值
replace_na()
replace_na(数据框名,要填的列名=要填的值)replace_na(X,list(X2=2))
- (1). 删除含NA的整行
- Expand Tables 【没懂otz】
- complete(把空值的位置补全)
complete(X,nesting(X1),fill=list(X2=5))
- expand(列出每列值所有可能的组合)
- complete(把空值的位置补全)
- 功能:【data clean】
今日信息量过载ing
网友评论