gather() 和 spread() 这两个函数在tidyr这个package里,是专门用来做数据清洗的函数.
gather(
data,
key = "key",
value = "value",
...,
na.rm = FALSE,
convert = FALSE,
factor_key = FALSE
)
#key: 原先的列名放进行里之后的新列名
#value: 原数据列里面的数值
#......: 想要转换的列名
#"-": 可以用来指示想要忽略哪些列
例子:
gather()是用来把错放在列的数据回归到行里的:

目的:希望用education_level作为横坐标,每一行作为一个分组。
解决:gather(dat, claim_amount, counts, -education_level)
claim_amount:原来除去要用来做横坐标的education_level之外的列们统一叫这个名字;
counts:那些列们之前的数值;
-education_level:要用这个来做横坐标。

网友评论