写在前面。
-
散点图
通常用来刻画两个连续型变量
之间的关系。每个点代表一个观测值
。
图形重叠
当数据集很大时,散点图中的点会相互重叠
,为了避免这种情况,主要从以下角度考虑,调节点的透明度
和位置
,分箱
。对于其他图形,还有别的方式。
位置
当散点图的其中一个轴或者两个轴对应离散型变量时,会出现重叠的现象。
示例数据ChickWeight
数据集
> str(ChickWeight)
Classes ‘nfnGroupedData’, ‘nfGroupedData’, ‘groupedData’ and 'data.frame': 578 obs. of 4 variables:
$ weight: num 42 51 59 64 76 93 106 125 149 171 ...
$ Time : num 0 2 4 6 8 10 12 14 16 18 ...
$ Chick : Ord.factor w/ 50 levels "18"<"16"<"15"<..: 15 15 15 15 15 15 15 15 15 15 ...
$ Diet : Factor w/ 4 levels "1","2","3","4": 1 1 1 1 1 1 1 1 1 1 ...
- attr(*, "formula")=Class 'formula' language weight ~ Time | Chick
.. ..- attr(*, ".Environment")=<environment: R_EmptyEnv>
- attr(*, "outer")=Class 'formula' language ~Diet
.. ..- attr(*, ".Environment")=<environment: R_EmptyEnv>
- attr(*, "labels")=List of 2
..$ x: chr "Time"
..$ y: chr "Body weight"
- attr(*, "units")=List of 2
..$ x: chr "(days)"
..$ y: chr "(gm)"
这个时候可以调用position_jitter()
给数据点增加随机扰动
。
ggplot(data = ChickWeight ,aes(x =Time, y = weight)) +
geom_point( position =position_jitter(width = 0.5, height = 0))
网友评论