写在前面。
-
散点图
通常用来刻画两个连续型变量
之间的关系。每个点代表一个观测值
。
图形属性
设置或者映射变量给图形属性
可以展示更多的信息并使图形更美观和丰富。
散点图的属性包括,点的形状
、颜色
、透明度
、位置
和标签
等。
下文分别介绍。
图形重叠
当数据集很大时,散点图中的点会相互重叠
,为了避免这种情况,主要从以下角度考虑,调节点的透明度
和位置
,分箱
。对于其他图形,还有别的方式。
透明度
使用示例数据diamonds
数据集:
> str(diamonds)
tibble [53,940 × 10] (S3: tbl_df/tbl/data.frame)
$ carat : num [1:53940] 0.23 0.21 0.23 0.29 0.31 0.24 0.24 0.26 0.22 0.23 ...
$ cut : Ord.factor w/ 5 levels "Fair"<"Good"<..: 5 4 2 4 2 3 3 3 1 3 ...
$ color : Ord.factor w/ 7 levels "D"<"E"<"F"<"G"<..: 2 2 2 6 7 7 6 5 2 5 ...
$ clarity: Ord.factor w/ 8 levels "I1"<"SI2"<"SI1"<..: 2 3 5 4 2 6 7 3 4 5 ...
$ depth : num [1:53940] 61.5 59.8 56.9 62.4 63.3 62.8 62.3 61.9 65.1 59.4 ...
$ table : num [1:53940] 55 61 65 58 58 57 57 55 61 61 ...
$ price : int [1:53940] 326 326 327 334 335 336 336 337 337 338 ...
$ x : num [1:53940] 3.95 3.89 4.05 4.2 4.34 3.94 3.95 4.07 3.87 4 ...
$ y : num [1:53940] 3.98 3.84 4.07 4.23 4.35 3.96 3.98 4.11 3.78 4.05 ...
$ z : num [1:53940] 2.43 2.31 2.31 2.63 2.75 2.48 2.47 2.53 2.49 2.39 ...
- 默认设置绘图:
ggplot(data = diamonds ,aes(x =carat, y = price)) +geom_point()
[图片上传失败...(image-3d9665-1695775212986)]
可以看到,大量的点重叠在一起,看不清楚。
- 设置透明度
使用alpha
:
ggplot(data = diamonds ,aes(x =carat, y = price)) +geom_point(alpha = 0.1)
[图片上传失败...(image-271f0b-1695775212986)]
网友评论