美文网首页学习《R for data science》
数据可视化(R for data science)

数据可视化(R for data science)

作者: limbo1996 | 来源:发表于2019-05-06 21:51 被阅读0次

学习《R for data science》
使用ggplot2中自带的数据mpg。为收集到的多种汽车数据。
问题:

  • Do cars with big engines use more fuel than cars with small engines?

  • What does the relationship between engine size and fuel efficiency look like?

会用到的mpg中的变量:

  • displ,汽车的发动机尺寸
  • hwy, 车的燃油效率。
    更多的信息可以?mpg查看。

1.ggplot的基本格式

ggplot(data = <DATA>) + 
  <GEOM_FUNCTION>(mapping aes(<MAPPINGS>))

例如:
制作x轴displ和y轴hwy的相关图表。

ggplot(data = mpg) + 
  geom_point(mapping = aes(x = displ, y = hwy))

结果:


图1 displ~hey

2.数据美化

2.1 颜色

“The simple graph has brought more information to the data analyst’s mind than any other device.” — John Tukey

在做的图表中加入颜色是一种可以整合不同变量类型的一种方式。
比如,在图1中可以将车的不同类型表示出来。


ggplot(data = mpg) + geom_point(mapping = aes(x = displ, y = hwy, color = class))

结果:

图2 class
只需要在aes中添加color参数,将它映射到你想填入的变量上,ggplot2会自动分类并且做好图例。

2.2 大小

除了颜色,还可以将要添加的变量用点的大小表示出来(一般并不推荐)

ggplot(data = mpg) + 
  geom_point(mapping = aes(x = displ, y = hwy, size = class))
图3 size

可以看到使用形状来分类的话效果并不好。

透明度和形状

用点的透明度和点的形状来区分未必不是一个好办法。

#点的透明度
ggplot(data = mpg) + 
  geom_point(mapping = aes(x = displ, y = hwy, alpha = class))
#点的形状
ggplot(data = mpg) + 
  geom_point(mapping = aes(x = displ, y = hwy, shape = class))
图4 alpha 图5 shape

在形状中需要注意的是ggplots2一次只能使用六个形状。

3.颜色的其他用法

在上面不论是颜色还是形状大小等,他都代表了一定的含义即不同车的类型,每种车有自己的表示且对于一个x和相应的y就有一中表示方法。

对于geom来说,是可以自己设置的,比如,我们将所有的点都设置为蓝色。

ggplot(data = mpg) + 
  geom_point(mapping = aes(x = displ, y = hwy),color = 'blue'))
图6 blue

在这里颜色不再有任何含义,它只是改变了外观而已。ggplots中有很多形状颜色等等是可以自己设置的,具体见其图例

相关文章

网友评论

    本文标题:数据可视化(R for data science)

    本文链接:https://www.haomeiwen.com/subject/hszdoqtx.html