上次的文章简单介绍了《R数据科学》,以及ggplot2中mpg的调取方式:
1.直接键入mpg
2.使用ggplot2::mpg来调取
这次我们来看,ggplot2的绘图模板,模板函数为:
ggplot(data = <data>)+<geom_function>(mapping = aes(<mappings>))
这个代码是无法运行的,只是一个模板,< >中的内容,<data>为读取的数据,<geom_function>为函数功能,比如geom_point
就是绘制点集的,而<mappings>我们可以设置x和y的参数,比如,aes(x=displ,y=hwy)
,代表以displ为x,以hwy为y,当然这里可以简写为aes(displ,hwy)
。
接下来是一些练习题:
(1)运行ggplot(data = mpg)
,你会看到什么?
这个不会有任何效果,因为未使用功能函数<geom_function>画图。
(2)数据集mpg中有多少行?多少列?
A tibble: 234 x 11,代表234行11列
可以通过以下几种方式查询:
[1]
dim(mpg)
[2]
str(mpg)
[3]
nrow(mpg)
,ncol(mpg)
[4]
library(tibble)
glimpse(mpg)
image.png
链接中包含了这四种查询方式:
http://www.360doc.com/content/20/0802/17/71039787_928162146.shtml
(3)变量drv的意义是什么?
drv是mpg数据框中的变量,我们采用?mpg
,或者help(mpg)
来查询它的意义,可以得到:
drv:the type of drive train, where f = front-wheel drive, r = rear wheel drive, 4 = 4wd,
驱动类型,前轮驱动,后轮驱动,四轮驱动。
(4)使用hwy和cyl绘制一张散点图。
万变不离其宗,直接套公式
ggplot(mpg)+geom_point(aes(hwy,cyl))
(5)如果使用class和drv绘制散点图,会发生什么情况?为什么这张图没有什么用处?
image.png
2个变量没有明显的相关性,且均为分类变量,失去可视化的意义
网友评论