一、安装
RStudio有网页版和软件版
软件版则需要下载安装ggplot2包,运行如下命令:
ggplot2包中自带一套数据(关于大众汽车燃油经济性)可用于学习
二、导入包和类还有集:
关于这套数据的说明:
cyl:汽缸的数目
cty:城市和高速公路行驶记录每加仑行驶的英里数(miles per gallon,mpg)
hwy:高速公路耗油量
displ:发动机排量(L)
drv:动力传动系统(前轮f,后轮r,四轮4)
model:汽车模型(选择了38款)
class(未显示全):描述汽车种类的变量(双座,SUV,紧凑型,小型货车,小卡车,微型小客车)
三、散点图学习
ggplot2制图形有三个重要的组成部分
1. 数据
2. 数据和视觉变量属性之间的映射(aesthetic mappings)
3. 呈现数据结果的图层(一般使用geom()函数)
利用图形属性(颜色和形状)可以来比较不同分组)。图形的颜色、大小和形状等都是给绘图添加的额外变量,即标度(scale),添加在函数aes() 的参数中(注:class、drv、cyl等是数据集中的类别名称):
- aes(displ, hwy, colour = class)
- aes(displ, hwy, shape = drv)
- aes(displ, hwy, size = cyl)
在此我们只用颜色来做维度。
我们看下displ和hwy相关性的散点图,图中点的颜色是是由第三个变量(汽车种类)决定。脚本如下,图形如下:
发动机排量对高速公路耗油量的散点图结论:发现他们呈现负相关关系。分析得出影响耗油量的一个重要因素是发动机排量。
四、条形图学习
翻转笛卡尔坐标,使水平变成垂直,垂直,水平。这主要用于将显示x上的y条件的地理和统计信息转换为y上的x条件。
网友评论