1. 准备工作
library(ggplot2)
library(tidyverse)
#设置随机数种子,产生小数据集
set.seed(1410)
dsmall <- diamonds[sample(nrow(diamonds),100), ]
2. ggplot2画图尝试
diamonds %>% ggplot(aes(x=log(carat), y=log(price)))+geom_point()
diamonds %>% ggplot(aes(x=carat, y=x*y*z))+geom_point()
问题1:为什么是指数型的就需要这样转换:x和y同时取log?书中是这样写的,和我的认知不一致。
3. 关于图形属性
颜色,大小(size),形状,其他(alpha: 1完全不透明; 0完全透明)
dsmall %>% ggplot(aes(x=carat, y=price, colour=color))+geom_point()
dsmall %>% ggplot(aes(x=carat, y=price, shape=cut))+geom_point()
##这一步有什么提示信息。ordinal variable是指什么?
## Warning message:
## Using shapes for an ordinal variable is not advised
dsmall %>% ggplot(aes(x=carat, y=price, shape=color))+geom_point()
##默认只能处理6种shape;当大于6个时只能手动定义shape
问题2:如何手动设置shape?
问题3:标度
是什么?一个函数,作用是将数据的值映射到属性的值,比如cut有5个值,将这5个值依次对应上shape属性的5个值(就是具体的形状)
dsmall %>% ggplot(aes(x=carat, y=price, colour=color, size=dsmall$price))+geom_point()
问题4:什么时候映射到颜色和形状?什么时候映射到大小?
4. 几何对象
问题5:二维变量关系可以画哪些图?一维变量关系可以画哪些图?
点、线(曲线,折线)、箱型图(其中一维是离散的)
直方图、密度曲线、频率多边形;条形图
问题6:如何更改几何对象绑定的统计变换?以直方图为例
4.1 点线图
dsmall %>% ggplot(aes(x=carat, y=price))+geom_point()+geom_smooth()
dsmall %>% ggplot(aes(x=carat, y=price))+geom_point(aes(color=color))+geom_smooth(se=F, span=1)
##se=F表示不加标准误;span=1表示线尽可能直一些
问题7:请试试下面的代码,跟上面有一点点不同,为什么有这种不同?
dsmall %>% ggplot(aes(x=carat, y=price, color=color))+geom_point()+geom_smooth(se=F, span=1)
##再试试,跟上面一样吗?
dsmall %>% ggplot(aes(x=carat, y=price))+geom_point(aes(color=color))+geom_smooth(se=F, span=1, aes(color=color))
重要结论:在一个几何对象中,一个分类变量被映射到一个图形属性,几何对象会自动按照这个变量分类
4.2 箱型图
问题8:箱线图有哪些图形属性?
diamonds %>% ggplot(aes(x=color, y=price/carat))+geom_boxplot(colour="blue", fill="green", size=2)
问题9:为什么上面的代码中几何对象中没有用到aes()
4.3 直方图
ggplot(diamonds, aes(x=diamonds$carat))+geom_histogram(bins=100, fill="light blue")
ggplot(diamonds, aes(x=diamonds$carat, y=..density..))+geom_histogram(bins=100, fill="light blue")
问题10:上面两个都是直方图,有什么区别?
ggplot(diamonds, aes(x=diamonds$carat))+geom_density(color="light blue")
问题11:这个图和上面哪个图最像?第二个。如何组合直方图和密度图?如下
ggplot(diamonds, aes(x=diamonds$carat, y=..density..))+geom_histogram(bins=100, fill="light blue")+geom_density(color="light blue")
问题12:binwidth和bins的区别?
4.4 条形图
ggplot(diamonds, aes(x=diamonds$color))+geom_bar(aes(fill=diamonds$cut))
4.5 路径图
economics %>% ggplot(aes(x=unemploy/pop, y=uempmed))+geom_path(aes(colour=lubridate::year(date)))
问题13:结合书本上的结论理解上面的路径图
5. 分面
diamonds %>% ggplot(aes(x=carat, y=price))+geom_point()+facet_grid(color~cut)
6. 其他选项
dsmall %>% ggplot(aes(x=carat, y=price))+geom_point()+geom_smooth()+xlim(0,2)+ylim(0,15000)+xlab("重量")+ylab("价格")
7. 尝试一下,仍然是问题7的结论
ggplot(diamonds, aes(x=diamonds$carat))+geom_density(aes(color=diamonds$color, fill=diamonds$color), alpha=0.1)
ggplot(diamonds, aes(x=diamonds$carat))+geom_histogram(bins=100, aes(fill=diamonds$color))
reference
《ggplot2: 数据分析与图形艺术》
网友评论