DataCamp课程 Chapter.2

作者: Jason数据分析生信教室 | 来源:发表于2021-07-08 08:34 被阅读0次

Tidyverse课程目录

Chapter 1. 数据整形
Chapter 2. 数据可视化
Chapter 3. 分组和概括
Chapter 4. 可视化类型

Chapter 2. 数据可视化

这一章里会用到ggplot2包来可视化数据。数据的话和Chapter一样,用到了gapminder里的数据。首先运行一下本次会用到的三个包。

ggplot2小试牛刀

ggplot2的名声估计大家也早有耳闻,在这里做简单的入门介绍。之后会出专题详细讲解,功能之强大罄竹难书(用词不当)。

# Load the ggplot2 package as well
library(gapminder)
library(dplyr)
library(ggplot2)

接下来选取数据gapminderyear1952的数据。并定义为新的数据集名字叫gapminder_1952

# Create gapminder_1952
gapminder_1952 <- gapminder %>% 
    filter(year==1952)

创建一个x轴是pop,y轴是gdpPercap的散点图。

# Change to put pop on the x-axis and gdpPercap on the y-axis
ggplot(gapminder_1952, aes(x = pop, y = gdpPercap)) +
  geom_point()

继续创建一个x轴是pop,y轴是lifeExp的散点图。

坐标轴log处理

上面两张图看上去明显不顺眼,需要把x轴进行对数处理一下。方法有很多,在这里我们用ggplot2里的指令scale_x_log10()对坐标轴进行处理。

# Change this plot to put the x-axis on a log scale
ggplot(gapminder_1952, aes(x = pop, y = lifeExp)) +
  geom_point() +
  scale_x_log10()

同理,不只是x轴,y轴也可以通过这样的方式进行log转换。

# Scatter plot comparing pop and gdpPercap, with both axes on a log scale
 ggplot(gapminder_1952, aes(x = pop, y = gdpPercap)) +
  geom_point() +
  scale_x_log10() +
  scale_y_log10()

图形美化

x轴是pop,y轴是lifeExp,根据continent给数据上色,然后x轴进行log转变。

# Scatter plot comparing pop and lifeExp, with color representing continent
 ggplot(gapminder_1952, aes(x = pop, y = lifeExp,color = continent)) +
  geom_point() +
  scale_x_log10()

不仅可以添加颜色属性,还可以添加大小属性,比方说在上图的基础上根据gdpPercap设置点的大小。
# Add the size aesthetic to represent a country's gdpPercap
ggplot(gapminder_1952, aes(x = pop, y = lifeExp, color = continent,size=gdpPercap)) +
  geom_point() +
  scale_x_log10()

-总结一下,图形美化里用到的四个参数

Aesthetics Variable
x pop
y lifeExp
color continent
size gdpPercap

图形分割

利用facet_wrap根据continent对图形进行分割。

# Scatter plot comparing pop and lifeExp, faceted by continent
ggplot(gapminder_1952, aes(x = pop, y = lifeExp))+
geom_point()+
scale_x_log10()+
facet_wrap(~ continent)

x是gdpPercap,y是lifeExp,color是continent, size是pop,最后根据year分割图形。

# Scatter plot comparing gdpPercap and lifeExp, with color representing continent
# and size representing population, faceted by year
ggplot(gapminder, aes(x = gdpPercap, y = lifeExp, color = continent,size=pop)) +
  geom_point() +
  scale_x_log10()+
  facet_wrap(~year)

相关文章

网友评论

    本文标题:DataCamp课程 Chapter.2

    本文链接:https://www.haomeiwen.com/subject/phboultx.html