美文网首页
连续型和离散型数据对应的颜色不同

连续型和离散型数据对应的颜色不同

作者: 小洁忘了怎么分身 | 来源:发表于2019-07-16 14:43 被阅读0次

花花写于2019.7.16 最近刚搬进人才公寓,各种采购和玩耍,非常开心,工作也开始步入正轨,慢慢安定下来,不知不觉断更了一周,赶紧的补起来。。。

知识点

ggplot2的默认配色分两类,一类是连续型变量对应的渐变色,一类是离散型变量对应的独立的几种颜色。

数据

(生信星球公众号后台回复color即可拿到示例数据)
用于分类的列是class

head(test)
# V1 patients class
# 1 1061        A     1
# 2 1548        A     2
# 3 2283        A     3
# 4 4756        A     4
# 5 1473        B     1
# 6 1760        B     2
table(test$class)

# 1  2  3  4 
#10 10 10 10 

做条形图

if(!require(ggplot2))install.packages("ggplot2")
library(ggplot2)
ggplot(data=test)+
  geom_bar(aes(x=patients,y=V1,fill=class),stat = "identity")

直接做出来的图是这样的:

真的好丑
颜色从深蓝到浅蓝渐变,是连续型变量对应的颜色。验证一下:
str(test)
#'data.frame':  40 obs. of  3 variables:
# $ V1      : int  1061 1548 2283 4756 1473 1760 593 4062 722 435 ...
# $ patients: chr  "A" "A" "A" "A" ...
# $ class   : int  1 2 3 4 1 2 3 4 1 2 ...

不出所料,class这一列的数据类型是整型

实际上我们想要的是独立的几种颜色,那么对数据类型进行转换是最直接的办法。

test$class=as.character(test$class)

再次运行作图代码:

ggplot(data=test)+
  geom_bar(aes(x=patients,y=V1,fill=class),stat = "identity")
其实还是丑,但事儿就是这么个事儿

手动改颜色

注意这里是fill,不是color,color是边框。
颜色还可以手动修改,rgb颜色无数种任你选择,比如这样:

ggplot(data=test)+
  geom_bar(aes(x=patients,y=V1,fill=class),stat = "identity")+
  scale_fill_manual(values = c("#EEE685","#FFC1C1", "#D8BFD8", "#D1EEEE"))+
  theme_bw()

相关文章

  • 连续型和离散型数据对应的颜色不同

    花花写于2019.7.16 最近刚搬进人才公寓,各种采购和玩耍,非常开心,工作也开始步入正轨,慢慢安定下来,不知不...

  • 推断统计(2) - 抽样理论

    推断性统计学是用样本(历史数据)的估计量(离散型或连续型)推断总体(将来)的对应的参数值(离散型或连续型)。推断性...

  • 广告CTR算法简介

    一、CTR预估的数据特点 1.输入中包含类别型和连续型数据。类别型数据需要one-hot,连续型数据可以先离散化再...

  • 商务与经济统计第五章笔记

    离散型概率分布 1、随机变量 随机变量分为离散型和连续型。 2、离散型概率分布 1)离散型随机变量的数学期望 2)...

  • 一二三四,保持队型

    数据,分为两种类型,一种是离散型数据,一种是连续型数据。 离散型数据:指某些既定的值。比如投掷一个骰子,有1、2、...

  • 连续型数据处理

    上一节,我们总结了离散型数据的处理方法,这一节我们整理下连续型数据的处理方法。一般来讲,离散型数据都是类别值,如:...

  • 4. 频数表,直方图,概率分布曲线-1

    1. 离散变量和连续型变量的区别 什么是离散型变量,什么又是连续型变量呢? 我觉得下面这段话讲的挺好的1 : A ...

  • 【机器学习实战】回归决策树

    根据处理数据类型的不同,决策树分为两类:分类决策树与回归决策树。前者可用于处理离散型数据,后者可用于处理连续型数据...

  • 一起来学统计学——连续型随机变量的概率

    上一篇总结了离散型随机变量的概率——概率函数和分布列。 如何理解连续型随机变量的概率 连续型随机变量与离散型随机变...

  • 标准化和离散化总结

    离散化总结 等距离散化是根据连续型变量的取值,等频离散化根据连续型变量的总个数。

网友评论

      本文标题:连续型和离散型数据对应的颜色不同

      本文链接:https://www.haomeiwen.com/subject/gqrzkctx.html