可视化工具:R包,ggplot,ggplot2,
两种可视化变量:类别型、定量型。饼图、柱状图。条形图、散点图、箱线图
样本统计值:中位数、均值、方差、标准差
分位数:一分位数,三分位数、IQR,interquantile range,Q3-Q1
数据可视化原则
- 通过图形反映数据信息,饼图以面积和角度反映比例,条形图用来观察数据的差异
- 知道什么时候表示坐标轴的0点
- 不要操作数据(Do not distort quantities)
- 类别型数据按某种方式进行排序
- 可能的话展示数据全貌
- 使用正确的坐标轴,如男女身高主要在横轴的比较
- 考虑对数据的数学转换,对数化处理
- 应用颜色
- 编码第三个变量,即颜色、点的大小或其他
- 避免使用假的三维图
- 避免使用过多有效位数字
总之,对待分析的数据有基本的认识,并使用正确的图表展示数据。
网友评论