美文网首页数据蛙数据分析每周作业
《数据分析实战》基础篇------读书笔记

《数据分析实战》基础篇------读书笔记

作者: 晓迦 | 来源:发表于2019-02-24 19:08 被阅读4次

1. 什么是数据分析?

1.1 什么样的数据分析有意义?

企业数据量比较大的、复杂度比较高的、颗粒度比较细的数据,就有较高的分析和利用价值。
数据颗粒度是指从不同的层次来看待数据。

1.2 数据分析的价值

  • 了解数据的整体状况。整体状况包括总体情况、结构情况、异常情况等。
  • 快速查询数据。当想要了解某个数据情况时,可以快速的得到想要的数据。
  • 数据关系之间的探索。探索不同数据之间的相关关系与因果关系。
  • 业务预测。
    (一般数据分析包含三方面的作用,描述现状、洞察与预测)

1.3 数据分析的几大抓手

  • 足够多的数据
  • 数据质量
  • 合适的工具
  • 分析结果的呈现

1.4 数据分析流程

1.数据采集
2.数据整理
3.制表
4.数据分析
5.数据展示

怎样成为数据分析高手

  • 工具
  • 业务

2.数据分析的理论、工具与模型

峰度与偏度:峰度反应的是数据中极值的情况;偏度是衡量数据对称性的一个重要指标。数据左篇,偏度>0;
相关分析与关联分析:相关分析反应的是在发生变动时,变量互相之间的“互动”关系;关联分析常用在购物篮分析中,指用户在购买一件商品之后,会不会购买下一个物品。

3.制表

Microsoft Query 在这本书里,感觉就是把不同的数据拼接起来,然后筛选过滤,不想深究。
SQL

找到数据中的“特殊分子”

异常值:
什么是业务中的异常值?“偏离了原来数据的变化轨迹,就可以视为异常值
判断标准:

  • 特别大(小) 超过平均值的50%以上或者小于平均值的50%以下。
  • 脱离箱体
  • 趋势变化, 如果一个值一直是上升的,现在突然下降了。
  • 变化率的下降
    用绘图的方式(散点图)来检验异常值。
    3倍标准差。

相关分析与决策树

person相关,就是分析数据的变动量之间的关系。相关系数 = A数据的变化率/B数据的变化率

聚类 决策树 回归 逻辑回归
回归就是回顾,就是从过去的数据中寻找规律,然后运用这个规律来推测数据将来的变化。

相关文章

  • python的pandas函数学习

    下面是对教程的一个整理: Python数据分析之Pandas——基础篇 1. Python数据分析实战 | 初识...

  • 数据分析实战45讲

    数据分析实战45讲 第一模块:数据分析基础篇 (16讲) 01丨数据分析全景图及修炼指南 02丨学习数据挖掘的最佳...

  • 《数据分析实战》基础篇------读书笔记

    1. 什么是数据分析? 1.1 什么样的数据分析有意义? 企业数据量比较大的、复杂度比较高的、颗粒度比较细的数据,...

  • Python 视频资料

    Python教程600集 小甲鱼零基础入门学习Python 数据分析与数据爬虫实战

  • Python数据分析 清洗常用4板斧

    这是Python数据分析实战基础的第三篇内容,主要对前两篇进行补充,把实际数据清洗场景下常用但零散的方法,按增、删...

  • python实战总结 - 草稿

    1数据分析项目实战-用户消费行为分析数据分析实战,混泥土机器故障预测2数据分析项目实战-数据分析师的招聘薪资3电脑...

  • python实战总结

    1数据分析项目实战-用户消费行为分析数据分析实战,混泥土机器故障预测2数据分析项目实战-数据分析师的招聘薪资3电脑...

  • 【python】AQI处理分析

    1.Python:数据分析实战之AQI分析(完整版) Python:数据分析实战之AQI分析(完整版)

  • 《基于Python的大数据分析基础及实战》(余本国)PDF电子书

    内容简介 《基于Python的大数据分析基础及实战》是一本介绍如何用Python 3.6进行数据处理和分析的学习指...

  • 生存分析(2)

    之前写过生存分析的数学相关基础知识,这次直接使用R语言进行生存分析的实战演练。 1. 生存分析 导入示例需要的数据...

网友评论

    本文标题:《数据分析实战》基础篇------读书笔记

    本文链接:https://www.haomeiwen.com/subject/diwohqtx.html