美文网首页
python绝技 (黄文青)

python绝技 (黄文青)

作者: 阳光照我心房 | 来源:发表于2019-10-13 17:48 被阅读0次

    1.1数据分析概述

    数据工程能力  、数据分析能力、业务能力。

    初级分析师:被动实现。

    高级分析师:主动理解战略目标、产品方向和营销意图,围绕产品发展各个阶段,综合当前业界已有方法和思路,建立一套完善的数据支持体系。善于从数据的角度思考问题,保持数据敏感度。

    软实力:业务理解,一切技术都是为了业务服务。


    硬实力:数据分析能力、数据工程能力

    数据分析能力:根据数据给出分析建模的策略,解决业务中遇到的问题能力。制定建模策略知识储备:统计分析、数据挖掘、深度学习。

    数据工程能力:灵活运用数据处理组件及相关技术,实现数据分析中拟定策略的能力。具备知识:消息队列、数据库技术、数据仓库、分布式文件系统和分布式计算平台。

    数据处理:数据搜集、数据传输、数据存储、数据计算。


    1.2数据处理流程明确目标、确定方案、数据整理、建模分析、结果验证、总结展现。

    1.明确目标           明确且细化分析目标

     分析类型:验证型、描述型、预测型。

    2.确定方案

    能否获取数据?选择可行的分析建模以及实施方法?制定结果的校验准则?

    建模方法分类:基础分析、数据挖掘、深度学习。

    基础分析:主要解答事物的统计特征,以及概率问题。

    数据挖掘:分类、聚类、关联的相关问题。

    深度学习:研究分类和识别问题,自动提取数据的特征,对非线性数据集具有良好效果。主要应用在语音和图像识别。

    制定结果的校验准则。

    3.数据整理

    难处:1.数据源多种多样、格式复杂。2、数据分析必然与业务紧密相关,要做好数据工作,必须以理解业务为前提。

    条理清晰

    ETL  :从数据源抽取数据,经过转换等格式化操作,最后加载到数据仓库。

    4.实施建模

    5.结果验证

    结果验证方法:1.多维对比2.冗余验证法

    6.结果展现

    柱形图、折线图、饼图、散点图、漏斗图、雷达图(多维对比)

    1.3数据分析工具

    界面类:Excel、SPSS、Stata、SAS、EViews、MATLAB、

    编程类:

    Python、R、Java。

    1.4大数据思辨

    小数据:如何使用更有效的理论和框架。局部。

    大数据:如何存储、如何计算。整体。

    相关文章

      网友评论

          本文标题:python绝技 (黄文青)

          本文链接:https://www.haomeiwen.com/subject/vurhmctx.html