美文网首页
数据处理

数据处理

作者: bernierayxu | 来源:发表于2019-10-07 12:34 被阅读0次
1. 创业公司的数据处理工具一般是什么?

答:Excel

2. 如果开发给出来的某一列包含 产品-类别-id,此时导入到excel之后应该怎么处理才能只获得id?

答:Data下面有一个Text To Columns

3. 如何快速寻找脏数据?

答:检查每一列的预期,选中某一列,看看右下角的统计数据是否正确。


统计
4. 如果数据在分列的时候本身的格式有问题,该如何解决?

答:一般来说先找出有问题的格式长什么样,统计出来,然后再手动通过搜索替代的方式将其格式标准化之后,符合自己的格式,再进行分列。

5. 如何检查某一列的脏数据?

答:通过Filter来去重这一列的数据,查看每个去重后的数据是否正确。

6. Excel中文排序是否正确?

答:一般来说会按照首字的拼音排序,但是如果出现多音字的情况,会排序错误。

7. 如何删除重复项?

答:选择某列之后,在Data里面选择Remove Duplicates。

8. 如何求留存?

答:使用Vlookup函数,可以用函数生成器。第一个为搜索的值,第二个是某列(或者行),第三个为该矩阵的第几列(如果是某列,则填1),range lookup代表是否模糊搜索,填写false即可


vlookup
9. 如何针对某些特征进行group之后了查看总值?

答:使用recommended pivot table(数据透视表),在insert下面


pivot table
10. 数据如何可视化处理?

答:选择对应的数据(例如有时间轴的这种),在insert里面选择对应的图形即可。折线图(Line)适合有时间轴连续的数字这种情况,如果行轴并不是时间,而是类别之类的,这个适合适合柱状图。如果类别多,且子类别多,这个适合百分比柱状图。如果我们关心百分比,可以使用饼图。如果要看连续时间的百分比,则可以看堆叠折线图。

11. 除了excel之外,还有什么可以使用的网站?

答:raw graphs可以生成circle packing的图,有点类似于饼状图,不过视觉效果更好。还可以生成beeswarm plot的图,适用于连续时间观察公司发展的变化,类似于堆叠折线图。

circle packing beeswarm plot
12. 如何实现位置可视化?

答:使用高德地图提供的工具,可以做点类型的图,也可以做热力图。


高德地图
13. 如何实现数据自动展示给团队?

答:使用google analytics的邮件周报的功能,设置每周发送邮件给团队小伙伴提醒看数据。这种适合需要长期关注的指标【例如一级指标】。

邮件周报
14. 指示预警怎么设置?

答:当某个指标出现异常的时候,需要发送电子邮件。这种适合平时不太需要关注或者波动很小,但是一旦波动,对于整个业务会产生影响的指标【例如二级指标,响应时间】。

15. 数据注释怎么设计?

答:有些时候某些图标在某些天会有波动【例如做了活动】,但是其他看图标的小伙伴并不知道这个信息,所以可以设计一个数据注释【类似于备注】,让看到这个图标的人知道这一天有备注,并且这一天的其他图标也能看到这个备注。

16. 如何设计自定义指标?

答:参看漏斗模型。这样方便用户选取自己需要的指标。

17. Google/baidu访客属性如何利用?

答:这些数据是谷歌的大数据来对比你的网站给出的建议。

相关文章

  • js实现数组对象去重并统计重复个数

    数据处理前 数据处理后

  • 大数据学习导图

    数据获取 数据获取与查看 数据处理 数据处理I:缺失值填补 数据处理II:数据转换 数据处理III:无量纲化 特征...

  • 第一章 spark-streaming的概述

    section 1 spark-streaming是什么 //数据处理的方式角度 流式数据处理 批量数据处理 //...

  • 大数据学习路线

    一、大数据处理流程 上图是一个简化的大数据处理流程图,大数据处理的主要流程包括数据收集、数据存储、数据处理、数据应...

  • swift JSON转model 使用Codable

    简单数据处理 定义模型名称 json数据定义 数据解析 复杂数据处理 定义json 定义模型 解析数据处理 列表数...

  • Spark Streaming 1.基本操作

    1. 数据分析分类: 流式数据处理:多条数据缓冲一起处理批量数据处理:一条数据一处理 实时数据处理:数据处理延迟时...

  • Python| Pandas

    01 强大的数据处理能力 Python有强大的数据处理能力。我们都使用过Excel,它的数据处理能力已经非常强大,...

  • 实战篇--有关做大数据项目的开发流程

    前言 有关做大数据项目的开发流程数据处理--->后端调用--->前端展示 一、数据处理 数据处理主要负责:看数据是...

  • 无标题文章

    DataEngine数据处理流程 DataEngine数据处理流程包含如下步骤: changevalidatepu...

  • Kaggle_01_Titanic

    1. 数据处理 简单分为三种:缺失数据处理、新特征生成和数据归一化 1.1 缺失数据处理: (1) 直接丢掉 - ...

网友评论

      本文标题:数据处理

      本文链接:https://www.haomeiwen.com/subject/nnlmyctx.html