未来几年里数据的发展趋势:应用无线化、信息数据化、交易无纸化、人类智能化、决策实时化、线上线下化;大数据是被需求驱动的,而需求来自于现有已知或未知问题的解决;不同行业对数据的应用各有侧重和不同,只有抓住重点,仍然能从中挖掘商机;一定要把运营数据—数据化运营—运营数据的循环打通形成闭环;
大数据处理理念:要全体不要抽样,要效率不要绝对精确,要相关不要因果;大数据核心是预测;大数据不是要教机器人像人一样思考,而是把数学算法运用到海量的数据上来预测事情发生的可能性;
系统可以通过一种“反馈学习”机制,利用自己产生的数据判断自身算法和参数选择的有效性并实时进行调整,持续改进自身的表现;比如亚马逊可以帮助我们推荐想要的书,谷歌可以为关联网站排序,Facebook知道我们的喜好,而Linkedln可以猜出我们认识谁;
以往用数据要“混、通、晒”养数据要“存、管、用”就是用技术而不是人工方法做资产或材料管理;怎么样评估是不是做好呢?得看看数据有没有、细不细、全不全、稳不稳、快不快;所以一旦把数据管理好了,就会很快灵活做出数据;数据分为公有数据与专有数据;
传统的数据科学家常常是博士或博士后,研究的方向是机器学习;几年前的企业数据都是看多用少,不够直接也很少涉及机器学习、算法等领域;数据科学是科学不是工程,工程追求效率,科学追求真理.
如果数据科学家做得太实操就会变成一个数据挖掘工程师,因为今天的技术跟以前技术不一样了,技术更新迭代升级很快;
以前我们是有问题找数据,而在大数据时代,其最核心的特质则是用数据找机会;数据量不是最重要的问题而是有“质”的量才是关键;现在大多数情况下用数据的人不知道大数据从哪里来,做数据的人不知道大数据如何使用;
想用数据的人不敢用,因为担心大数据的真实性;做数据的人不知道怎么用,因为大数据的复杂性;目前市面上大数据量是很大但是有用的信息不一定多,甚至还会破坏核心信息;如果数据没有加以加工处理整合集合形成有价值信息输出报告也就没有多大的用处;大数据意义在于链接与大与质量;
断层才是大数据所面临的最严重的问题,收集数据的人并不清楚未来使用数据的人要做什么,这是目前大数据运用的一大关键命门;有人询问如何衡量大数据价值?最直接衡量标准就是在经营上它为你赚了多少钱,带来了多少实际的利润提升;
现在很多人欣向使用的方法是计算“在用了大数据之后点击率提高了多少,转化率提高了多少”但是转换率和点击率提高的数据不是投资人与公司管理者对大数据的期望,对业务员来说就有效;搞数据建模的人也不知道这些数据有什么用;
收集数据的人不知道将来的人怎么使用数据,创建模型的人不知道自己所采用的数据在未来是否稳定,使用模型的人不知道整个数据的来路或加工过程;因为每一个层级和功能部门都是一个断层,而且对数据的价值内在衡量都不一样;
西方式的思考侧重于系统分析,大都用数据进行细分/归类、对比、溯源;一般流程是:假设什么目的、怎么样定义问题、怎么样量化各种指标、怎么样评估这些指标的达标率;所以在大数据的商业环境里,要既懂数据又懂商业,还要拥有一套好的思维方法,而数据化思考正是这样新的事物;我一直觉得答案不重要,重要的是思考的角度;
从企业价值来看,数据收集实现的是企业资源的合理分配;从客户价值来看,数据收集实现的是顾客体验的提升;场景与还原并行—前端还原消费场景,后段还原业务需求;数据的本质就是还原,这是收集元数据的关键方法;
现在很多企业有数据或收集数据都是死数据而不是活数据,死数据就是单纯储存数据库中,无法辨别分析和使用 并且不能够产生价值数据;把数据激活,从静态数据变成动态数据,必须要用场景来验证,静态数据是没有用的;
只有具备了商业敏感度的数据分析师才会懂得用数据来驱动公司实现经营目标,而绝不会单凭交易量就决定商品策略;
数据仪表盘可以分为前端行为数据和后端商业数据;前者指的是访问量、游览量、点击率及站内搜索等反应用户行为的数据,而后者更侧重于商业数据,比如交易量、投资回报率、客户终身价值;
数据存储分为基础层、中间层和应用层;我觉得基础层必须统一,因为这是最基本的数据,而且基本数据是原始数据;除了备份的需求外没有必要在各个场合保留多份数据;
只要保障这个数据良好的元数据管理方式就能极大的降低成本;企业业务单一适合数据集中化管理,业务多元化适合分散管理;
如果收集数据出发点不是为了解决问题,那么收集再多的数据也没有什么意义;数据本身有生命周期的;在大数据的背景下,必须考虑数据之间的关联性;一个单独的数据是没有意义的,要把数据放在一个数据框架中去,才能看出存在的问题;知识图谱不是数据而是数据和数据之间的关系;知识图谱知别人不知;
人和机器的结合或者人和数据的结合是未来的一种进步趋势;信息化和数据化区别在于,信息化为我们提供了参考,而数据化让我们可以直接行动;未来产品经理需要懂得如何用数据来增值,这其中三个关键点在于产品化、数据化、商业眼光;而眼下很多产品经理更多关注产品化而忽略了数据化;
信息技术的革命不在于分析数据的机器而是在于数据本身和我们如何运用数据;大数据告诉我们是什么而不是为什么,在大数据时代,我们不必要知道现象背后的原因,我们只要让数据本身发出声音;
数据分析者太沉浸于模拟数据时代的设想,模拟时代数据收集和分析耗时耗力,新问题出现要求我们重新收集和分析数据;大数据采集与处理及分析不是随机样本而是全体数据;采样分析的精确性随着采样随机性的增加而大幅度提高,但与样本数量的增加关系不大;
千万不要奢望采样的数据还能回答你突然意识到的问题;执迷于精确性是信息缺乏时代和模拟时代的产物;只有5%的数据是结构化且能适应于传统数据库的;对小数据而言要的就是减少错误和保障质量;
大数据的简单算法比小数据的复杂算法更有效;谷歌的翻译之所以好并不是拥有了一个更好的算法机制而是采取了全球互联网的机制获取各种各样的数据;也就是用网页排名来获得更多的数据;
如果用根据过去数据来预测未来数据,那未来的数据就不是信息了!当今这个时代竞争无处不在,其核心是综合实力的比拼;
专业分析需要得到更多信息,而重要的信息需要进入特定圈子或高危现场才能取得;在中国做分析需要自学、靠自己观察、积累,归纳总结市场环境下的经济信息分析规律;如果一个人对生活没有热情,没有很多爱好,就无法拥有分析工作中需要的好奇心和敏锐的观察能力;
分析工作需要保持对信息持久的新鲜感,这种新鲜感来自分析者内在的热情,而热情产生于生活和工作态度;
数据营销比的不是数据规模大小,不是统计技术,也不是强大的计算能力,而是对核心数据的解读能力;如果数据永远躺在会议桌上的一堆报表,那你永远无法从这些数据中学到任何事情;营收=有效客户*顾客活跃度*客单价;
找出10个关键指标:新增率、变动率、流失率、转化率、活跃度、激活率、留存率、注册率、营业额增长幅度、顾客购买情况、竞争者促销手法、增加销售量方法(降价促销、增加广告、举办活动刺激销量);大数据比的是点子而不是银子,赢家需要数据洞察力;
什么样的人才才能在下一个时代存和发展?答案无非就是掌握数据和运用大数据的人;在下一个时代里:自动化、定量化和个性化会成为主要的时代特征取向;
网友评论