书籍简介
书 名:大数据预测
作 者:[美] 埃里克•西格尔
原版名称:Predictive Analytics
译 者:周昕
ISBN:9787508644608
页 数:300
定 价:58.00
出版社:中信出版社
出版时间:2014-3
2020年的一天,在你驱车前往公司的路上,导航系统通过预测交通流量,会自动帮你选择一条最合适的交通路线;车内推荐系统会根据你的饮食习惯预测你可能会喜欢吃什么,并推荐沿途的早餐店;你的电子社交助理已经为你自动选择了你可能感兴趣的社交网信息;当车内系统预测到你驾车有些分心时,座椅会自动震动进行提醒……
以上这些情景不是科幻大片独有的,它们有的已经或会在未来的某一天成为现实。而这一切所倚靠的就是预测分析技术。
大数据时代下,作为其核心,预测分析已在商业和社会中得到广泛应用。随着越来越多的数据被记录和整理,未来预测分析必定会成为所有领域的关键技术。
作为预测分析领域的专家,埃里克·西格尔博士深谙预测分析界已经实现和正在发生的事情、面临的问题和将来可能的前景。在《大数据预测》一书中,他结合预测分析的应用实例,对其进行了深入、细致且全面的解读。
关于预测分析,你想了解的全部,你的生活以及这个世界会因为预测分析改变到什么程度,《大数据预测》都会告诉你。
书摘
1. 黑匣交易——由系统自动做出金融交易决定,这也是目前数据驱动决策中最振奋人心的部分。人们只需要将现有金融环境参数输入“黑匣子”,系统就会自动做出买/卖/持有的决策。其系统特征首先是“黑”(即不透明),交易员根本无须知道系统内部的测算过程,只要系统做出有效的结论即可。如果系统做出的结论有效,那么这几乎可秒杀世上其他一切商业计划:电脑变成了自动挣钱的机器,消耗一点儿电力就可换来源源不断的投资收益。
2. 预测悖论:我们对自己的预测能力多一份谦逊,我们在规划未来上就多一份成功的把握。
——纳特·西尔弗(Nate Silver)《信号与噪声:大数据时代预测的科学和技术》。
3. 当我们开始慢慢承认预测力量的重要性时,我们也要面对这种力量所带来的隐私争议。由此造成的连锁反应甚至令专家都感到震惊:企业有了新的能力、消费者对此感到不安、媒体在旁边火上浇油,科学家们则变得小心翼翼,并开始重新审视赋予企业这些能力是否妥当。
4. 有关个人的数据不等同于个人——数据比人更便于管理。数据不占用物理空间,其维系成本几乎为零;数据存在永续性,而且也便于复制和传输。数据比黄金更宝贵,尽管数据没有任何分量,没有任何物理属性。
5. 数据的价值、力量和意义也让数据变得很敏感。数据越多,力量越大;力量越大,也就越敏感。因此,我们现在碰到的这种冲突几乎是不可避免的。如果没有人关心数据,那么自然也不会有人去保护数据,不会有人想要获得数据或从一开始就去搜集和保存数据。约翰·埃尔德后来回忆说:“正因为数据具有独特的力量,人们才会认为它是危险的;如果数据是无关痛痒的,它就不会成为威胁。”
6. 数据是信息时代的新货币,天生不受监管。要想分享消费者的数据,只需要轻轻点击一下,完全不需要运送任何货品。
7. 对任何机构或企业来说,它们都必须确定数据的使用者、内容、位置、使用时间、保存期限以及使用原因等:
保存——确定数据的内容和存储时间。
许可——确定可查看或调取数据的员工、社会各界人士和其他组织成员。
分享——确定可接收数据的内部部门或外部机构。
合并——确定可汇总或连接的数据部分。
回应——根据数据所采取的行动,确定组织的回应、行动以及其他行为。
8. 全球化企业是很复杂的。这不是由销售人员组成的团队,甚至不是一支正规的为销售人员提供支持的人力资源团队。相反,这是一个全球性的团队,其成员主要分部在墨西哥、中国和波兰,该团队的主要工作是帮助其他为销售人员提供支持的人力资源团队。因此,该项目是多层次的,是对协助人力资源进行管理(主要支持销售队伍)的团队所实行的分析性人力资源管理。
9. 信息技术改变了我们生活的方方面面……尽管我们现在有新的伦理问题,我们却没有形成新的伦理。——麦克·罗蒂(Michael Lotti)
10. 感有时并不在预测分析所考虑的范畴内。因为情感是变幻不定的因素,无法像事实或数据那样被轻易记录在表格中。情感转瞬即逝,而且是主观的。诚然,情感是人的一种重要的状态,但情感的微妙使得大部分科学都无法对其展开研究。
11. 所有人在面对不确定性时,往往都会在经济上后退、撤销、跑开,而我们所推崇的是一直走下去。——美联储前主席艾伦·格林斯潘
12. 大数据不是真实的存在。数据最激动人心的不是其数量,而是其增长速度。我们会永远敬畏数据的庞大数量,因为有一点永远不会变,那就是:今天的数据必然比昨天多。规模是相对的,而不是绝对的。如果我们今天使用“大”,那么很快,我们的形容词就会不够用了:“大数据”“更大数据”“再大数据”以及“最大数据”。其实,早在1975年,一个名为“国际超大型数据库大会”的组织就已成立。在海量数据面前,我们的词汇量显得如此匮乏。
13. 数据自己会说话。数据中总有故事,而系统总能从数据中学到一些东西。数据科学家通过预测分析系统不断地从数据堆中找到规律。如果将数据整合在一起,尽管你不知道自己将从这些数据里发现什么,你至少能通过观测解读数据语言来发现某些内在联系。数据效应就是这么简单。
14. 大部分有关决策的讨论都是在这样的前提下进行的,即只有高管负责做决策或只有高管的决策才有效,这是极其危险的错误。——彼得·德鲁克
15. 现代生活与传统生活的本质区别在于对风险的把握:现代人认为未来不再是诸神的安排,人类在自然面前也不再只是屈从。在试图穿越这一界限的过程中,有些人认为未来不过是历史的镜像,而另一些人则认为未来只能由神谕和先知掌控。——彼得·伯恩斯坦
16. 世界上有三种谎言:谎言、该死的谎言和统计数据。——英国首相本杰明·狄斯雷利
17. 归纳是艺术。我们可以按自己的想法来理解世界是如何运行的:数据记录了过去发生的事实。对具体事实,我们可以概括总结,从中得到重要结论并认定同样的规律还会在未来发挥作用。
18. 在每块大理石里,我似乎都清楚地看到里面的雕像,它仿佛就坐在我面前,栩栩如生。我只需去掉大理石中多余的部分,雕像就能显现出来,让普通人也看到我所看到的东西。——米开朗基罗
19. 归纳效应:艺术推动机器学习;电脑程序和人类随机创造的策略最终能帮助我们创建预测模型,这些模型能预测未来的事情。
20. 众包是运用大众智慧的完美方法,年龄、性别、种族、教育和职业统统不重要,工作质量成为唯一的考量指标。 ——杰夫·豪《众包:群体力量驱动商业未来》
21. 我所工作的团队通常会把商业竞争视为一场竞赛,我们从分享中获益,斗争使得我们的所得都以一定的代价为前提,众包的开放性正符合这一哲学理念。——斯坦·克雷琴格
22. 对大部分事物来说,平均值都差强人意;但在决策中,平均值往往是最好的。——詹姆斯·索罗维基《群众的智慧》
23. 群体智慧的概念推动了组合,因为这彰显了系统组合的一个关键原则:如果采用许多人的预测均值,那么就可改善预测。——阿博特分析公司总裁狄安·阿博特
24. 预测模型正不断改善以实现其潜能,但有时预测结果却会误差很大。通常,企业需要决定在预测结果产生之后应采取什么行动。因为仅仅预测个人将要做什么是不够的,还必须知道如何去应对。为此,我们要预测的内容应超越“即将发生之事”,我们也要预测完全不同之事。
25. 预测分析的触角早已伸向社会的各个角落,无论是企业还是政府机构、无论是执法部门还是慈善组织以及医院和高校,这些社会组织都要做出数以百万计的运营决策来实施服务,而预测技术则能引领这些决策。预测技术是用来改善大规模运营效率的有效手段。
26. 预测技术的具体细节和时点会有赖于现实的条件,但预测分析技术本身不再是问题。因此,我们大可自信预测,预测将大行其道。几乎每隔几个月,媒体就会出现关于预测技术大显神威的消息。这样的机遇还将不断涌现,有时甚至会让人目不暇接。不管如何,我们将越来越有效地预见未来,未来正等待着我们大显身手。
读者群简介
欢迎乐读创业社新书友,本群为创业者而设立,也有不少作者译者和出版社的老大。大家可以看下http://ledu.club里面推荐的创业相关书。
如果看书多,可以挑战下自己,参加一周一本活动,请看一周一本书群规则http://ledu.club/?page_id=43 ,除了文学书,其他都可以自由选择,也可以看看大家的成绩单:https://www.gdgdocs.org/spreadsheets/d/tFo1ze58REfxjefplKX157w/htmlview
觉得难度稍大,也可以参加两周一本书活动,群规则http://ledu.club/?page_id=355
想加入的小伙伴请扫描下面的公众微信号:
网友评论