《智能时代》——吴军
1、 好的模型和数据相吻合。
2、 有了模型之后,第二步要找到模型的参数,以便让模型至少和以前观察到的数据相吻合。——今天它有一个时
髦的词叫机器学习。
3、 将人的大脑当做信息源,从思考到找到合适的语句说出来是一个编码的过程,最后听话人把它听懂,是一个解
码的过程。(通信问题,用两个数学模型(马尔科夫模型)分别描述信源和信道)
4、 李开复:基于统计的犯法开展他的博士论文工作,最终和洪小文一起构建世界上第一个大词汇量、非特定人、
连续语音识别系统。(数据驱动)
5、 两派:一是模仿人;二是倡导数据驱动
6、 大数据 big data:1、体量大、维度大、全面性和完备性
7、 解决问题的思路:
1) 根据网页确定哪些用户在Google问过的复杂问题可以回答,哪些回答不了
2) 把问题和网页中的每一句话一一匹配,挑出那些可能是答案的片段,至于怎么挑,要靠机器学习了。
3) 利用自然语言处理技术,把答案的片段合成一个完整的段落。
8、 工业革命是机械思维的结果。
9、 用不确定性这种眼光看待世界,再用信息消除不确定性,不仅能够赚钱,而且能够把很多智能型问题转化成信
息处理问题。
10、 大数据的科学基础是信息论,它的本质就是利用信息消除不确定性。
11、 加入Google的决定并不难做,因为全世界的数据都在Google那里。
12、 微软的搜索引擎在很长的时间里做不过Google的主要原因并不在于算法本身,而是因为缺乏数据。
13、 从大量数据中挖掘相关性,直接用于产品,因此它们给外界的感觉是产品更新非常快。
14、 大数据与商业:
1) 种植大麻的房子用电模式和一般居家是不同的
2) 偷税漏税
3) 对怀孕顾客行为的分析——利用大数据精准地做生意
4) 该做酒吧的酒驾,装上可以测量重量的传感器,以及无源的射频识别芯片RFID的读写器,然后再在每个酒瓶上
贴上一个RFID芯片。这样,哪一瓶酒在什么时候被动过,倾倒了多少酒都会被记录下来,并且和每一笔交易匹配上。
5) Prada的试衣间,有一个屏幕,能够让顾客从各个方位“看到”自己试穿上一件衣服或戴上围巾、皮具的效果。
6) GE将WiFi装到它的冰箱和其他大型家电商,用来提醒用户更换冰箱取水器的滤芯等消耗性材料
15、 Google的优势在于它有足够的数据和计算能力用“笨办法”把每一种搜索事先试一遍,而这一点大部分公司做
不到。——穷举法
16、 现有产业+大数据=新产业
现有产业+机器智能=新产业
17、 为什么大数据的拐点会发生在今天?
18、 大数据来源是:电脑本身、传感器、将那些过去已经存在的、以非数字化形式存储的信息数字化
19、 Google花32亿收购nest公司?是为了获得数据。
20、 真正高明的公司都会像微软、苹果和Google那样采用曲线救国的方法。有些时候,为了收集数据,这个弯需要
绕的特别大。
21、 为了收集数据,先推出一个类似玩具的语音识别系统Google-411.
22、 数据存储和数据安全 protocol buffer.
23、 Google 为了解决问题,设计了dremel的工具,专门针对日志、数据库等大数据,解决实时访问和简单的数据处
理的问题。
24、 Google的突破在于找到一种方法,可以将一个很大的模型上百万参数同时训练的问题,简化为能够分布到上万
台(甚至更多)服务器上的小问题,这样使得大型人工神经网络训练成为可能。
25、 算法需要稳定
26、 有经验的IT系统主管和架构设计师都知道要尽量将敏感信息放到不同的地方,以免多种敏感数据同时丢失。
27、 MIT 利用大数据分析来防范黑客攻击,要比传统的在防火墙设置各种规则的做法有效5倍。
28、 Nest这样的智能家居可以知道家里每个人的活动,甚至知道什么人来访。
29、 利用用户的隐私赚钱
30、 怎样保护隐私呢?1)双向监视
31、 以色列的农业 滴灌技术
32、 2012年 Google科学比赛中第一名授予了一个高中生,对760万个乳腺癌患者的样本数据的机器学习,设计了一
种确定乳腺癌癌细胞位置的算法来帮助医生对病人进行活检,其位置预测的准确率高达96%。
33、 利用大数据寻找个性化药品的研究工作
34、 发明基因编辑技术而获得突破奖 多德娜、卡彭特尔
35、 在历次技术革命中,一个人、一家企业,甚至一个国家,可以选择的道路只要两条:要么加入浪潮,成为前2%
的人,要么观望徘徊,被淘汰。
网友评论