
摘要:
1、让一台机器和一个人坐在幕后,让裁判同时与幕后的人和机器进行交流,如果裁判无法判断自己交流的对象是人还是机器,就说明了这台机器有了和人同等的智能,这种方法被后人称为图灵测试(Turing test)
2、人工智能这个名词严格地讲在今天有两个定义,一个是泛指机器智能,也就是任何可以让计算机通过图灵测试的方法,包括在本书中要经常讲的数据驱动法。第二个是狭义上的概念,即20世纪五六十年代特定的研究机器智能的方法。
3、找到了数学模型之后,下一步就是要用统计的方法,训练出模型的参数,在今天来讲,就是机器学习。
4、数据驱动方法,这种方法最大的好处是,随着数据量的积累,系统会变得越来越好,相比之下过去人工智能的方法很难受益于数据量的提升。
5、BLUE,即bilingual evaluation understudy.分数是一种衡量机器翻译质量的客观评分,一般来讲,人工正确翻译的得分为50%-60%
6、N元模型是考虑N个单词前后的关联,六元模型就是考虑6个单词,而大家当然普遍使用的三元模型只考虑3个单词。
7、大数据:大量,多纬度,及时性,多样性。
8、欧几里得的《几何原本》、牛顿的《自然哲学之数学原理》
9、管用的方法:首先,需要有一个简单的元模型,这个模型可能是假设出来的,然后再用这个元模型构建复杂的模型,其次,整个模型要和历史数据相吻合。
10、人们将牛顿的方法论概括为机械思维,其核心思想可以概括为:第一,世界变化的规律是确定的,这一点从托勒密到牛顿大家都认可;第二,因为有确定性做保障,因此规律不仅可以被认识的,而且可以用简单的公式或者语言描述清楚,这一点在牛顿之前,大部分人并不认可,而是简单地把规律归结为神的作用;第三,这些规律应该是放之四海而皆准的,可以应用到各种未知的领域指导实践,这种认识是在牛顿之后才有的。这些其实是机械思维中积极的本质。机械思维的重要特征,所有问题都有一个通用的解决方法。但到了信息时代,它的局限性越来越明显,因为,并非所有的规律都可以用简单的原理描述,其次,像过去那样找到因果关系已经变得非常困难,因为简单的因果关系都被发现了。而信息论也是完全建立在不确定性基础上,而要消除这种不确定性,就要引入信息,至于要引入多少信息,要看系统中的不确定性有多大。大数据的科学基础是信息论,本质就是用信息消除不确定性。在无法确定因果关系时,数据为我们提供了解决问题的新方法,数据中所包含的信息可以帮助我们消除不确定性,而数据之间的相关性在某种程度上可以取代原来的因果关系,帮助我们得到想要的答案,这便是大数据思维的核心。




11、青霉素的有效成分,一种被称为青霉烷的物质,能够破坏细菌的细胞壁,而人和动物的细胞没有细胞壁,青霉素可以杀死细菌而不会伤害人和动物。
12、美国的法律采用无罪推定原则:意指被告的一方在法庭上先被假定为无罪,除非有足够的证据证明其有罪。
13、安迪–比尔定律的原话,比尔要拿走安迪所给的。含义是,在计算机领域,软件功能的增加和改进要不断地吃掉硬件性能的提升。
14、机器学习的过程无一例外是一个不断迭代,不断进步的过程,用机器学习的专业术语来说就是:期望最大值,expectation maximization的过程,只要事先定出一个学习目标,这些算法就会不断优化模型,让它越来越接近真实的情况。
吴军:《文明之光》、《数学之美》、《浪潮之巅》

网友评论