前言:
吴文达版的machine learning不得不说比大多数视频教程都要好,所以我也不想再写comp9417了。
Topic: General Introduction
1.什么是机器学习
机器学习(machine learning),顾名思义,是让我们的机器具有学习的能力。
机器学习离我们实际上很近,我们每天都会用到很多次机器学习的应用,但也许并没有意识到。
Google, Bing一类的搜索引擎本质上是爬虫没错,但它们之所以工作的如此令人满意,即每次都能把我们需要的网站放在最显眼的位置(e.g.搜索某官方网站)。是因为它用到算法给网页排序,这是machine learning。
每当我们用到相册,相册会自动从我们拍摄的照片中分类出所有有我们自己,或我们朋友的脸的照片,这也是machine learning.
当我们阅读邮件时,垃圾邮件(spam mail)被自动过滤到垃圾邮箱,这也是machine learning.
当然,仅仅知道machine learning是什么是远远不够的,所以我们会学习很多算法和概念来实际的掌握machine learning并了解如何运用这些知识到实际的应用中去。
我们想让机器“智能化”,机器可以做到很多事,比如我们的程序可以让机器找到"Shortest Path"。
但大多数情况下,机器做不到大多数事情,比如我们讲到的Web Search, Photo Classification, Spam Mail Filter.
因此,machine learning也成为了计算机亟待开发的新能力。
机器学习和数据挖掘相互交融,之所以机器学习,人工智能这么一类上世纪90年代理论上就没有太大进步的技术,会在今天绽放光彩,一方面是硬件性能的提升,另一方面是海量数据的产生。
比如,大量硅谷的公司搜集用户点击网页的时间和方式,这类信息被称为点击流数据。
比如,大量的疾病患者的身体指标数据,可能让我们对疾病有了更深的认知。
而第二类机器学习的领域是我们的传统编程无法解决的领域。
比如无人直升机领域,一个死板的程序始终无法应付所有的天气条件下飞行器的飞行,除非让它自己学会飞行。
飞行器所以吐槽一下,王力宏的《AI爱》我不太欣赏,但感觉《你不知道的事》还是唱出了人工智能的特质,蝴蝶眨几次眼睛,才学会飞行...
机器学习可以粗略地分为监督学习(Supervised Learning)和无监督学习(Unsupervised Learning)。
别的分类还有增强学习等学习方式,之后也会提到。
比较热门的研究领域有手写识别,自然语言处理(NLP),机器视觉等。
网友评论