为什么你打算去YouTube看5分钟视频,却看了3小时?为什么你想过些天再买的东西,突然出现在网页广告中,而你一冲动就提前买了?
诸如此类的现象你想过原因吗?你的电脑怎么知道你一直想要什么?
它绝不仅仅是一个电脑,它是机器人,算法机器人,是它一直在关注着你。每时每刻!
是的,事实就是这样。那么问题来了,这些机器人是怎么造出来的?里面的软件又是如何发挥作用的?
距离人们手写算法,营造“真人工智能”假象的日子还没过去太久。简单而冗长的代码,思路大体是这样的:这样做,将会怎样;或者这样做,就会保证机器在一段时间内工作顺畅,并在许多日常活动中发挥效果。然而, 随着越来越多的人在互联网上创建更多更大的数据集, 这种方法就行不通了。因为有些问题太大了,人根本写不完整。
一起来看个例子,两张照片,一张是狗,另一张是数字5。作为人,你知道这俩是什么,但机器是怎么知道的呢?
我们必须创建一个复杂的算法,让它逐个像素地抓取,并找到与已知狗的图像相匹配的像素,给出猜测。人类的大脑有复杂的神经元连线,每秒都在学习。同样, 我们也要创建出具有模式识别功能的复杂的机器人, 随着时间的推移,不断学习。
他们是如何学习的?
工程师们创建一个具有简单大脑的教师机器人、一个调教机器人,以及一堆学生机器人。调教机器人掌握着学生机器人的生死大权,根据他们的测试成绩,对他们进行保留或丢弃。
教师机器人自己不能区分狗和数字5,但它可以测试出学生机器人是否能识别。现在你知道为什么自动化测试如此重要了吧。
我们给教师机器人一堆狗和数字5的照片,并给出答案的关键提示。在此基础上,教师机器人测试学生机器人,并记录他们的成绩。根据测试成绩,调教机器人调整学生机器人的算法机制,不断排列组合,保证教师机器人持续在不同的学生机器人身上测试,有时调教机器人也能随机看到学生的对错。
教师机器人不断测试,根据学生排名,调教机器人保留算法最好的学生,丢弃其他的。
测试、构建、再测试,不断循环重复,比较学生成绩并进行评估,直到学生考到99.9分(达到99.9%的精确度)时,循环停止,保留最好的算法排列。
测试、构建、再测试的自动化循环重复了多少次?嗯,它重复了很多次,直到有了最好成绩。最好的机器人是区分狗和数字5的最佳算法。
还有问题吗?
现在我们已经找到了最好的算法来区分狗和数字5,还会有什么问题呢?如果我们给机器人一个狗的视频,把图像颠倒过来,或者写一个“S”而不是5,那么机器人还能解决这个问题吗?答案是不能。
该如何解决?
为了解决这个问题,工程师必须创造更多的自动化测试案例,为学生机器人提供更多的问题,甚至包括错误的,为最坏的情况做好准备。使用长期、复杂的测试,确保训练出更好的机器人。
我们需要的不是一个机器人,解决十几二十几个问题,而是数百万的机器人,解决数以万计的问题,那么测试、构建、再测试的周期如何重复呢?在这种情况下,你必须自动化所有过程,并继续进行相同的测试。
当终极机器人建立起来时,它是唯一一个幸存的机器人,只因为它的算法比其他机器人好0.01%。学生机器人建立的算法不被教师机器人知道,也不被工程师知道,甚至它自己都不知道!它只是一个作品而已!
机器人是如何思考或工作的,它的想法没人知道。
回到开头说的YouTube的例子。现在容易理解了。学生机器人的任务是保证用户观看视频,并记录用户的观看时间,能“诱惑”用户看得最久的学生机器人得分最高。教师机器人评估所有的学生机器人,学生机器人不断向用户提供建议,作推荐,以保证用户高度参与。
可以看到,教师机器人只是测试学生机器人,让学生机器人不断学习。所以,一言以蔽之:机器学习是不断测试,不断被调教的过程。
—完—
亲爱的朋友:
读完这篇文章,你知道为什么YouTube让人欲罢不能了吧?同理,你能列举出多少类似的应用?(明明只想使用5分钟,最终却用了50分钟甚至更长时间。)
祝安!
智能观 一米
2018-2-4 于北京中关村
想知道AI加教育领域有哪些最新研究成果?
想要AI领域更多的干货?
想了解更多专家的“智能观”?
请在对话界面点击“找找看”,去获取你想要的内容吧。
声明:
编译文章旨在帮助读者了解行业新思想、新观点及新动态,为原作者观点,不代表智能观观点。
网友评论