斯坦利和雷曼就举了一个自己进行人工智能训练的小案例:先设置一个平面迷宫,然后训练机器人顺利走出迷宫,到达出口。出乎意料的是,如果算法被设定成尽快到达出口,机器人反而进步迟缓,因为它总是遵循目标第一的原则,想规划一条最便捷的路线直达门口;而我们人类理解中的合理路线,都会被机器人判定为,在某些时刻远离了门口,背离了目标,所以是不正确的。这就导致机器人永远是一出发,就朝着出口方向猛冲,撞上迷宫中的墙壁。你看,通过这个小小的计算机试验,“目标至上,导致错误解决路径”这个道理,就被演示得清清楚楚。
斯坦利和雷曼还在书中讲述了一个他们做过的人工智能虚拟实验,实验的目的是让一个拥有人类一样双腿的机器人,最终学会行走。这两位程序员为机器人编写的算法中,优先目标并不是尽快能够双腿行走,而是尽可能让机器人用自己的双腿做出一些新奇的动作。出乎意料的是,当设定的算法是鼓励机器人做出新奇性行为时,它学会走路所用的时间,远远少于目标被设置为尽快学会行走的时候。这是为什么呢?原来啊,如果机器人被设置为“尽快学会行走”,那么在算法逻辑里,摔倒就是一件坏事,机器人会努力避免摔倒,但同时也限制了它对各种行走姿态的试错;但如果是以新奇性动作为优先目标,那么机器人一开始会以各种姿势花式摔跟头,但在这个过程中,它逐渐学会了踢腿、摆动身体,而这两个动作,正是实现双腿行走的基础。
晨课:斯坦利和雷曼-敏锐观察力和开放心态。
![](https://img.haomeiwen.com/i3327857/4ed5032f58abe83e.jpg)
网友评论