人工智能、深度学习、算法是近几年高新科技领域的热门话题。前几年,阿尔法狗和李世石的人机大战给人留下了深刻印象。围棋世界冠军李世石以1:4的比分败给机器人阿尔法狗,让人们直观地看到了人工智能的强大能力,并对其应用前景满怀热望。
我们难免好奇,现在的人工智能有哪些更强大的功能?它们是如何实现的?美、英两国双料院士马库斯·杜·索托伊在《天才与算法》这本书中解答了这些问题。
索托伊是一位成就突出的科学家。他不仅是英国皇家学会院士、美国数学学会院士、牛津大学西蒙尼公众理解科学教授,更获得过大英帝国勋章、英国皇家学会迈克尔·法拉第奖、伦敦数学协会贝维克奖等多个奖项。他被誉为“科学大使”,擅长把复杂的数学知识转化为通俗易懂的语言,经常为《泰晤士报》和《卫报》撰写文章,还与BBC广播公司保持长期合作,致力于科普工作。
人工智能的实现离不开算法和数学的支持。索托伊不仅在数学方面有深厚造诣,更对AI算法有独到理解。《天才与算法》就是索托伊介绍人工智能以及算法的一本优秀科普作品。通过索托伊的讲解,我们不仅能了解欧美国家在人工智能领域的前沿研究成果,更能对人工智能的研究前景和需要解决的核心问题有深刻的认识。
除了围棋,算法已经在学着绘画、作曲、写小说了
算法能够分析用户的个人偏好,为我们提供个性化的电影、书籍等产品推荐,这些融入日常的实用性便捷功能,我们已经不觉得新鲜了。除了围棋,现在的算法还能实现哪些新奇的功能?这是我们关注的问题。
索托斯在《天才与算法》中明确地告诉我们,除了下围棋,算法已经在学着绘画、作曲、写小说,并且完成了很好的作品。
“复活伦勃朗”
微软和代尔夫特理工大学联合发起了一个“复活伦勃朗”的项目。该项目尝试通过学习伦勃朗的大量作品,来创作出一幅全新的伦勃朗风格的画。
这个项目组研究了346幅画,创建了150G的数字渲染图形,搜集伦勃朗作品中人物的性别、年龄和头部朝向等信息,对脸部不同关键点做海量几何分析,还使用算法来探索伦勃朗画眼睛、鼻子和嘴巴的方法,研究伦勃朗对光的运用,以及伦勃朗使用什么样的比例和关系把人物的面部特征组织起来构成一张完整的脸。
经过18个月的数据处理和500个小时的渲染,项目组终于在2016年4月5日的阿姆斯特丹展出了这幅作品。这个成果很引人注目,展出前几天,在Twitter上就有超过1000万条对这幅画的评论。多数人也会把创作这幅画的“艺术家”归到伦勃朗画派。
“复活伦勃朗”项目组生成的这幅画作,的确再现了伦勃朗的绘画风格。
“深度巴赫”
音乐专业的学生盖坦·哈德耶勒斯在音乐创作上作出了类似“复活伦勃朗”项目的尝试。他为了完成博士论文,开发了一种“深度巴赫”的算法,想要通过数字处理方法分析巴赫的创作风格,并尝试生成相似风格的新作品。
巴赫写了389首四部和声的圣叹合唱。“深度巴赫”算法以这些数据为基础,创作出新的圣叹作品,并邀请志愿者来聆听并判断作品是计算机所作还是巴赫的原作。结果,“深度巴赫”算法生成的作品有50%被认为是巴赫的作品。即使换成学习过作曲的志愿者来参与试验,还是有45%的“深度巴赫”作品被认为是巴赫的原作。
从以上结果来看,“深度巴赫”算法所生成的音乐作品,的确有明显的巴赫风格。
续写《哈利·波特》
作家杰米·布鲁和《纽约客》前漫画编辑鲍勃·曼考夫创立的Botnik公司,把目光锁定在文学创作上。该公司研发了一款人工智能幽默应用程序“Botnik”。“Botnik”能够对剧本进行数学分析,并依据算法总结的作品风格创作出新的剧集或进行改编。
“Botnik”为《宋飞正传》《实习医生风云》生成过新的剧集。它最成功的的作品,是分析了《哈利·波特》七卷丛书之后,生成了三页几乎可以以假乱真的续集。虽然只有短短三页,但考虑到文学作品的复杂性,算法能够生成三页很相似的文学作品续集,已经是很了不起的成就了。
这些只是算法尝试创作艺术作品的一些例子,还有更多的团队在研发不同算法,进行各个领域的深入研究。
对于以上这些算法的成果到底算不算创作,还存在很大意见分歧,或许称其为模仿更准确。但不可否认的是,算法对这些艺术作品的模仿的确是达到了以假乱真甚至是青出于蓝的水平。这的确是算法研究所取得的惊人的成就。
算法是如何生成艺术作品的?
艺术创作是很复杂的过程,也是人类意识和综合能力的体现。能绘画、作曲、写小说的算法,足够让人刮目相看。那么,算法是如何实现这些通常需要灵感激发和技法实现的艺术类作品呢?
足量的、良好的学习数据是算法成功的基础。
从上面几个例子,我们不难发现,这些项目之所以能够创作出以假乱真的作品,得益于可供算法学习和分析的数据量比较大。足量的数据,是算法学习的必要基础。也就是说,算法必须先有足够多的数据供它进行学习和分析,才能进行下一步的作品生成。这不是从零到一的过程,而是从旧到新的过程。
那么,数据的质量对算法成功与否就非常关键了。所以索托伊强调,“机器是能够学习的,但前提是你要让它学习对的东西”。
比如前面的例子中,伦勃朗和巴赫都有大量的作品可供算法学习,《哈利·波特》有七卷的长篇幅供算法分析。有了这些优质的基础数据,算法才能成功生成新作品。
从另一面来说,如果缺少足够的、良好的数据,算法也就没法学习和复制了。索托伊同样关注到这一点,他无奈地说道,“也许,这就是人类创造的艺术不受机器进步影响的终极安全锁——好作品的数量太少,机器无法学习如何复制”。
从数据中总结规则,是算法成功的核心。
算法是用来解决问题的,有明确的目的性,遵循一定的规则。
伦敦帝国理工学院的计算机创造力研究员西蒙·科尔顿认为,计算机科学和创造性艺术融合在一起存在这样一个问题:计算机科学的蓬勃发展建立在解决问题的目的性之上。
每一种算法在运行过程中,都是在特定规则的限制下,努力解决某个问题。尝试艺术创作的算法,同样是把绘画、作曲、生成文学作品看作一个问题。大量的基础数据就是算法解决问题不可缺少的原料。算法学习和分析这些数据,从中总结出可识别的规律,再根据这些规律生成新作品。
对于有些问题,规则是已有的。比如围棋具备明确的下棋规则,这种情况下,算法需要收集大量的实战过程来学习规则的运用。阿尔法狗在对战李世石之前,和樊麾对弈了几个月,从中学习人类棋手下围棋的经验。而新一代的阿尔法零更进一步,完全遵照围棋规则自己和自己对弈,自己获得海量实践数据,并从中迅速学习获胜的走法。
对于没有具体规则的问题,算法首先要总结规则。艺术创作原本是没有这些规则的,但如果把目标设置得非常具体,比如模仿伦勃朗的画、模仿巴赫的音乐、模仿《哈利·波特》的故事,算法需要总结的规则也变得具体,也就是总结伦勃朗的绘画风格、巴赫的音乐风格、《哈利·波特》的文字风格。当然,算法会把这些风格转换成更具体的指标,比如绘画的人物五官,音符的前后关联关系,文字的动词、形容词组合规律等。
算法会总结出它所能理解的具体的规则,再根据这些规则生成新作品。算法所依赖的,正是数学所擅长的:分析数据,总结规律,再运用规律。
从这个角度来看,目前算法所生成的艺术作品,的确只能算是模仿,但确实是非常精湛的模仿,甚至可能比人类的作品更胜一筹。这是因为,所谓艺术风格,在个人来看来,更多的是一些感觉,很多时候无法准确描述,算法却能够总结出非常具体准确的指标。并且,近几十年计算机飞速提升的运算能力,也为算法提供了充足的技术支持,能够完成更复杂的工作。这些运算能力是人脑无法达到的,这也正是算法或者说人工智能的优势所在。
能写诗、作曲的算法,算不算拥有了创造力?
虽然把上述算法通过学习生成的艺术作品称为模仿,但这种模仿的成果仍然是值得瞩目的,并且,这种模仿过程中,还存在一定意义上的、不可忽视的创造成分。
算法对数字作品内在规律的总结,是出于与人类理解事物不同的角度,这也给人类提供了不同的思路。就像跟阿尔法狗对弈几个月后,樊麾也从阿尔法狗身上学会了新的下棋思路,并且把自己的世界排名从633提升到了300名。阿尔法狗与李世石对战的第二盘,出人意料的第37手5路肩冲这一步棋,也让李世石和其他棋手跳出了固有经验的限制,探索更多走法。
从这个意义上说,算法也在打破人类的固有思维限制,拓宽人类的思想边界。
但是,从艺术角度来说,即使能写诗、作曲,目前的算法也还不算真正拥有了创造力。
艺术创作是人类自由意识的表达,是情感和思想的交流。算法模仿出的作品,即使再精湛,也只是技术的产出。这些作品所代表的,是技术的高度,而不是思想的深度。哪怕在生成令人心潮澎湃的音乐作品时,算法仍然是毫无波澜的。因为它只是在根据指令执行规则,并没有人类喜怒哀乐的情感。也就是说,它没有意识。同时,它也不能准确理解人类的意识。
当然,许多团队已经在为此努力了。想要理解人类意识,可以首先从理解人类语言开始。IBM的“华生”算法,就是通过参加益智类问答节目《危险边缘》来研究如何理解人类的“自然语言”。“华生”赢得了《危险边缘》的冠军,让人们对人工智能的前景有了更大信心,但它也犯过很低级的错误,在一道猜美国城市的问题中,给出了加拿大多伦多的明显错误答案。这是算法存在的问题,它只是执行命令给出结果,可能会给出意想不到的、违反常识的结果。这也是人们对人工智能比较担忧的一个问题。
目前的算法离真正的人工智能还有多远?至少,在理解人类意识方面,算法还有很长的路要走。
2020.04.16雾凇
网友评论