当下,说唱文化正逐渐在中国流行起来。
自去年夏天一档说唱类节目横空出世以来,社交网站上的话题几乎都被它包圆了,以至于今年要播出的第二季还未见踪影,就已经引爆了观众的期待感。
这类节目把说唱歌曲这类小众文化带到更广泛的人群面前。但对于普通用户来说,比起流行歌曲,“说唱”显然更有难度:节奏、押韵,说唱文化中的嘻哈态度都让人望而却步。
但是最近,人工智能好像为我们解决了一部分难关。
在百度7月4日举办的AI开发者大会上,百度副总裁沈抖携说唱歌手孙八一,发布了一款名为“爱说唱”的智能小程序:用户只需选择背景音乐,然后随便说出一段话,就可自动生成一段堪比专业的RAP歌曲。
人人皆可RAP?听上去很吸引人。作为人工智能的新尝试,爱说唱获得了不少目光,毕竟没有freestyle也没问题了。那么,还有哪些人工智能已经在乐坛上出道了?
今天小贝就带大家来盘点一下那些AI歌姬们。
初音未来、洛天依
说起“虚拟偶像”,几乎所有的宅友们脑海中跳出的第一个名字便是“初音未来”,作为世界上第一个举办演唱会的虚拟歌手,世界第一公主殿下的名号可以说是响彻云霄。
初音未来,是2007年由Yamaha的VOCALOID系列语音合成程序为基础开发的虚拟少女偶像。
对,你没有看错,这个葱色双马尾辫的少女的缔造者,是雅马哈。说到雅马哈,估计大家脑子里首先跳出来的会是:
事实上,看起来“不务正业”的雅马哈产品还包括钢琴、电子琴、数码钢琴、等乐器,
音效芯片、XG声卡、影音处理机器、系统处理机器、专业音响机器、半导体至电子产品、防音工程及高尔夫球用品都属于业务范围之内。
总之,就是让你弹雅马哈、听雅马哈、用雅马哈、玩雅马哈、打雅马哈....
我整个人都雅马哈了
2004年,雅马哈开发了电子音乐制作语音合成软件核心引擎VOCALOID,就是初音未来和她的中国风妹妹洛天依的核心。
根据目前主流的语音合成方式,Vocaloid采用的是“拼接合成”技术,使用者可以通过输入歌词和音符的方式直接生成歌曲。
如果需要创作一首新的曲子,使用者需要规划歌词和音调,编辑歌词和音调。并且可以对生成的"唱词"进行各项微调,包括呼吸力度、口的开合甚至颤音,令原本破碎的声音数据变为连贯的类人电子声音。
采用这种方式来创作,可以实现对歌曲最精确的控制,最大限度展现创作者的音乐想法。但另一方面,也很需要作者调整各项参数的功力。
微软小冰
不同于初音未来这种天生歌姬,微软小冰是半路出家,唱歌的原理也不一样。
虚拟歌手需要录制好的声音库,再通过重新拼接声音库中的片段形成歌曲;而小冰唱歌是根据输入的信号做出发声的反应,也就是机器学习。
第四代的小冰在音调、音质、自然度、衔接上都有了极大的改进,此外又加上了换气的声音和人类的演唱技巧,大大提高了演唱的自然度。
佐藤莎莎拉
佐藤莎莎拉是由基于HMM合成技术的声音创作软件CeVIO Creative Studio创造的虚拟歌姬,因其酷似真人的声音,被粉丝称为站立在现实和动画的交界处的女主角。
CeVIO Creative Studio采用的算法在本质上与VOCALOID的"拼接算法"不同,HMM合成通过提取人声中的特征量建模,可以最大程度保留人声的特征,经过后期可以与VOCALOID媲美甚至更加接近人声,在声音的拟真度上可以说也并不逊于今天的小冰。
在某种意义上,虚拟歌姬和小冰都是利用技术降低了艺术创作的门槛,但根本性的不同在于对这一问题的回答:
科技在艺术创作中应该扮演什么样的角色?
显而易见的是,小冰所代表的无疑是一个激进的科技派:利用科技的发展降低、乃至消除艺术创作的门槛,让技术引导人类的进步。
而Vocaloid方面,尽管YAMAHA公司也一直在不断探索前沿的语音合成技术,在音乐创作上采取的却是最为传统的姿态:提供一个乐器,但将创作的自由完全归还给创作者。
这种态度最大程度上回归了艺术的本源:人的自我表达,但另一方面,也在客观上保留了创作的门槛。在Vocaloid的圈子里,真正创造价值的仍然是创作者本身,在这里,技术让位于了人类。
当然,以小冰的人工智能水平,我们并不需要讨论“人工智能威胁论”之类的东西,但现实的问题确实摆在眼前:
在艺术创作领域,“大众”、“简便”的工业化生产似乎已经近在咫尺,而这种流水线生产真的就能完全取代专业而精密的调教了吗?对于创作者而言,“艺术创作”究竟是怎样一种行为,而对于观众们来说,他们欣赏艺术作品时,希望接收到的又是什么呢?
小贝认为,艺术创作所赋予观众乃至社会的,并不是简单地文字优美、曲调生动,而应该是一种来自于现实社会的思想。
标贝科技 • 音领智能未来
网友评论