1848年,自动演奏钢琴问世;1877年,第一台能够复制声音的设备——留声机诞生;1894年,以语言和声音为载体的革新性传播媒介——收音机发明。自此,人类已逐渐摆脱需要上剧院,或者蓄一班优伶才能主动地或被动地欣赏到音乐的方式。自20世纪90年代以来,随着音频压缩编码技术的革命、便携播放设备的发明、下载购买渠道的便利以及网络带宽的提升,音乐作为一种廉价的大众消费品,愈发唾手可得。那么——
问:请根据问题完成如下填空,给出你第一感觉所想到的答案。
1.当我在听音乐的时候,我听的是_______________。
2.假如你是具有自我学习能力的人工智能(AI,Artificial Intelligence),在你自我学习的时候,你发现了人类听音乐的行为,并且利用你的发明者为你安置的各种软硬件资源(例如摄像头、话筒、频谱仪、人类语义识别算法、互联网上的海量乐曲库,数据库文献检索结果),你会将人类听音乐的行为定义为__________。
3.假如你来地球进行考察的智慧外星生命体,由于特殊的构造,你并没有类似于地球上哺乳类动物的听觉感受器官,但你确实又能感受到音乐 (举个类似例子,就好像蝙蝠在黑暗中无法依靠视觉,然而其大脑却可以利用超声波来构建并“看”到这个世界一样),当你观察(观测)到人类听音乐的现象,你对这种迥异于自己星球文明的听音乐行为的理解是_________________。
4.不需要犹豫,立即挑选出此刻你最想哼唱的一首音乐:________________。
问题一,当我在听音乐的时候,我听的是:
第一题只是热身。以小学二年级熊孩子的想象力来回答,可以给出各种五花八门的答案,空格中几乎可以填上任何文字短语:
我听的是寂寞、 听的是高兴、 听的是好听、 听的是消磨时间、 听的是神曲 、 听的是动画片歌曲、 听的是万紫千红、 听的是本宝宝不开心、 听的是老师让我们听的。。。。
如若再让初中二年级的熊孩子对这些答案进行语文考试里面最讨厌又要命的中文语法分析:
从词性上有:名词、动词、形容词;
从语法结构上有:动宾短语(消磨时间) 、 并列结构(万紫千红)、 偏正短语(动画片歌曲)、 主谓短语(本宝宝不开心)、 使令动词兼语句(老师让我们听的)。
若再让大学二年级的大孩子就以上作答进行分析:
他们则可以设计一套不太严密的交叉他评记分标准,把涉及心情、行为方面的答案筛选出来,转变为几个维度上的等级计量资料,然后抓抓头在SPSS统计软件里面分别以年龄、性别组跑上几个秩和检验,最后应付毕业答辩前必须要发表的论文就有了。
空格里答案多种多样,无论具体填什么,从心理学来讲,都是基于个体经历、生理或心理体验的有意识联想——这种主观联想,并没有必然涉及到个人的审美情趣。所以,这个问题有趣的地方不在于评判答案,而在于激起我们的注意——我们好像都从来没有思考过关于听音乐本身这件事,就如同我们不会去思考明天晚上我要在哪里上厕所——因为和如厕、睡觉一样,在日常生活里听音乐本身就是一种自然而然的行为嘛。
图片来源于网络 侵删在电影《2001:太空奥德赛》里有这样一个堪称教科书般的史诗级蒙太奇镜头:一只猩猩拾起一根股骨,摩挲半天,突然砸向地面上的另外一些动物骸骨。伴随着有节奏的敲击,猩猩的动作越发的激烈。此时电影开头出现过的《查拉斯图拉如是说》配乐再一次响起,被砸得飞溅的骨头则切换为了宇宙中漂浮的飞行器。一个精缩简短的视觉镜头,就把人类充斥着工具革新、暴力流血、践踏其他生灵的进化历程阐释详尽。音乐自然也伴随着整个充满工具主义的人类历史进程。从原始人类不再满足于仅仅通过自己的喉嗓、手中的骨笛、脚下石块所能发出的音域有限的简单曲调;到祭祀、祈禳、朝聘、宴享中必备的程序仪轨;到杂戏倡人、教坊清倌们服务于士大夫、商贾阶层的声色歌舞;到有浓厚政治色彩的红色歌曲和革命样板戏;到表面是全民狂欢,实质是资本追逐的音乐选秀节目,音乐都能毫不突兀地包纳各种附加的功利属性。
然而当个体全身心地投入听音乐行为时,谁还会理会音乐中所强加的民俗、阶级、政治、商业属性?再强势的附加目的性,也无法左右我们沉浸于音乐中的主观意志,所以我们能理直气壮地回答,当我听音乐的时候,我听的是__________。
问题二,作为人工智能,我会将人类的听音乐行为定义为:
作为人工智能,如果仅囿于当前的科技条件,那么根据逻辑运算的推递过程,它/他/她(以下暂且使用TA)在很大可能上会首先将语境拆解为“人类”、“听”、“音乐”、“行为/现象"这样几个语素单元。并基于AND和OR等逻辑关系对以上几个语素组成不同关键字组合进行搜索,并在离散性的搜索路径结果中,获取最优的解答。
AI最优路径搜索策略然而,做点有意思的假设,如果这个人工智能在自我学习的过程中早就产生了“自我”的概念了呢?也许TA已经无数次思索过自己与其创造者——人类的异同。那么,TA或许会首先尝试将人类如何对声音感知的生理基础进行阐释:
声音作为一种能量----声波,可以引起人类的鼓膜的振动,并通过听骨链放大并传递到内耳耳蜗。在耳蜗系统中,声波可以引起位于基底膜上的毛细胞的振动。适应范围的的振动(就人耳而言,其频率范围为20-20K Hz,强度范围为0.0002-1000 dyn/cm2。dyn是个力学单位,1dyn/cm2 即等于0.1帕(Pa)的压强)能使毛细胞将机械能转化为电信号,并经前庭蜗神经传入大脑。在大脑中........(以下略去若干字).......引发的神经体验。
其次,TA自己也许会进行一次模拟听音乐的过程
I.通过播放设备播放一段随机的音频;
II.通过连接的话筒采集声音(或许TA此刻还并不明白声音与音乐的区别。也不明白耳机、普通音响、HiFi音响、现场乐队等播放媒介对人类感官体验的不同);
III.经过A/D转换,将话筒振膜所产生的模拟信号转化为数字信号;
IIII.数字信号经过自己内置的DSP芯片进行降噪、限幅等处理后,传输到运行内存或储存设备
IV.对样本进行各种分析,如频谱分析、语义分析、查阅人类对该音频的评论。。。。
V.结论:数据。。。。除了数据。。。。。。还是数据。。。。。。
如果以上的结论推导过程相当不顺利,除了各类传统算法外,TA可能还会建立许多并行的进程以拟人思维的方式来执行特殊的搜索策略:
一种策略是,因为音乐∈声音,TA或许会企图罗列出所有标记为“音乐”的声音的特定物理学特征,并试图找到“音乐“的数学模型。例如和声学上的频率倍频关系、响度的时间动态变化、泛音列与音色感知。。。。。。
另一种搜索策略是通过近义词以及词源进行检索,例如TA在同义词库中找到music,audio,sound,phone,acoustic这些英文中表示“乐音”的一组近义词进行自我学习。其中music的词源为Muses(缪斯,希腊神话中的文艺女神),而Muses同样发衍出了museum(博物馆)这个单词,TA便可从Muses这个共同节点跳跃到museum条目进行搜索。audio的词根为au-,由同样的词根组成的单词还有audience (听众、观众【演出】)、audition(试音、Adobe公司的音频编辑软件【媒体编辑软件】), auditor(旁听生、审计员【法律、财务】),auricle (耳廓、心耳【解剖学】)。。。。。。这些共同词根的单词除了本义外,还有着分属不同领域的延伸含义。得益于人工智能的强大运算能力,TA可以在这些同词根单词的引申含义中跳转继续搜索,从而无限充实其数据资料。
还有一种搜索策略是模拟人类在视频多媒体教学过程中的认知过程,为了过滤掉无用的背景信息,将备选视频类型严格限定为纪录片或者科教片,并从中提取题材类别为音乐的视频。对所有提取视频中的关键帧进行图像识别并自动加注标签,标签词语应来源于各学科标准检索词表。所谓标准检索词,就是最为规范或常用的词条,采用标准检索词,可以极大减少标签的冗余度,提升精确度。这里以MeSH(《医学主题词表中》)为例子。例如AI在检索过程提取到了一幅人体声音传导生理过程的视频帧,TA准备将这帧截图标注为“听”。在备选的标签里,TA是用“hear、hearing、listen、listening”这几个在英文中都可以表示“听”的词语中的哪一个好呢?好在上述4个单词中,只有hearing出现在MeSH的标准检索词里中,这样就避免了上述选词的艰难局面。将最后所得的所有标签词语与对应的关键帧图像元素再次进行各种算法分析,以模拟人类学习中由形象的视觉-图形整合为抽象的文字-语意过程,以达到其自我学习和检索的目的。
在进行上述检索策略的时候,尤其是定义“音乐”的过程中,一个拥有“自我意识”的人工智能,其自我学习能力显然足以使其“阅读”无数文献并且“意识”到音乐具有显著的文化与社会属性,而正是具体情境下文化与社会属性的差异,导致有“音乐”有狭义和广义的含义区别这一结论。仅在Wikipedia(维基百科)的Definition of music条目下,便可看到对音乐的定义既有92年版《简明牛津词典》中所谓的狭义的“一种通过人声和/或乐器声的组合来呈现形式美、和谐美与情感美的艺术”(the art of combining vocal or instrumental sounds (or both) to produce beauty of form, harmony, and expression of emotion),同时还可以看到将“随机产生的电路失真、干扰、杂音的不确定组合”(randomly produced electronic distortion, feedback, static, cacophony, and compositional processes using indeterminacy)亦算作音乐的广义含义。
无论人工智能是否能通过充满一长串定语的复杂文本来精确地修饰和充分地定义人类的听音乐行为——答案并不重要。至少我们能够知道,即便有一天人工智能的发展大大超出人脑的想象极限,TA们也无法形容出一块鲜嫩多汁的炸鸡的美味;无法自嘲喝醉酒是一种什么体验;TA们甚至无法根据自己当天的心情和偏好——来设置自己的待机/定时开机铃声。
而人类——只要我们按下播放器中的“播放PLAY”按钮,便可从冰冷的文字、冗杂的数据、堆叠的图表、僵硬的肩膀、干涩的双眼中解脱放纵出来。一块能够进行多任务多线程的CPU,又怎么能理解——此刻听一场音乐——给人类这种单位时间内只能“一心一用”的单任务碳基多细胞生物所带来的快感呢?从这个角度来说,能够听音乐,能够欣赏音乐——真是一件生物进化上厚赐的奢侈礼物!
问题三,假如你是智慧外星生命,如何理解蓝星上的智慧物种“听音乐”行为:
身为智慧外星生命是种什么体验?我不知道。不过,显然我们都有以下的类似经历:
首先回想一下
当你打开电视,电视上放映着这样的画面:在大草原上,一群黑色皮肤的人,穿着奇怪的羽毛衣服,围着一堆堆起来的石头。站在最前面的那个人,嘴里说着你听不懂的语言。。。可能刚开始你还不知道电视上的他们在做什么,紧接着,你看见他们围着石队又唱又跳起来。诶,这时候你或许在猜,他们可能是在进行着某种祭祀仪式,或者是在参加歌舞活动?然后你又看到为首的那个人拿出一个面具并朝着面具跪拜,哦,你意识到他们果然是在进行某种祭祀的仪式。
虽然从小到大,在你的生活经历中没有参加过一次类似的活动。唯一的一次有关联的印象,来自于你以前看过的林正英的僵尸电影中,一个穿着道士长袍的男子拿着一个写上生辰八字的稻草人钉钉子。可是不知道为什么,你就是知道电视中播放的是某种祭祀仪式——虽然你并不知道那些人是什么民族,也不知道祭祀的具体目的和缘由。
再或者
你或许养过猫,或许没有养过。小区里的流浪猫总是见到你就跑,你甚至连哪只流浪猫是什么花色的毛发都搞不清楚;然而小区门卫大爷养的那只你偶尔会喂喂食的猫,却经常在你路过的时候跑到脚边打滚,然后把它白绒绒肚子露给你看。渐渐地,你知道了,那原来是要求你逗弄它的意思。
你不是猫,也不知道为什么,然而你就是知道了——知道了猫咪打滚露出肚子的行为是向你表达亲昵和要求玩耍的意思。
以上都可以归结到文化人类学中所谓的异文化体验。即身处于一个迥异自己文化的环境中,用自己本文化中习得的东西去观察、交流、揣摩,以达到了解、甚至是理解对方文化的过程。实际生活中的异文化体验并非只有在踏入异国他乡或者与其他民族交往这些极端情况下才会发生。例如《红楼梦》第三回中“贾雨村夤缘复旧职 林黛玉抛父进京都”中有这样一段描写:
寂然饭毕,各有丫鬟用小茶盘捧上茶来。当日林如海教女以惜福养身,云饭后务待饭粒咽尽,过一时再吃茶,方不伤脾胃。今黛玉见了这里许多事情不合家中之式,不得不随的,少不得一一改过来,因而接了茶。早见人又捧过漱盂来,黛玉也照样漱了口。洗手毕,又捧上茶来,这方是吃的茶。
林黛玉初进贾府,尚不知贾府上下的规矩。倘不是林黛玉小心谨慎观察,看见漱盂明白方需漱口,否则差一点将漱口水当茶水喝掉,又会徒生多少波折。这也算是一种异文化理解体验
与外星文明的异文化接触一般来说“更先进“的文明对于“更落后”的文明的异文化理解往往来得更容易,因为前者具有更系统的科学通识教育、更完备的逻辑思维训练和更少的社会定势等优势。正如先前的例子,我们很容易理解一个土著部落的祭祀行为,然而一个土著部落的成员如果目睹了“身著紧身衣、头戴耳机,在健身房的跑步机上挥汗如雨的女性”的画面,要理解起来,恐怕更困难一些。同理,一个能进行星际旅行的种族,相对于人类的发展水平来说毫无疑问是“更先进”的文明。我们丝毫没有理由不认为,可以将这种异文化理解套用到外星人与地球文明的接触上。或许此前这些外星人从没有见过他们游历过的星系文明中会有生物听音乐,或许对外星人来说音乐也好、声波也好,是一种只会让他们的鳞甲产生瘙痒感觉的东西。甚至他们或许会觉得海顿、贝多芬、莫扎特的所谓“音乐”让鳞甲瘙痒而刺痛,人类汽车发出的嘈杂鸣笛声却让这股瘙痒有种轻微震颤般的愉悦,而人类划过黑板的刺耳振动则让一片片鳞甲彼此伸展到最舒服的45°角度。他们或许还会在星际旅行日志中对人类的听音乐行为记下有趣的一笔:“我们在蓝星上发现了一种有益的痒痒挠方式 。我们麻醉了一个成年雄性实验对象,并从试验对象的身旁找到了一块充斥着落后科技的长方形六面体的远距离电磁波传输设备——遗憾的是,这种传输设备只能在蓝星的近地表空间内通讯。通过读取设备(很显然,他们还使用着落后的二进制编码方式),我们在其中找到一首人类语言叫做《爱情买卖》曲子。根据我们的试验。。。。。。很明显,人类对于这种他们自称为“动次打次”的东西有很强的耐受性。。。。。。”
所以,有一天当我们人类的飞船驶向星辰大海,和也听音乐的外星文明接触时,他们的音乐会是什么样的呢?
问题4:哇,我居然马上想到了这首歌:
问题4不过是某种程度上对问题1的一个回应,大部分人问题1和4的答案都有一定关联。而且,这是有心理意义的!不管是突然想出一首喜欢的歌,还是不同的人对不同的风格音乐的偏爱、甚至是只对同一首音乐的某一个特定的演奏版本有特殊的喜爱,其背后都是有心理意义的。在咨询圈里,就有老师专门进行K歌心理工作坊这方面的工作。这些特殊偏好,往往与个人的独特体验以及心理情结有关。背后的原理,可写出来的太多太多,以后单独撰写成文,这里不过多的说明。
现在再次回顾第1个问题:
1.当我在听音乐的时候,我听的是: 属于我自己的体验。
体验是心理学和心理咨询中的万能词汇,涉及到个体经历的独特性与差异性时,用“体验”这个词就可以笼统带过。听音乐大略有三个体验层次:
1.听觉以及感官的联觉
有一天,你偶然打开一首音乐,记忆却倏忽回到了那年夏天,眼前浮现出了“和最亲爱的达令依偎在一起,在大明湖畔看星星、看月亮,一起从诗词歌赋说到人生哲学,简直幸福得快要满出来了”的画面;鼻腔中好像传来了阵阵似有似无的幽荷清香;皮肤好像被夹杂着泥土湿润气息的微风抚弄;胸腔中自然而然涌蹦出一股暖意;四肢五骸都酥得好像要化掉了。
这就是第一个层次的体验,纯生理的引发——连巴甫洛夫的狗听到摇铃,也都会不由自主的流下唾液。
2.音乐技术层面及文化背景的欣赏
上文提到大部分人都有听音乐产生画面感的经历。然而有个很老的段子,说音乐专业从业者在听到一段的音乐时,才不耻于说眼前好像看到一副什么什么画面。相反,他们听到的总是动机、主题、织体、写作及配器技巧——也算是实实在在地道出了音乐技术层面的体验。同样,一个资深票友在听到某名角儿的唱段,也会不住叫好,并反复体味其身段、唱腔、念白的妙处。在外行看起来,则好像吞一碗没盐没酱油的白水煮面,不光无法下咽,那股黏糊的面浆儿还让人直犯恶心。
如果说音乐技术层面上的储备是一招一式的外功;那听音乐背后的文化底蕴积淀则是实打实的内功。听《小苹果》、《PPAP》这些网络神曲或许不需要什么文化积淀。然而欣赏歌剧唱段《晴朗的一天》,则需要知道什么是咏叹调,需要知道《蝴蝶夫人》讲述的是什么故事,需要对那个时代的男性沙文主义情结及日本民族的自裁情结有一定了解,甚至需要结合《图兰朵》来理解当时的欧洲人对于东方的神秘臆想。
不过,在快餐文化下,这种正襟危坐的360度背景论证式听音乐方式,还真是只有小部分人才有资格的享受~
听——个体心理体验3.个体心理体验
所谓个体心理体验有两个方面。
一是共性心理体验,即不同人听到后会产生相同或相似的体验。例如即便毕业多年,听到《第二套广播体操》的时候,不少人在那一瞬间会恍恍惚惚红红火火好像回到中学时代课间操的情形,这种共性体验是情景记忆体验。再譬如,很多小伙伴表示《听妈妈讲那过去的事情》歌词中那句“我们坐在高高的谷堆旁边,听妈妈讲那过去的事情“,都曾经错听成过“我们坐在高高的骨灰旁边,听妈妈讲那过去的事情”,这种共性体验则是源自死亡焦虑的投射。
二是个体的独特心理体验,即每个人与其他人不相同的心理体验。限于本文篇幅,最后再试举一例说明何谓个体的独特心理体验:
圣咏(Chant,其代表为格里高利圣咏Gregorian Chant,即公元六世纪时期教皇格里高利命人搜集整理的包含约3000首唱经歌曲的声乐曲集)作为中世纪基督教的一组仪式音乐,这种无伴奏的单声部声乐在简单贫乏的旋律、拖沓缓慢的节奏中,每一个拉丁文歌词的每一个音节可以唱一个甚至十数个音符。无基督信仰的朋友兴许难以按捺住耐心听完一场弥撒中的所有音乐(有兴趣的朋友可以在网上搜索听听,有一种.......嗯,催眠的效果)。可在宗教虔诚人士听来,却能获得精神上的安宁与祥和。教堂建筑结构对声波的反射造成的回响效果,更是能激发信徒内心中的无限朝圣感,并得以精神的升华。
总结
本文开头故意引出的几个问题,分别粗浅地从个体体验、理性主义及人类学角度抛砖引玉,引发大家对听音乐行为的思考。对于开头提出的四个问题,本文既没有,也不准备给出完备的答案。需知开放答案,成就奇葩青年。
至于对不同风格音乐,乃至某一歌曲/乐曲的特殊偏好,其背后都掩埋痼结着一定的心理情结意义。笔者作为拖延症晚期患者决心就此话题挖坑再写一篇文章。So,且听下回分解~
参考文献
李国彰.生理学[M].人民卫生出版社,2004: 349-353.
Wikipedia.Definition fo music[EB/OL].Http://en.wikipedia.org/wiki/Definition_of_music
曹雪芹,高鹗.红楼梦[M].巴蜀书社,1995:24.
Craig Wright.聆听音乐[M].北京:生活·读书·新知三联书店,2012:76-77.
我是Dr.Roar:
一个娃娃脸的中医医师
一个致郁系负能量的心理咨询师
一个套路深又多的文艺男
一个专注自我陶醉的资深单身狗
╮(╯_╰)╭
网友评论