候世达:如聆巴赫

翻译自: Sounds Like Bach

在我还年轻时 — 也就是写下《哥德尔、艾舍尔、巴赫》那时 — 曾问过自己这么个问题:“计算机程序会有写出优美音乐的那一天吗?”然后做出了如下推断:“计算机作曲程序在很长一段时间内不会产生什么有新意的成果……‘我们就快能用一台批量生产的二十块钱邮购获得的预置程序桌上型音乐盒子中那贫乏的电路写出肖邦或巴赫假如活到今日将写出的曲子’ — 这种念头,哪怕只是想一想 (事实上我的确听人如此提过),也已是对人类心智深度的一种荒诞可耻的误估。”那时我的调子就是如此这般。

四分之一个世纪之后,我是如何看待这种推断的呢?说不准。这些问题已困扰我多年,直到现在还是没找到一个确定的解答。 1995 年春,我偶然发现了 David Cope 的《计算机与音乐风格 (Computers and Musical Style)》一书,他是加州大学圣克鲁斯分校的一位教授。在书中我注意到了一首模仿肖邦风格的马祖卡舞曲,它是由 Cope 的 EMI (“Experiments in Musical Intelligence (音乐智能实验)”一词的缩写) 程序所谱的。之所以能引起注意,是因为作为毕生的肖邦爱好者,我觉得没什么伪托肖邦的曲子能骗过我的眼睛。所以我直接在钢琴上即兴把这首 EMI 马祖卡反复弹了好些次,每弹一次,我的困惑与惊讶便增加一层。

尽管能间或能听出些小瑕疵,这首曲子还是给我留下了深刻的印象,因为它似乎在“倾诉”着什么。如果谁告诉我它是出自人手,我绝不会怀疑它的表现力。这首曲子听来有些怀旧,带点波兰味道,而全无抄袭嫌疑。它是崭新的,而又毫无疑问地刻上了“肖邦风格”的烙印,却不令人觉得情感空乏。我的的确确受到了震撼:抒情的乐曲怎么能从一个从未听过一个音、从未活过一秒钟、从无一丝一毫情感的程序中写出来?

越是纠缠于此,我就越是困扰 — 但也越是为之着迷。这里确实有个不符情理的矛盾,狠狠将了我一军。但我不会就此拒绝承认,认为 EMI 无关紧要或缺乏乐感,不然这只能说明我的怯懦心虚而已。我要直面矛盾,与这个怪异的程序奋战到底,因为它动摇了早在我内心深处的信念:关于音乐的神圣地位的信念、关于音乐是人类灵魂的终极圣地的信念。这也是人工智能在奔向思维力、洞察力与创造力之前的最后障碍。

如果我只是看过 EMI 的架构而未听过任何它的产出,我肯定不会把它放在心上。尽管 Cope 在 EMI 上花的功夫比大多数人工智能研究者在任何项目上花的功夫都要多得多,EMI 的基本原理在我看来并不新鲜,甚至显得没什么前途。颠覆我看法的是 EMI 所谱的曲子。

后续的几个月里,我在美国和加拿大的许多地方做了关于 EMI 的讲座,令我大为惊讶的是,几乎没有几个听众对 Cope 模拟艺术创造力上的这一妙着感到沮丧,几乎没有谁感到威胁或担忧。反之,我却觉得某种能显示人类深邃思维的崇高性不复存在了。对我来说,不仅丢脸,还很可怕。

EMI 中最深层次的原理是被 Cope 称作“重组音乐 (recombinant music)”的原理 — 从一名作曲家的作品中识别出不同类型的重现结构,然后以新的排列来复用这些结构,依此产生一份“同样风格下的”新作品。你可以想象 EMI 在学习了贝多芬的九首交响曲后,自行谱出《贝多芬第十交响曲》的情景。

给定几个输入作品的情况下,EMI 的核心手法是这样的:

(1) 分解;(2) 重组。

当然,有许多重要的原理会限制什么段落可以跟在什么后面,这些原理都被公式化确定下来以保证乐曲的连贯。我可以总结出如下两条规则:

(1) 局部的音调转合模式应类似原作; (2) 全局的片段排布应类似原作。

这两条规则也可以转化为在解决拼图游戏时经常利用的两类限制:

(1) 每块拼图的形状必须与邻接块紧密啮合; (2) 每块拼图上的图案必须在整个图片的大环境下有意义。

前一条限制可以被刻画为“语法啮合”,或者仅根据“形式”构造的啮合,而后一条则可以刻画为“语义啮合”,或者仅根据“内容”构造的啮合。单看其中任何一个都平平无奇,可一旦组合起来,它们就能成为一套非常强大的限制。

篇幅所限,这里我无法详述 EMI 中各种错综复杂的构造,它们被用来吸收风格元素、执行 Cope 编制的多层“重组”。

在我关于 EMI 的讲座中,几乎每次都会让听众先听上一组双音小节,事先告知它们其中至少有一个是巴赫所作,也至少有一个是由 EMI 仿巴赫所作,然后由他们尝试找出其归属。听完之后我会让听众投票,通常大部分的听众能认出真正的巴赫作品,但通常也只是 2/3 的听众选对,还有将近 1/3 的人错了。而且选错的并非总是那些缺乏经验的听众。

EMI 在进化着 — 它不是一个固定的目标。Cope 是从 1981 年开始开发这个程序的,多年以来他并未停止。EMI 的早期作品就像任何作曲新手的一般稚嫩,可后来的作品就越来越令人难忘,Cope 也随之对它有越来越高的期望。一开始他只是满足于 EMI 创制的短篇二部创意曲和短篇马祖卡,但现在他已经开始让 EMI 谱写整部整部的奏鸣曲、协奏曲和交响曲了。EMI 甚至还在编写一部叫“马勒”的歌剧 — 这可是对人类作曲家来说都极富挑战性的工作。

毫无疑问,风格是一种多层次的现象。对风格的认知有深有浅,仅抓住一个作曲家的浅层习惯而忽略掉某些内在神髓是完全可能的。所以,在听到一段音乐,认出其中某些手法和以前听过的甲作曲家的手法相似,从而自行声称“这听起来像甲的作品”的时候,我们又受到了多大的欺骗呢?我们到底能不能清楚地区分浅层感应与深层体会?说实话,音乐的“浅层风格”与“深层风格”、“语法”与“语义”、“形式”与“内容”之间到底有什么区别?甚至到底有没有区别?

在讲座中,我通常还会加上一段插曲,这次涉及马祖卡舞曲了 — 一首肖邦加一首 EMI。有一次我在纽约州罗切斯特市,世界著名的 Eastman 音乐学院做这个讲座,几乎所有的作曲与音乐理论教员都上了 EMI 马祖卡的当,把它当成了货真价实的肖邦 (相形之下,真正的肖邦作品却被当成了计算机仿冒的小调)。一位 Eastman 的音乐学生,Kala Pierson 就此给我发了一封电子邮件,她说:“和大多数朋友一样,我把第二首作品当成真正的肖邦。在你宣布第一首是肖邦的而第二首是 EMI 的那时,我们都倒抽了一口凉气,它带来的后果是一种快乐的恐慌,我从来没见过这么多理论家和作曲家的矜矜自得转眼间被扫得一干二净 (当然也包括我自己的),它真是美轮美奂。”

我在罗切斯特的讲座中 (事实上也是从所有关于 EMI 的讲座中) 得到的震撼是,有着深刻音乐天分、经过长年训练的人也有可能偶尔把 EMI 的作品当作真品。要记得 — 我们这才刚刚起步,我们人类才刚刚开始把“批量生产的二十块钱邮购获得的预置程序桌上型音乐盒子”这样的梦想付诸现实,这种盒子就是在我写《集异璧》时曾嗤之以鼻的“贫乏电路”上构建而成的。

再经过二十年的努力工作后我们能到达什么境界?五十年呢?2084 年那时的顶尖水平又会是怎样的?到那时还会有人能区分真伪吗?谁会知道、谁会关心、又有谁会大声呼吁风格最核心的那微小的一点还没有被达到 (也永远达不到)?一旦巴赫、肖邦们广受赞誉的崭新杰作,如尼亚加拉大瀑布的流水一般从硅晶电路上涌出时,又有谁还会关心这样琐屑的细节?这样奇妙的一个新的音乐黄金时代,难道不该是“美轮美奂”的吗?

以 Cope 所谓的《普罗科菲耶夫第十奏鸣曲》为例。在 EMI 第一张 CD《Bach by Design》的封套说明中,Cope 写到:“这首由计算机谱写的普罗科菲耶夫奏鸣曲完成于 1989 年,它的谱写灵感来自于普罗科菲耶夫自己完成第十钢琴奏鸣曲的尝试,因其逝世而终止的尝试。所以,这说明了类似 EMI 这样的程序的一个潜在的用途。(即补完未竟作品)”可是对我来说,这样的话不啻渎神。

计算机模拟所令我担忧的,并非在于它暗示了我们自己可能也不过是机器,因为我早已相信了这一事实。困扰我的其实是这样的想法:触及我心灵最深处的东西 — 大部分情况下这指的是音乐作品,我总把它们当作灵魂间直接传递的信息 — 可能可以被简单的机制有效生产出来,这样的机制要比产生人类灵魂的复杂生物机制简单数千倍,甚至简单百万倍。这样的景象由 EMI 鲜明而几乎触手可及地展现在了我的面前,令我产生了巨大的担忧,在这样忧闷的情绪下,我悲观地罗列出了下面三个原因:

(1) (比如说) 肖邦要比我想象的浅薄得多。 (2) 音乐要比我想象的浅薄得多。 (3) 人类灵魂/心智要比我想象的浅薄得多。

让我再略作解释。关于第一点,既然我毕生都为肖邦的作品感动至深,假如 EMI 能一首接着一首地产出“肖邦风格”的乐曲,我将不得不从头回顾我从肖邦音乐中得来的全部意义,因为我将不再相信这样的意义只能来自于人类内心深处,而不得不接受这样的事实:弗雷德里克・肖邦可能只是一个非常流利的艺匠,而不是一位拥有深刻情感的艺术家,一位我从孩提时就确信自己知之甚详的艺术家。

这样的损失会给我带来难以想象的悲痛,但从某种意义上说,上述损失不会比第二点带来的损失更糟,既然肖邦总被我当作音乐力量的代名词。尽管如此,把所有的作曲家统统扫地出门肯定还是比只扫一位要来得困难。

当然,第三点带来的损失将是对整个人类尊严的终极冒犯。当意识到人脑千亿个神经元、将近亿亿个突触连接中所蕴含的全部“计算能力”能被几块尖端水平的芯片超过,而产生有史以来最强大的“艺术大爆发”只需要一块纳米级别的电路板 — 全部这一切一切,不劳费神,全来自于一件没有知觉、视觉、听觉、味觉,不曾活过、死过、奋斗过、痛苦过、成长过、思念过,不曾歌唱过、舞蹈过、搏斗过、亲吻过、期望过、害怕过、胜利过、失败过、哭泣过、欢笑过、爱过、渴望过、关怀过的个体。

尽管 Kala Pierson 和许多其他的人可能会用“美轮美奂”这样的词来欢迎这种个体的来临,可是一旦音乐最终不可避免地被归约为了语法模式和模式本身,按我古板的看法,那会是非常黑暗的一天。


13 Comments

如果程序学会了即兴创作,那时我们再恐慌也不迟~

Posted by sarah on 22 November 2008 @ 11pm

翻译的好快啊,这文章好像前两天才流行起来。不过听了这么久的bach,我一直觉得他的音乐更容易被机器模仿,音乐里有着很明显的模式。如果作者提到程序根据Ravel的Bolero能模拟出什么结果就更有意思了

Posted by Lonelyhunter on 23 November 2008 @ 1am

虽然没学过作曲,但我也相信,作曲和编程一样,它也是很多“模式”的组合,包括“即兴创作”

前两天订了一个Keyboardblues.com的podcast,这是挺令我震撼的,原来我以为blues是多么高难度的演奏,但是在它的剖析下,把复杂的曲子分解了,就像乐高积木一样,blues的创作并不难,真的很奇妙:)

Posted by x5 on 24 November 2008 @ 2pm

一个美女足够动人,和她是试管婴儿还是自然受孕有关系吗?同样一首音乐足够动人和它是由人写出来的还是由电路写出来的有关系吗?再说电路不会被自己写出来的音乐感动吧,人不是母鸡,却知道炒鸡蛋的味道,而母鸡可以吗?

Posted by leon on 4 December 2008 @ 4pm

转基因音乐? 之所以令人惊讶,是因为音乐一直被当作特殊的“语言” 需要审视人类的感知能力进退问题了

Posted by Dayi on 5 December 2008 @ 4am

“亚里士多德从未试图掩饰他对工艺的蔑视。他认为手工艺人的地位类似于奴隶。由于这个原因,根本不可能把手工艺人看作是自由市民。。。自由市民的孩子应该克制自己,不去花太多的精力从事有用的活动,这些活动会把他们拖入手工艺人的层次。因为工艺劳动阻碍了自由市民锻炼德行和使用美德所应该具备的头脑和常识” 亚里士多德是统治阶级的倡导者,不是民主的支持者,所有利益集团都带有自身的局限性,没有一个考虑所有人的利益。在今天,艺术的地位再次得到质疑,艺术间竞争的消失预示人类平等化的开始。

Posted by mengli on 20 April 2009 @ 11pm

即興創作 = random(風格參數(創作者));

風動? 旗動? 心動?

Posted by JonesLai on 25 May 2009 @ 6pm

[...] 但是另一方面,一部人类的文明史,基本上也就是人类的领地不断被人类所发明的机器占领和取代的历史。人工智能和机器学习技术的发展使得让机器程序创作出能够以假乱真的艺术作品早已不是幻想。侯世达,《集异璧》一书的作者,曾经这样描述他在听到并亲自弹奏一首短小精致的钢琴作品后的感受: 尽管能间或听出些小瑕疵,这首曲子还是给我留下了深刻的印象,因为它似乎在「倾诉」着什么。如果谁告诉我它是出自人手,我绝不会怀疑它的表现力。这首曲子听来有些怀旧,带点波兰味道,而全无抄袭嫌疑。它是崭新的,而又毫无疑问地刻上了「肖邦风格」的烙印,却不令人觉得情感空乏。我的的确确受到了震撼:抒情的乐曲怎么能从一个从未听过一个音、从未活过一秒钟、从无一丝一毫情感的程序中写出来? [...]

Posted by 发达数字时代的抒情诗人 | 木遥的窗子 on 1 March 2010 @ 7am

[...] 但是另一方面,一部人类的文明史,基本上也就是人类的领地不断被人类所发明的机器占领和取代的历史。人工智能和机器学习技术的发展使得让机器程序创作出能够以假乱真的艺术作品早已不是幻想。侯世达,《集异璧》一书的作者,曾经这样描述他在听到并亲自弹奏一首短小精致的钢琴作品后的感受: 尽管能间或听出些小瑕疵,这首曲子还是给我留下了深刻的印象,因为它似乎在「倾诉」着什么。如果谁告诉我它是出自人手,我绝不会怀疑它的表现力。这首曲子听来有些怀旧,带点波兰味道,而全无抄袭嫌疑。它是崭新的,而又毫无疑问地刻上了「肖邦风格」的烙印,却不令人觉得情感空乏。我的的确确受到了震撼:抒情的乐曲怎么能从一个从未听过一个音、从未活过一秒钟、从无一丝一毫情感的程序中写出来? [...]

Posted by 发达数字时代的抒情诗人 « 最新最热网页游戏报道 on 1 March 2010 @ 4pm

[...] Jjgod 是国内知名的 Mac 软件开发者,之前也做过网页开发,对字体、TeX 和摄影也颇有心得。更难得的是他也是一个热心的读者,记得 iPhone 上的 Classics.app 推出后,他在博客上评点了其排版上的一些问题,开头大约是这样的(原文为英文,此处我凭记忆转译):「很高兴看到 Classics.app 的面世。这些书的中文版我小时候大都读过,现在能重读英文原版,不亦乐乎。」他翻译过《哥德尔·艾舍尔·巴赫——集异壁之大成》一书作者侯世达的「如聆巴赫」。值得注意的是,Jjgod 在行文时采用了在技术类邮件列表上备受偏爱的「方括号注释」模式。这虽然不符合本站的排版规则,但出于趣味上的考虑予以保留。—— 编者 [...]

Posted by 工具癖系列之 Jjgod - Apple4.us on 29 May 2010 @ 12pm

[...] 但是另一方面,一部人类的文明史,基本上也就是人类的领地不断被人类所发明的机器占领和取代的历史。人工智能和机器学习技术的发展使得让机器程序创作出能够以假乱真的艺术作品早已不是幻想。侯世达,《集异璧》一书的作者,曾经这样描述他在听到并亲自弹奏一首短小精致的钢琴作品后的感受: [...]

Posted by 科学松鼠会 » 发达数字时代的抒情诗人 on 20 October 2010 @ 3pm

[...] 但是另一方面,一部人类的文明史,基本上也就是人类的领地不断被人类所发明的机器占领和取代的历史。人工智能和机器学习技术的发展使得让机器程序创作出能够以假乱真的艺术作品早已不是幻想。侯世达,《集异璧》一书的作者,曾经这样描述他在听到并亲自弹奏一首短小精致的钢琴作品后的感受: 尽管能间或听出些小瑕疵,这首曲子还是给我留下了深刻的印象,因为它似乎在「倾诉」着什么。如果谁告诉我它是出自人手,我绝不会怀疑它的表现力。这首曲子听来有些怀旧,带点波兰味道,而全无抄袭嫌疑。它是崭新的,而又毫无疑问地刻上了「肖邦风格」的烙印,却不令人觉得情感空乏。我的的确确受到了震撼:抒情的乐曲怎么能从一个从未听过一个音、从未活过一秒钟、从无一丝一毫情感的程序中写出来? [...]

Posted by 发达数字时代的抒情诗人 | Imaginary on 20 January 2011 @ 11am

[...] 但是另一方面,一部人类的文明史,基本上也就是人类的领地不断被人类所发明的机器占领和取代的历史。人工智能和机器学习技术的发展使得让机器程序创作出能够以假乱真的艺术作品早已不是幻想。侯世达,《集异璧》一书的作者,曾经这样描述他在听到并亲自弹奏一首短小精致的钢琴作品后的感受: 尽管能间或听出些小瑕疵,这首曲子还是给我留下了深刻的印象,因为它似乎在「倾诉」着什么。如果谁告诉我它是出自人手,我绝不会怀疑它的表现力。这首曲子听来有些怀旧,带点波兰味道,而全无抄袭嫌疑。它是崭新的,而又毫无疑问地刻上了「肖邦风格」的烙印,却不令人觉得情感空乏。我的的确确受到了震撼:抒情的乐曲怎么能从一个从未听过一个音、从未活过一秒钟、从无一丝一毫情感的程序中写出来? [...]

Posted by 发达数字时代的抒情诗人 | David Yu Mao on 26 January 2011 @ 11am

Leave a Comment