我预计下一个目标肯定不仅仅只是音乐。音乐只是人工智能进军的领域中的一个小分支罢了。然而我并不会抵触,相反十分会期待AI能对音乐创作产生什么影响。
首先纠正下题主,音乐并不是“有限元素”的组合,而是无限元素的组合。举两个例子:
1)4/4拍下,仅仅考虑一个小节里全由16分音符和16分休止符可以组成的节奏型,就有那么多。而如果用一个八度的C自然大调的音符在这么多节奏型里随机组成旋律的话,可能性是。如果考虑到这其中有长音符有短音符还有连音线的话,那么一共有大约种情况。可能有人觉得这个数目不大,然而这还仅仅只是一个八度下、仅仅是C大调的,基础音型为16分音符的一个小节里的旋律情况。考虑到音色、速度、三连音、奇数拍、更多的调性、离调以及微分音等等等等。音乐的可能性就算不是无穷尽,其实也差不多了。
其次还是要反对一下所谓“人类有情感,机器无法理解情感所以无法作曲”之类的说法。据我所知,IRCAM很久之前就已经作出了根据人类的情感一键生成ambient sound的程序了,比如agitation,pessimistic,neutral等等。虽然人类对不同的音乐的好恶和感受不一样,然而人类的反应却有一些相似性,比如听到百老汇Big band,就会想要翩翩起舞;听到《辛德勒的名单》的主题,大多数人也会觉得伤感;听到汉斯季末为《蝙蝠侠》创作的配乐,大多数人也会觉得热血澎湃;听到《Psycho》的配乐,大多数人也会觉得不舒服。在大多数应用音乐领域,人类所起到的作用和翻译差不多,或将画面翻译成音乐,或将无法表达的情感用音乐表达出来。这也是电影配乐行业存在的原因,即用音乐来表达人类语言之外的“情感”。这些情感却是可以被公式化和模板化的,这也是为什么音乐制作,电影配乐产业可以分工合作形成流水线作业。而只要是能被总结,能公式化和模板化的东西,AI一定是可以胜任的。比如之前在另一个答案(为什么科技的发展没有使电子乐器超越传统乐器的地位? - Molho 的回答)中提到的“管弦乐器音色隐喻”就是一种非常经验化的东西,要表现孤独,可以用大混响加solo;要情绪低沉,可以在largo下使用向下的旋律或者是大跳下行;要表现激动,可以在presto的基础上加入大量的管乐,连续快速上行的弦乐以及打击乐等等。而且不仅仅是配器,和声、对位中也有很多的可以被总结成经验和被公式化的知识。所以,要让AI创作出“富有感情”的音乐,并不是一件非常困难的事情。我觉得可以预见的是,在将来某一天,哪怕是学了20年音乐的音乐专业博士,也难以分辨出一段音乐是由“AI”创作的还是由“人类”创作的。
上学期做过一个非常粗糙的generative music即音乐自动生成器的小软件,算法是非常简陋的完全probability based。然而就是这么粗糙的东西,只要音色合适,节奏合适,音阶合适,也还是能模仿出一定风格的特征的。所以有理由相信,只要完善算法,给予AI足够多的数据,并且能得到足够多的评价,AI肯定是可以创作出优秀的乐曲的。
再次,要反对一下“AI超越人类”的论调。“AI超越人类”只适用于规则明确,且以结果的胜负(或者评分)为导向的领域,比如各种棋类。对于艺术,人类至今没有统一论调,不同的音乐风格之间是没有高下之分的,更不存在“超越”一说。就像摄影对古典绘画的冲击一样,AI对音乐产业的冲击肯定是有的,但是却不会摧毁这个行业,而是促使这个行业转型。我们可以说,在未来,AI在某个音乐的技术领域(比如自动检查平五平八→_→)上超越了人类,然而却不能说AI超越了人类。举个例子:虽然不同的音乐家、作曲家技法和技术之间有高下,我们说“周杰伦的钢琴水平不如朗朗”,是因为钢琴有一套成熟的评价体系,然而类似“朗朗超越了周杰伦”,或者是“巴赫(可以换成贝多芬、莫扎特、勋伯格、约翰凯奇)是最伟大的作曲家”这样的论调通常是不靠谱的。每个人都有其独特的风格和气质,这种气质可以被AI模仿和被学习,然而不同个体之间的特质差异并不会存在一个一刀切的标准来判定其好坏,这个也是艺术和工业最大的区别。我们人类尚且无法超越人类,遑论AI?
最后,要问我怎么看AI对音乐的冲击。我觉得很有可能就像工业革命对手工业者的冲击一样。音乐作为一种展现个人气质的艺术,每个音乐人提供的服务都是略有差异的,也算垄断竞争的一种了。然而就像优秀的手艺人并没有随着机器的出现而消亡,他们的手工制品由于社会必要劳动时间长,供给量减少,价格反而有所上升一样。作曲也是一样,在AI的帮助下,未来应该每个人都有能够作曲编曲的能力,即使什么也不懂,也能自己做一些曲子。然而最优秀的那一批音乐人应该就像古老的手艺人一样,依靠提供差异化产品,继续获得高额回报。