谷歌的人工智能(AI)音乐创作可能短时间内达不到莫扎特或李斯特的水平,但最近取得的进展却令人惊喜。据谷歌大脑项目“探索机器学习在创意过程中作为一种工具的作用”的 Magenta 项目研究人员在一篇博客文章和随附的论文《音乐转换器》中所作的描述,他们研发和训练的一个名为“音乐转换器”(Musical Transformer)的机器学习模型已经能够产生风格相对一致的乐曲和可辨认的重复旋律。

创作较长的音乐对人工智能是一个很大的挑战,因为它的结构复杂;大多数歌曲包含多个主题、短语和重复,神经网络很难理解这些。虽然之前的研究成功地在人类作品中引入了一些可观察到的自我参照,但它依赖于绝对的时间信号,因此不太适合跟踪基于相对距离和重复间隔的主题。

转换器作为一个基于自我关注的序列模型,已经在许多需要保持长期一致性的生成任务中取得了令人信服的结果。谷歌的研发团队意识到,自我关注可能也非常适合音乐建模。他们研发的音乐转换器是一个“基于注意力”的神经网络,可以直接创建“富有表现力”的表演,而无需先生成乐谱。通过使用基于事件的表示和一种称为相对注意的技术,音乐转换器不仅能够更多地关注关系特性,而且能够超越它所提供的训练样本的长度。而且由于它的记忆强度较低,它还能产生更长的音乐序列。

在测试中,音乐转换器基于肖邦的《黑键练习曲》,创作了一首风格一致的乐曲,其中包含了来自主题的多个短语。而之前的两种算法——Performance RNN 和 Transformer——只提供相同的引物,要么完全缺乏可识别的结构,要么无法维持结构。

该团队承认,音乐转换器远非完美——它有时会创作出重复太多、片段稀疏、跳跃古怪的曲子——但他们希望它能成为需要灵感的音乐人的缪斯。“这为用户提供了一种可能性,他们可以指定自己的起点,并将该模型作为一种创造性工具,探索一系列可能的延续。”研究人员写道。

研究人员还在博客中透露说,音乐转换器的训练和生成代码即将问世,其中包括经过训练的检查点。

【数字叙事 Lighting】

1条评论