我们曾说过,自动写作对于人工智能研究者和开发者来说是个巨大的诱惑,如果是喜欢文学的研发者,这诱惑会更大:莎士比亚写了一堆喜剧、悲剧,还有诗歌,他不用写这些,他只要写个莎士比亚——可能比他更出色。研发者的努力和成就已经验证这一诱惑下的作为并不是胡闹。目前,AI 已经能够写出简短的诗句散文,甚至能生成小说

据 Venturebeat 报道,在预印服务器 Arxiv.org 上发表的新论文《自主俳句一代》(Autonomous Haiku Generation)中,斯坦福大学的学生 Rui Aguiar 和 Kevin Liao 披露了另一项成果:让一个机器学习系统在给出俳句的第一行时生成后面两行。

“写诗作为一种创造性的尝试,无论以何种能力水平,都很难把握和实现。”论文写道,“我们的任务是使用人工智能和深度学习来生成高质量的俳句。”

让 AI 模型模拟创作并非易事。Rui Aguiar 和 Kevin Liao 一开始的目标是创作短歌——一种由五行组成的日文诗歌(第一行和第三行有五个音节,其他的七个)——但这种形式的诗歌篇幅较长,缺乏合适的语料库,这迫使他们改变思路,选择了更短的俳句。

这个研发团队的俳句生成工作始于样本集的搜集,包括从电子文本档案 Bartleby 中抓取和解析几百首诗歌。但是他们很快意识到这需要一个更大的数据集,所以他们从流行的诗歌网站上搜集了有 8000 首俳句的开源俳句集。

在模型设计上,研究人员选择使用长短记忆(LSTM)网络——一种能够学习长期依赖关系的 AI 架构——来捕捉单词预测的上下文来进行后续预测。具体来说,他们从俳句的第一行中选取一个滑动窗口中的单词,并用它来获得下一个单词的概率分布。在向概率中加入数学噪声后,他们选择概率最高的单词,并在开始下一行之前选择一个行尾单词。

为了测试人工智能系统的能力,研究人员招募了 8 名人类评价者,让他们在单盲试验中,对 AI 系统的诗句与基线诗句一起进行打分。结果表明,虽然 AI 俳句可能不会出现在 IAFOR 弗拉基米尔·迪维德奖的候选名单中,但连贯性比预期的要好。这无疑证明了人工智能在模拟创作上的潜力。

“我们发现,在大多数情况下,递归神经网络是生成文本最有效的方法。”研究人员在论文中写道,“虽然我们在诗歌的质量上只有一些细微的变化,但我们能够使用 RNN 生成连贯而有意义的诗歌,其水平要比其他方法高得多,也更连贯。”

我的一位作家朋友经常调侃地问我:“人工智能又写了什么?”编译的这篇文章将首先发给他。虽然他很藐视目前的一些 AI 作品,但对 AI 创意研究却十分关注,因为他认为 AI 对创作的模拟,能让我们从新的角度认识语言符号的运作,进而在符号学的基础上发展对文学和艺术创作的新描述,甚至发掘新的文学艺术形式。

【数字叙事 Lighting】