GAN,即生成对抗网络,是社交媒体人工智能算法的新星。它创作了第一幅在艺术拍卖会上售出的 AI 画作,还恶作剧地将名人的脸叠加在色情明星的身体上。它们的工作原理是,让两个神经网络相互对抗,并根据它们所“摄食”的东西产生真实的输出。给它很多的面孔,它就可以创建新的面孔。

麻省理工学院-IBM 沃森人工智能实验室的研究人员意识到,尽管 GAN 因为恶作剧而名声不好,但也是一种强大的工具:因为它们能描绘出它们“思考”的东西,它们可以让人类洞察神经网络是如何学习和推理的。这是更广泛的研究团体长期以来一直在寻求的东西——随着我们对算法的依赖日益加深,它会变得越来越重要。

“对我们来说,这是一个了解网络试图重建视觉世界时所干的事情的机会。”参与该项目的麻省理工学院博士生戴维·鲍(David Bau)说。

于是研究人员开始研究 GAN 的学习机制,给它“喂食”各种风景照片——树、草、建筑和天空。他们想看看它是否能在未被明确告知如何做的情况下自己学会将像素组织成合理的群集。

令人惊讶的是,随着时间的推移,它做到了。例如,通过打开和关闭不同的“神经元”,让 GAN 描绘它的想法。研究人员发现了不同的神经元簇,这些神经元簇已经学会了代表一棵树或草,而其他的簇代表墙或门。换句话说,它已经成功地将树像素与门像素分组,而不管这些对象在训练集中如何改变颜色。

“这些 GAN 正在学习的概念非常接近于人类赋予单词的概念。”鲍说。

不仅如此,GAN 似乎还知道根据图像中所描绘的墙的类型来绘制相应的门。它会在带有格鲁吉亚建筑风格的砖砌建筑上画一扇格鲁吉亚风格式的门,或者在哥特式建筑上画一扇石门。它还拒绝在天空上画任何门。GAN 不知怎么就掌握了一些关于世界的不言而喻的真理,没有人教它。

这对研究团队来说是一个重大的启示。“常识的某些方面正在显现,”鲍说。“目前还不清楚是否有任何方式(通过深度学习)学习这种东西。这可能表明,深度学习能比我们之前认为的更接近大脑的工作方式——尽管这与人类的智力水平还相去甚远。”

据鲍介绍,一些研究小组已经在处理其他类型数据的网络中发现类似的学习行为。例如,在语言研究中,人们发现了复数词和性别代词的神经元簇。

能够识别哪些集群对应于哪些概念使得控制神经网络的输出成为可能。鲍的小组可以只打开树的神经元,例如,让 GAN 画树,或者只打开门的神经元,让它画门。同样地,语言网络也可以通过操纵来改变其输出,比如从一种语言翻译到另一种语言时交换代词的性别。 “我们开始使人们能够进行干预以产生不同的结果。”鲍说。

该团队现在已经发布了一款名为 GANpaint 的应用程序,可以将这种新功能转化为一种艺术工具。它可以让你打开特定的神经元簇来绘制草地上有很多门的建筑场景。除了作为一种好玩的事情外,它还说明这项研究有更大潜力。

“人工智能的问题在于,让它为你完成一项任务,你就给了它极大的信任。” 鲍表示,“你给它输入,它就会——这是一种‘天才’思维——给你一些输出。即使你有一个非常聪明的人类专家,这也不是你想要和他们一起工作的方式。”

使用 GANpaint,您可以开始揭开黑盒子的盖子,并建立某种关系。“你可以弄清楚如果你这样做会发生什么,或者如果你那样做会发生什么。”应用程序的创始人亨德里克·施特罗布特(Hendrik Strobelt)说,“只要你能玩这个东西,你就会对它的功能和边界有更多的信任。”

【数字叙事 原作:Karen Hao;编译:Lighting】