人工智能在绘画和雕塑方面的表现越来越让人惊讶。在 Arxiv.org 上新发表的一篇论文(《LPaintB:在自我监督中学习绘画》)中,Adobe 研究院和马里兰大学的研究人员描述一种新的机器学习系统——LPaintB——能够在不到一分钟内重现达芬奇、梵高、维梅尔的手绘油画风格。

据论文描述,研究人员构建了一个智能绘画代理,它可以用一系列绘画动作以相同或转换的样式再现参考图像。

研究人员的方法是利用自我监督学习,其中未标记的数据与少量标记数据结合使用以提高学习准确性,从而在有限数量的参考图像上从头开始训练代理。通过数学建模系统的动作状态(即画笔配置,如长度,方向和画笔大小),并通过将故障的目标状态替换为最终状态,团队生成了一个带有正奖励的配对语料库,并将其提供给 AI 模型使得它学会了以所需的艺术风格绘制参考图像。

研究人员指出,通常情况下,系统采样的行为中只有一小部分具有积极的回报。他们使用一种强化学习技术来解决这个问题,该技术使用目标状态作为配对数据来训练策略(针对状态的一组行为)。但是生成的策略并不是特别有效,因为用于训练它的成对数据只包含具有正面奖励的操作(这使得从返回负面奖励的不希望的操作中恢复变得困难)和连续一系列操作的结果的状态。解决这一问题需要再次强化学习:它为有助于推广模型的行为添加了噪声,并通过奖励优化了模型的行为。

最终的结果是得到了一个 AI 框架,它可以执行带有描述笔画大小、颜色和位置信息的参数的绘画动作,并相应地更新画布,使用奖励函数评估当前状态和目标状态之间的距离。为了编制训练数据集,研究小组从参考图像中随机抽取不同尺度的特定样式的补丁,并将其采样到固定大小。他们将这些数据输入模型,经过一个小时的训练,该模型能够在一台装有 16 核处理器和 Nvidia GTX 1080 图形芯片的个人电脑上,在不到一分钟的时间内,以 20,000 笔画复制出 1000 x 800 的图像。

研究人员指出,训练模型的泛化高度依赖于训练数据,他们的方法基于一个相当基本的绘画环境。但他们表示,自我监督和强化学习相结合,极大地提高了策略的效率和性能。该团队接下来将继续工作,优化笔刷大小、颜色和位置等笔触参数,构建一个基于模型的强化学习框架,该框架可以构建到绘画模拟器中。

【数字叙事 黎雾编译】

1条评论