Nvidia 推出了一款名为 Megatron 的全新语音 AI,能更好地理解自然语言、编写文本和用语音与人对话。Megatron AI 的内核基于 OpenAI 的GPT-2构建,据说性能达到了 GPT-2 的四倍。

凭借极高的处理能力,Nvidia 将语音 AI 的训练时间从几天缩短到不到一小时。此外,语音 Ki 通常的响应时间已从 40 毫秒减少到大约 2 毫秒。藉此,聊天机器人可以更快地对问题做出反应并更流畅地与人进行交流。

为了防止被滥用,Nvidia 并未发布经过训练的 Megatron AI,目前所发布的是作为观察对象的未经训练的 KI 代码。Megatron 可以用这段代码来重建,但它需要较高的计算能力;Nvidia 指定 512 图形卡芯片作为训练 Megatron 的最低要求,而该公司内部对 Megatron 的训练是在一台 1.472 芯片的超级计算机上进行的。

Nvidia 希望通过受过训练的 Megatron Ki 聊天机器人和 Alexa 等语言助手来对这一技术改进,目标是推动语言 AI 更进一步,使人们能够与之进行更可信的对话。

Nvidia 在 AI 创意上的研发不仅在文本和语音方面,今年早些时候,这家芯片制造商推出了 KI GauGAN,它能将用户涂抹的色彩转变成照片级的风景或大气层的景观。《星球大战》艺术家 Colie Wertz 用 KI GauGAN 描绘了外星世界。

【数字叙事 黎雾】

1条评论

  1. […] OpenAI 原是一家非盈利机构,自去年微软的资本加入后,该机构开始在经营方面活跃起来。他们最著名的产品GPT-2被称为革命性的人工智能写作模型,能够撰写以假乱真的故事和仿写名家小说。GPT-2 目前已被应用于文本写作、文字游戏和智能语音等领域。该机构将促进人工智能造福人类作为自己的终极目标。 […]

    0