Facebook开源深度学习框架Pythia

可用于快速构建图像和语言AI模型

0

Facebook 人工智能研究部门宣布开源 Pythia,这是一个模块化的深度学习框架,使数据科学家能够快速构建图像和语言 AI 模型。现在该框架已可以在 GitHub 上免费获得。

根据 Facebook 在一篇博客文章中所作的解释,Pythia 建立在公司的 PyTorch 机器学习框架之上,主要用于视觉和语言任务,比如回答与视觉数据相关的问题和自动生成图像标题。还支持分布式培训和各种数据集,提供并解释具有常用视觉层和语言层实现的模块,以及对分布式培训的支持;内置的语料库包括 VQA、VizWiz、TextVQA、VisualDialog;以及像多任务处理这样的功能,可以同时训练多个语料库。

Facebook 表示,它将在 Pythia 最初的开源版本的基础上进行扩展,包括即将发布的工具、任务、数据集和参考模型。其研究人员在博客文章中写道:

“Pythia 使进入视觉和语言这个不断增长的子领域的过程变得更加顺畅,也让研究人员可以专注于更快的原型设计和实验。我们的目标是通过增加这些模型和结果的可重复性来加快进展。这将使社区更容易在成功系统的基础上构建并进行基准测试。我们希望消除一些障碍将使研究人员能够更快地开发出人类和智能机器交流的新方法。这项工作还应该帮助研究人员开发出适应性人工智能,将多种理解综合为更基于上下文的、多模式的理解。”

【数字叙事 黎雾】