Facebook人工智能研究院最近推出一个深度学习框架Pythia,支持视觉和语言领域的多任务处理,采用模块化的即插即用设计,能够帮助使用者快速构建、复制和基准人工智能模型。
Pythia建立在PyTorch之上,具有以下特点:
1、Model Zoo:最先进的视觉和语言模型的参考实现,这些模型包括 LoRRA(SoQ on VQA 和 TextVQA)、Pythia模型(VQA 2018 挑战获胜者)和 BAN。
2、多任务:支持多任务,允许同时训练多个数据集。
3、数据集:包括对内置的各种数据集的支持,如 VQA、VizWiz,TextVQA 、VisualDialog 等。
4、模块:为视觉和语言领域中的各种常用图层提供实现方式。
5、分布式:支持基于 DataParallel 和 DistributedDataParallel 的分布式训练。
6、Unopinionated:对基于它构建的数据集和模型实现不受任何影响的功能。
7、定制化:包括自定义损失、指标、调度、优化器、张量板等。
Pythia使得进入视觉和语言子领域的过程变得更简单,也使研究人员能够专注于更快的原型设计和实验。通过提高这些模型和结果的可重复性来加速研究进程,将使得社区更容易成功构建系统并进行基准测试。
网友评论