Omnidata: A Scalable Pipeline for Making Multi-Task Mid-Level Vision Datasets from 3D Scans
[ICCV 2021]
https://github.com/EPFL-VILAB/omnidata
https://arxiv.org/abs/2110.04994
https://omnidata.vision/
本文介绍了一种从真实世界的全面3D扫描中参数化采样和渲染多任务视觉数据集的管道。更改采样参数可以“控制”生成的数据集以强调特定信息。除了实现有趣的研究线之外,我们还展示了工具和生成的数据足以训练健壮的视觉模型。
在生成的初学者数据集上训练的通用架构在多个通用视觉任务和基准测试上达到了最先进的性能,尽管没有看到基准测试或非流水线数据。深度估计网络优于MiDaS,表面法线估计网络是第一个在野外表面法线估计中实现人类水平性能的网络——至少根据OASIS基准的一个度量。
带有CLI的Dockerized管道、(主要是python)代码、生成数据的PyTorch数据加载器、生成的初学者数据集、下载脚本和其他实用程序可通过我们的项目网站获得,https://omnidata.vision.
网友评论