首页 文章详情

三维重建缺数据集?来看看Facebook最新发布的CO3D

3D视觉工坊 | 663 2021-09-08 01:39 0 0 0
UniSMS (合一短信)
编辑丨三次方AIRX

三次方

学员

AR/VR的关键技术 - 三维重建,我是算法工程师,最近负责公司XR方面的算法工作。班班有没有什么好的框架或者数据集供学习参考呢?

最近Facebook AI 开源 CO3D(3D 中的常见对象)数据集,用于计算机视觉研究中的 3D 重建

3D熊


CO3D - 三维重建数据集


3D对象重建是 AR/VR 技术应用的重要计算机视觉问题(eg:远程呈现和游戏 3D 模型的生成)用于逼真 3D 重建的新兴技术可以将真实物体与传统智能手机、笔记本电脑甚至未来增强现实眼镜上的虚拟物体无缝混合。



总而言之,当前的 3D 重建方法依赖于各种对象类别的学习模型,由于缺乏包含真实世界对象视频和准确 3D 重建的数据集,这些模型是有限的。由于模型使用这些示例来创建足够的重建,因此研究人员通常只使用本质上具有近似匹配的合成对象。


Facebook AI部门发布了一个大规模数据集,其中包含带有 3D (CO3D) 注释的常见对象类别的真实视频。新的 CO3D 拥有来自近 19,000 个视频的 150 万帧,这些视频捕获了广泛使用的 MS-COCO 数据集中 50 种不同类型的对象,以提高准确性和覆盖范围。



Facebook AI 也发布了一种他们称之为 NeRFormer 的新方法的成果。它可以通过观察 CO3D 数据集中的视频(而不仅仅是静止图像)来学习从不同视角合成物体的图像。这实现了结合最近两个机器学习贡献的高效合成:变压器和神经辐射场,在为对象生成新视图时,与最接近的竞争对手的方法相比,准确度提高了 17%。


三次方

学员

看起来不错哇,能简单介绍下原理或者过程嘛?

妥,没有问题,往下看:

3D熊


为了收集用 3D 形状标注的野外常见物体的大规模现实生活数据集,Facebook AI 研究人员设计了一种摄影测量方法,只需要以物体为中心的多视图图像。


为了实现这一目标,他们在 Amazon Mechanical Turk (AMT) 上众包了以对象为中心的视频。每个 AMT 任务都要求工作人员在给定类别中选择一个对象,将其放置在固体表面上,并在围绕整个对象移动的同时录制视频。他们选择了 50 个 MS-COCO 类别,包括具有明确定义的形状的静止物体,它们是成功 3D 重建的良好候选者。


成熟的摄影测量框架 COLMAP 使用 3D 注释并跟踪相机以创建密集的对象点云。为了确保高质量的 3D 注释,作者对精度较低的视频使用了主动学习算法。


除了CO3D数据集的发布,Facebook AI还提出了NeRFormer。这是一种新颖的深度架构,通过差异化渲染其神经辐射场 (NeRF) 进行学习。这些属性是基于分析视频内容并沿着光线行进以进行渲染来预测的。因此,一旦神经形成器学习了一个类别的共同结构,它就可以合成一个不可见对象的新视图,只给出它的已知视图。


CO3D 数据集将是同类中的第一个,它已经对 3D 现实生活对象重建产生了重大影响。它为他们的 NeRFormer 提供训练数据,以处理新视图合成 (NVS) 任务。借助逼真的 NVS,它们离完全身临其境的 AR/VR 效果又近了一步。


三次方

学员

Get!代码和论文下载有吗?

1、数据集下载地址:

https://ai.facebook.com/datasets/co3d-downloads/

2、代码地址:

https://github.com/facebookresearch/co3d?

3、论文下载:公众号回复【CO3D】

3D熊


本文仅做学术分享,如有侵权,请联系删文。
下载1
在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2
「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3
「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。


一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列三维点云系列结构光系列手眼标定相机标定orb-slam3等视频课程)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款
 圈里有高质量教程资料、答疑解惑、助你高效解决问题
觉得有用,麻烦给个赞和在看~  

good-icon 0
favorite-icon 0
收藏
回复数量: 0
    暂无评论~~
    Ctrl+Enter