范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

Facebook在ICCV2021发布两个3D模型,自监督才是终极答案?

  来源:Facebook AI
  编辑:LRS  【新智元导读】长久以来CV的训练一直停留在二维数据上,三维数据因为标注成本高等原因都需要专业人员来开发专用模型。Facebook在ICCV 2021 发布两个3D模型3DETR和DepthContrast,将模型的通用性全面升级,也许标志着CV研究全面进入三维时代!
  从大规模的数据中进行预训练,在计算机视觉中得到了广泛应用,也是在特定任务上得到高性能模型的基础。
  但这种方法有一个致命缺陷,那就是如果目标数据类型还没有大量标注数据的话,就没办法使用这种模式。
  例如3D 扫描、识别的标注数据集就很稀缺,主要是因为3D 数据集的标注十分耗时,并且用于 3D 理解的模型通常依赖于与用于训练的特定 3D 数据集的手工架构设计。
  在 ICCV 2021 上,Facebook AI提出了两个新模型3DETR和DepthContrast,这两个互补的新模型可促进3D理解并更容易上手。新模型建立了简化的3D理解的通用架构,并且能够通过不需要标签的自监督学习方法来解决这些问题。
  代码目前也已开源。
  出于各种原因,目前的CV 模型还主要集中在二维图片,但构建机器以了解有关世界的 3D 数据非常重要。例如自动驾驶汽车需要 3D 理解才能移动并避免撞到障碍物,而 AR/VR 应用程序可以帮助人们完成实际任务,例如可以可视化沙发是否适合客厅。
  来自 2D 图像和视频的数据表示为规则的像素网格,而 3D 数据则反映为点坐标。由于 3D 数据更难获取和标记,因此 3D 数据集通常也比图像和视频数据集小得多。这意味着它们通常在整体大小和它们包含的类或概念的数量方面受到限制。
  以前,专注于 3D 理解的从业者需要大量的领域知识来调整标准的 CV 架构。单视图 3D 数据(取自一台同时记录深度信息的相机)比多视图 3D 更容易收集,后者利用两个或更多相机记录同一场景。多视图3D数据往往是通过对单视图3D进行后处理生成的,但是这个处理步骤有失败的可能,一些研究人员估计,由于源图像模糊或相机运动过度等原因,这个失败率可能高达 78%。
  DepthContrast 主要解决了这些数据上的问题,因为它可以从任何 3D 数据(无论是单视图还是多视图)训练自监督模型,因此消除了处理小型未标记数据集的挑战。一般的CV 模型即使是对大量 2D 图像或视频进行预训练也不太可能为 AR/VR 等复杂应用产生准确的 3D 理解。
  https://arxiv.org/abs/2101.02691
  自监督学习一直是研究界和FAIR的主要兴趣领域, DepthContrast也是业界在不使用标记数据的情况下学习强大3D表示的最新尝试。这项研究继承自FAIR 之前的工作PointContrast,也是3D的一种自我监督技术。
  现在获得3D数据的机会很多。传感器和多视图立体算法通常为视频或图像提供补充信息。然而,理解这些数据以前一直是一个挑战,因为3D数据具有不同的物理特性,这取决于它的获取方式和位置。
  例如,与来自室外传感器(如 LiDAR)的数据相比,来自商用手机传感器的深度数据看起来非常不同。AI研究中使用的大多数3D数据都是以单视图深度图的形式获取的,这些数据通过为3D registration的步骤进行后处理以获得多视图3D。先前的工作依赖于多视图3D数据来学习自监督特征,训练目标主要考虑3D点对应关系。
  虽然将单视图数据转换为多视图数据的失败率很高,但DepthContrast表明仅使用单视图3D数据就足以学习最先进的3D特征。
  使用3D数据增强可以从单视图深度图生成略有不同的3D深度图。DepthContrast通过使用对比学习来对齐从这些增强深度图获得的特征来实现这一点。
  并且研究结果表明该学习信号可用于预训练不同类型的3D架构,例如PointNet++和Sparse ConvNets。
  更重要的是,DepthContrast可以应用于任何类型的3D数据,无论是在室内还是室外,单视图还是多视图。我们的研究表明,使用DepthContrast预训练的模型在ScanNet 3D检测基准上绝对是最先进的。
  DepthContrast的功能在形状分类、对象检测和分割等任务的各种3D基准测试中提供了增益。
  DepthContrast表明自监督学习也有希望用于3D理解。事实上,DepthContrast分享了学习增强不变特征的基本原理,该原理已被用于支持自监督模型,例如Facebook AI的SEER。
  第二个工作3DETR是3D Detection Transformer的缩写。该模型是一种基于Transformer的简单三维检测和分类架构,可作为检测和分类任务的通用三维模型,该模型简化了用于训练3D检测模型的损失函数,更容易实现。它的性能也相当于或超过了依赖于手动调整的3D架构和损耗函数的现有最先进的方法。
  https://arxiv.org/abs/2109.08141
  3DETR将三维场景(表示为点云或一组XYZ点坐标)作为输入,并为场景中的对象生成一组三维边界框。这项新的研究建立在VoteNet和Detection Transformers(DETR)的基础上,其中VoteNet是FAIR在3D点云中检测物体的模型,DETR是Facebook AI为重新定义物体检测挑战而创建的一种更简单的架构。
  为了实现2D检测的飞跃,Facebook AI之前的研究确定了两个重要的变化,需要解决Transformer的3D理解工作,还需要非参数查询嵌入和傅立叶编码。因为点云在大量空白空间和噪声点之间具有不同的密度,所以这两种设计决策都是必需的。
  3DETR使用两种技术来处理此问题,与DETR和其他变压器模型/DETR中使用的标准(正弦)嵌入相比,傅里叶编码是表示XYZ坐标的更好方法。
  其次,DETR使用一组固定的参数(称为查询)来预测对象的位置,研究结果发现此设计决策不适用于点云。取而代之的是,我们从场景中采样随机点,并预测相对于这些点的对象。实际上没有一组固定的参数来预测位置,而是随机点采样适应3D点云的不同密度。
  使用点云输入,Transformer编码器生成场景中对象形状和位置的坐标表示通过一系列的自注意操作来捕获识别所需的全局和局部上下文。例如,它可以检测3D场景的几何特性如放置在圆桌周围的椅子的腿和靠背。
  Transformer解码器将这些点特征作为输入并输出一组 3D 边界框,它对点特征和查询嵌入应用了一系列交叉注意操作。解码器的自注意力表明它专注于对象以预测它们周围的边界框。
  Transformer编码器也足够通用,可以用于其他3D任务,例如形状分类。
  总的来说,3DETR比之前的工作更容易实现。在3D基准测试中,3DETR的性能与之前手工制作的3D架构相比也有优势。它的设计决策也与之前的3D工作兼容,使研究人员能够灵活地将3DETR中的组件适应他们自己的pipeline。
  从帮助机器人导航世界到为使用智能手机和未来设备(如AR眼镜)的人们带来丰富的新VR/AR体验,这些模型都具有巨大的潜力。
  随着手机中3D传感器的普及,研究人员甚至可以从自己的设备上获取单视图3D数据来训练模型。深度对比技术是以自我监督的方式使用这些数据的第一步。通过处理单视图和多视图数据类型,DepthContrast大大增加了3D自监督学习的潜在使用案例。
  自监督学习仍然是跨文本、图像和视频学习表示的强大工具。现在,大多数智能手机都配备了深度传感器,这为提高3D理解和创造更多人可以享受的新体验提供了重要机会。
  参考资料:
  https://ai.facebook.com/blog/simplifying-3d-understanding-using-self-supervised-learning-and-transformers/

灭蚊用上了核科技!我国科学家推出核射线灭蚊法,巧妙给蚊子绝育夏秋季节,正是蚊子最猖獗的时候,无论是白天和晚上,一不小心就有可能被它们赠几个红包,特别是现在有种专门白天咬人的花蚊子(白纹伊蚊,又称亚洲虎蚊),只要你在屋外面站上一站,一秒钟的工航天员第二次出舱都干了啥?完成五项工作!空间站空调动能更足了我国空间站目前正处于建设阶段,神舟十二号3名航天员聂海胜刘伯明汤洪波今天执行了进入空间站以来的第二次出舱活动,进一步完善了空间站的结构和功能。据央视新闻采自中国载人航天工程办公室的要和国际空间站说再见?俄罗斯公布新空间站,在极轨运行还有卫星要说世界上哪个国家最喜欢建造和使用空间站,那肯定不是我国和美国,而是俄罗斯,虽然我国已经有了自己的空间站,美国也是国际空间站的主导者之一,但俄罗斯对空间站的喜爱近乎狂热,50年前的裂缝不断又冒烟,国际空间站还能用多久?难怪都想来我国空间站了国际空间站是如今太空中最大的人造天体,长度约109米,宽88米,重量约为420吨,远超其他任何航天器,但它也是由多个组件构建的复合体,其大部分组件的设计使用寿命只有15年,所以其早2021陈硕子聊城演唱会门票价格购票方式当我们内心的情绪开始变得不安的时候,是音乐安抚了我们的内心,调节了那些负面的情绪。陈硕子的音乐,好像就拥有一种治愈人心的力量。陈硕子聊城演唱会,让我们来到现场,认真倾听他音乐中的故2021石家庄星光音乐节时间表阵容介绍门票价格秋高气爽,天气微凉,在这美好的时节,你想开启一段心灵上的旅行吗?你想结交众多志同道合的朋友吗?今年九月,就让我们相约石家庄星光音乐节,唱摇滚,吟民谣,见偶像,共享音乐繁华吧!石家庄东京奥运金牌能抠掉皮,里约和伦敦奥运金牌变灰,还是北京金牌好对任何人来说,如果能获得一枚奥运会金牌,那真是无比荣耀的事情,其金牌也一定会被用心珍藏,细心呵护!然而在8月23日晚,获得东京奥运会女子蹦床冠军我国运动员朱雪莹在微博上发问式吐槽称2021张杰苏州演唱会门票价格时间地点经历过延期之后,这一次的演出更是值得期待。10月16日,我们期待多时的张杰苏州演唱会,终于要来到我们身边啦!在这一次演出中,张杰将会带给我们怎样的音乐体验呢?让我们一起期待吧!张杰奥运金牌哪家强?东京金牌掉皮,伦敦里约都变黑,北京的火烧不坏上个月下旬,获得东京奥运会女子蹦床冠军的我国运动员朱雪莹爆料她的东京奥运会金牌能抠掉皮!让人大跌眼镜,堂堂的东京奥运会的金牌制作如此糟糕!然而并不止是东京的差,我国女子帆船运动员伦2021张信哲广州演唱会门票价格时间地点张信哲未来式2。0巡回演唱会正式起航,今年,他将走过上海广州苏州无锡西安成都等各大城市,而10月30日这一站,他将抵达广州,哲迷们,让我们相约张信哲广州演唱会,听男神一展歌喉吧!张鸟中西施现身上海公园,全身羽毛有8种颜色,全国不到2000只鸟类大都喜欢生活在山林田野之间,越是罕见的鸟类距人类聚集区越远,不过最近上海一位阿婆却在公园中捡到了一只罕见的小鸟,这只小鸟全身有着多种颜色,而且色彩十分亮丽,来看看这种鸟个头不大
钟楚红19岁参选港姐尽展完美体态,谦虚谈自己的美貌每样都差点未经授权严禁转载,发现抄袭者将进行全网投诉现年61岁的钟楚红(红姑)是80年代最炙手可热的花旦之一,当年她和林青霞张曼玉及梅艳芳被合称为霞玉芳红,钟楚红更有香港玛丽莲梦露的称誉,是扫黑风暴麦佳人设对应高小琴,她服务的不仅仅是高明远电视剧扫黑风暴自从播出之后,观众们对于剧中很多角色的命运,都觉得扼腕,每一个生命都非常可贵,但是不是所有的人,都会理解并认同这个观念,在绿藤市里,高明远父子的所作所为,就让人十分头乔四美目睹丈夫出轨过程,情绪激动导致早产,戚成钢仍然死性不改丈夫出轨,妻子居然还能忍得下去的估计就只有乔四美(宋祖儿饰)了,大家都期待她早日清醒,而她却越陷越深,吃了秤砣铁了心对戚成钢死心塌地的,然而丈夫却不知悔改,有了第一次出轨,也就有第国产老剧女演员美目盼兮欲说还休的秘密,现在都用来黑化了现在的女演员没有以前的好看有灵气也就算了,关键是以前的女演员,真的可以演出来眼含秋波旖旎缱绻水汪汪让人看了就我见犹怜。但是得承认,以前的女演员虽然没有现在的女演员微调的那么精致,但巧笑倩兮,美目盼兮,这才是古典美人应有的样子巧笑倩兮,美目盼兮,说起古装剧里的古典美人,不知道大家首先想到的会是谁呢?下面让我们一起看看那些颇具古典气质的美人吧!首先,我们要说的一位女明星就是在95武则天里扮演过上官婉儿的如孩子9月出生入学要晚1年,很多人觉得亏了,其实这对孩子有好处小学入学有年龄限制,因此就导致了9月以后出生的孩子要比同年的孩子晚一年入学,这让9月份出生的孩子家长很是焦虑,总是觉得自己孩子起步比同年的孩子晚了一些,而且上学的时候还成了班级中年中国留学生爆买引发质疑!不要再贪便宜帮人免税了,日本国税局这个月出手整顿日本旅游如火如荼的那几年,中国人在日本的爆买经常会成为日媒的报道焦点。中国人有钱又豪爽的花钱方式让日本人震惊不可思议又有些酸。如今因为疫情中国游客进不来,但爆买这个词又再次出现,不比罗志祥还渣!曾被称好先生,如今却在妻子怀孕八个月出轨被抓娱乐圈一夜爆红的很多,一夜跌落神坛的也不少,这里是创想娱乐君,关注娱乐君,带你以正确的姿势吃遍娱乐圈的各种瓜!比罗志祥还渣!曾被称好先生,如今却在妻子怀孕八个月出轨被抓!前段时间黎阿里P8海王被曝5个月出轨16次,手机里面拍有500多段不雅视频近日阿里女员工事件刚刚反转,经过大量的资料和证据被曝光后,大家发现原来之前大喊自己是受害者的周女士原来竟是一个自导自演勾三搭四的小丑,好人坏人全都给她做了,把公司声誉搞臭了不说,还22岁男星成功怀孕,称宝宝将会在9月出生美国说唱歌手利尔纳斯X在社交平台上晒出自己怀孕的照片照片中里尔一身白衣,头戴和手捧鲜花,侧面看着他的肚子更加明显,与普通孕妇一样,不过他是孕夫而且他还晒出了宝宝的B超照片,他这么大与梁朝伟同年同月出生,还是好友,两人过生日祝贺的人大不同说起梁朝伟和周星驰,因为他们在荧屏上鲜有交集,大家可能不会把他俩想到一块去,甚至有些网友可能都觉得他俩不认识,但事实恰恰相反,两人不仅出道前就认识,还是很好的朋友。而且梁朝伟能进娱