极速1分快三怎么玩CVPR 2019 程序主席发文泼冷水:计算机视觉的黄金时代靠的都是记忆 | 雷锋网

  • 时间:
  • 浏览:24
  • 来源:UU快三-UU直播快3

雷锋网 AI 科技评论按,随着计算机视觉技术日趋火热,作为该领域的顶级学术会议,CV极速1分快三怎么玩PR 参与人数逐年猛增 。上周在美国长滩举办的 CVPR 2019 热度还未散去,6 月 26 日,会议的进程主席 Derek Hoiem 发表了一篇博文。在博文中,Derek Hoiem 表示,现在是计算机视觉技术的黄金时代,一起他也表示,目前的计算机视觉技术之后记忆,而有的是智力。雷锋网(公众号:雷锋网) AI 科技评论将他的文章编译如下。

对于计算机视觉研究者来说,这是有一个 激动人心但难以抗拒的时代。上周二,极速1分快三怎么玩我有幸在 CVPR 2019 大会上向 9277 名与会者发表开幕词。作为有一个进程主席之一,我的工作是管理论文决策过程,这其中包括协调 132 个区域主席、2887 名审稿人极速1分快三怎么玩和提交 5150 篇论文的 14104 名作者,以及规划 1296 张海报的展示和 288 次演讲。这是有史以来最大的计算机视觉会议,但在短短有一个月内又之后有一次会议——ICCV 2019。越来越 多的事情正在位于——谁能跟上?

CVPR 每年提交(深紫色 )和接收(绿色)论文数量

计算机视觉不再之后四种 学术追求。数十亿美元被用于从智能摄像头到极速1分快三怎么玩自动驾驶的计算机视觉应用进程中。大多数教授把大约一半的时间花在工业界的研究上,即使是初出茅庐的博士生,也能拿到六位数的充足薪水。但这否有有一场泡沫?亲戚亲戚我们怎么才能 才能 将成长期是什么图片 是什么是什么的句子的句子图片 图片 的商业化突破与大肆宣传的概念证明区分开来?

首先,让亲戚亲戚我们简单回顾一下亲戚亲戚我们是怎么才能 才能 做到或多或少点的:

  • 1963 年:Robert 的经典「Blocks World」论文使用精心设计的社会形态和规则,从图像构建三维对象。

  • 1981 年:Lucas 和 Kanade 在仅仅长达六页纸的论文中提出了有效的运动跟踪和立体视觉算法。随之而来的是极速1分快三怎么玩几何视觉和图像补救的进步。

  • 1996 年:Rowley、Baluja 和 Kanade 描述了第有一个 现代物体检测,即有一个 训练用来检测人脸的神经网络。数字图像激增,数据取代了规则。

  • 2012 年:数以百万计的标记图像和 GPU 补救为 Krizevsky、Sutskever 和 Hinton 提供了证明角度学习强大力量的基础,相比曾经的法律法律依据,角度学习法律法律依据的错误率降低了一半。数据取代了手工标记社会形态。

  • 2019 年:面部识别、身体追踪和常见物体的检测就像魔术一样神奇。单张图像的角度预测看起来很棒。但里都能能 门外汉试图补救标签图像少于 5000 张的大现象。数据标注产业应运而生。

全都 ,这之后计算机视觉成功的秘密:它是记忆,而有的是智力。让亲戚亲戚我们以单视图角度预测为例。505 年,我酸涩钻研或多或少大现象,首次提出了从室外图像自动创建 3D 模型的法律法律依据。它的关键是学习「识别」几何图形,将像素标记为地面、垂直物体和支撑物,并使用透视几何规则构建场景几何的简单模型。这花费了大约 50% 的时间。

早期的单视图 3D 重建法律法律依据:或多或少数据、手工设计的社会形态和或多或少数学

单视图构建 3D 模型是现在的有一个 热门话题,仅在 CVPR 2019 上有的是 35 篇论文。有或多或少法律法律依据里都能能 从全景图生成场景布局,从图像生成对象网格,从有一个 视图生成角度图。然而,正如亲戚亲戚我们小组和 UCI 在 2018 年指出的,以及 Freiburg 和 Intel 的研究人员在 CVPR 2019 所指出的那样,或多或少似乎解释了几何学的法律法律依据实际上之后在学习和检索与输入同类例子的记忆以做出预测。预测出来的的 3D 模型之后看起来不错,但什么法律法律依据未必能推广到新的社会形态或场景中。

之后,让亲戚亲戚我们考虑有一个 非常有意思的大现象:

  1. 图像角度。之后你能在现场拍摄一张照片,并将其发送到办公室进行 3D 测量和质量控制,这难道有的是一件很棒的事情吗?再见,昂贵的激光扫描仪和笨重的摄影测量仪!好了,梦做完了,现在睁开眼睛。Matterport 最近组阁 了 350 全景的角度预测,这是有一个 令人印象深刻的数据架构设计 和机器学习壮举。它的相对角度很好,边缘也在正确的位置。Ricoh Theta 里都能能 以已知的角度固定在三脚架上,这消除了之后未知的相机参数和姿势而产生的或多或少变化。之后它在精度上仍然达都能能 可用的标准,它使用的编解码器模式也之后四种 记忆形式,之后,各种各样不同的重建场景中的角度预测之后在接下来很长一段时间内有的是容易出错。我所在的 Reconstruct 公司最近推出了基于 350 度全景视频的三维重建,之后它使用的是老式的相关性和优化法律法律依据,它工作起来非常可靠。目前,我人太好 或多或少 3D 重建最好只用在无人机、视频捕捉和扫描仪等。不过,即便我越来越 说了,我还是对单视图识别的角度法律法律依据与多视图法律法律依据相结合来产生精确几何的潜力感到非常兴奋。”

  2. 自动化进度监控。在重建时,亲戚亲戚我们将点云和图像与 BIM 对齐,之后里都能能 很容易地自动比较构建计划和评估进度。亲戚亲戚我们有或多或少基本法律法律依据的专利和论文,但它们未必像看上去越来越 简单,之后,它们还越来越 准备好迎接或多或少黄金时代。最大的挑战是各种各样的建筑元素和任务、不完整的观察结果、评估几何和材料社会形态(同类,板岩与喷漆墙)、获取标记数据的挑战。或多或少人声称有自动进度监控,但之后过高 数据和专业知识,我认为什么说法不可信,无法广泛应用。之后,有了正确的数据以及最近在语义分割方面取得的进展,这之后在未来一两年内实现,大约对于之后完成的粗略测量工作来说是越来越 。

总而言之,之后越来越人声称刚补救了有一个 好难的识别或预测的大现象,越来越 问给你知道当时人:亲戚我们否有有有足够的数据,就像我关心的类型一样,亲戚我们的法律法律依据也能记住所有的答案?这就要求:

  1. 亲戚我们否有有用了足够多的数据,以至于亲戚我们的法律法律依据只里都能能 记住所有的答案就够了;

  2. 亲戚我们在标注上花费了数百万美元,之后有四种 自动化的法律法律依据来获得监督(同类,Matterport 角度扫描仪);

  3. 预测大现象足够简单,之后你的领域也足够有限,以至于之后会被亲戚我们的数据和实验室所覆盖。数十亿美元的图像标注产业的位于是有由于 的,到目前为止,还越来越 什么东西能代替数据。

via:https://medium.com/reconstruct-inc/the-golden-age-of-computer-vision-338da3e471d1

雷锋网

雷锋网版权文章,未经授权禁止转载。详情见转载须知。