电脑与信息技术

计算机视觉or机器视觉:自动驾驶汽车和无人机的

 

从前局限于计算机科学研究的计算机视觉和特定行业应用的机器视觉技术在AI时代也走向前台,点亮无数智能设备的“眼睛”。那么,计算机视觉和机器视觉技术在自动驾驶、无人机和工业机器人等应用方面又有什么区别呢?

首家获准拥有自动驾驶无人机的公司Airobotics推出的一款工业无人机-- 可实现无人操控的飞行,配备了用于精确控制的军用级航空电子设备,以进行预编程,以执行“任务”。它可实现自动启动和降落,能在无人操控下飞行半小时。无人机上能够传送实时视频的摄像头,使其可用于空中调查和巡视以提供安保服务,在紧急情况下能代替人类自动执行任务,避免操作者陷入危险。

而亚马逊近日也申请了“无人驾驶飞行器语音互动”的专利,送货无人机将使用Alexa实现与顾客的交流。它具有语音输入功能,以捕获和响应顾客的语音,与附近的人进行对话、获取信息或回答问题。如果无人机监测到有物体进入其着陆区域或发生机械故障,将向周围的人发出语音警告“请离我远一点”。如果无人机电力不足,它也可通过语音向人们寻求帮助。

几乎是同时,自动驾驶汽车又有新突破,只要在车子设置在正常的指令下,司机可以完全不用监督汽车的驾驶,即便打瞌睡,也会被汽车吵醒~同时,最新的自动驾驶汽车背后应用了许多新技术。有安装来自NVIDIA公司的电脑,Mobileye图像处理器,和一个大型阵列传感器。其包括12个超声波传感器,五台摄像机,五雷达和夜视红外摄像机。最引人注目的是,这是汽车史上引入第一次将雷达技术。

针对自动驾驶汽车目前在测试上存在的困境,Alphabet旗下的自动驾驶汽车公司Waymo开发了一个模拟建筑的软件来测试,并根据游戏“魔兽世界”(World of Warcraft)将其命名为Carcraft。该模拟软件可以模拟上千上万的场景,模拟汽车可能会通过它学习更多东西。这个“虚拟世界”或对研发出更精确的自动驾驶汽车有极大的帮助。

谷歌的自动驾驶产品 Waymo 获得一项新专利,汽车外壳在撞击行人前能自动变软,缓冲撞击带给行人的伤害,这一专利设计将能降低车辆撞击带来的危害。在发生撞击时,汽车的传感器被触发,使得汽车的某一部分萎缩或者塌陷。目前为止,这一专利并未进行有效性测试,驾驶这种汽车的驾驶员的安全也有待测试。

无论是无人机送货,还是谷歌的自动驾驶,其背后都有计算机视觉技术的强大支持。进入人工智能时代,三个最热门的词莫过于无人机、无人驾驶和机器人。这些无人参与操作的智能设备有什么共性?首先是要有一个“大脑”,即用计算机代替人脑来处理大量复杂的信息数据。其次,都需要“眼睛”来感应周围环境并做出及时且正确的反应。这些智能机器的“大脑”由一组高性能CPU芯片组成,其“眼睛”则是由摄像头、视觉处理器(VPU)和专有的软件系统实现。这种“眼睛”背后的驱动力就是我们所讨论的计算机视觉或机器视觉技术。

作为计算机科学的一个分支,计算机视觉最早开始于上世纪70年代的人工智能研究。从工程学的角度来看,它是利用计算机来实现人类视觉系统可以完成的任务,主要包括数字图像和3D图像的采集、处理和分析方法。其应用领域主要有医疗成像、工业机器人自动检测、安保和统计、人机交互等。最近才火爆起来的无人驾驶汽车也是计算机视觉发挥重要作用的市场。下图是火星探测车的概念模型车Rover,注意其头部的立体摄像头就是这种无人车的“眼睛”。

将计算机视觉技术应用于高级驾驶辅助系统(ADAS)和自动驾驶领域最成功的公司当属以色列的Mobileye,其股票市值超过10亿美元,全球主要汽车厂商和Tier 1汽车零配件供应商都在使用该公司的视觉感应处理芯片EyeQ及配套的自动感应系统。去年Mobileye与BMW和Intel达成合作联盟,共同开发自动驾驶平台和地图。

据专业人士介绍,无人驾驶技术链非常长,但基本可分为三个阶段:感知、决策和控制。计算机视觉技术主要应用在无人驾驶的感知阶段,其基本原理大致如下:

1.使用双目视觉系统获取场景中的深度信息。它可以帮助进行后续的图像语义理解,在无人驾驶中可以帮助探索可行驶区域和目标障碍物。2.通过视频来估计每一个像素的运动方向和运动速度。3.对物体进行检测与追踪。在无人驾驶中主要是各种车辆、行人、非机动车。4.对于整个场景的理解。最重要的有两点,第一是道路线检测,其次是在道路线检测下更进一步,即把场景中的每一个像素打成标签,这叫做场景分割或者场景解析。5.同步地图构建和定位技术,即SLAM(Simultaneous Localization and Mapping)技术。

目前计算机视觉在无人驾驶上的应用有两个难点。

• 第一个难点是精度和可靠性可能达不到预期要求,但是这几年深度学习发展迅速,这方面的难点会被一一攻克;• 第二个难点在于传感器本身,比如说过曝和欠曝,都是非常严重和常见的问题。解决这个问题的方法就是通过传感器融合,也就是说当视觉传感器失效的时候,可以融合其它传感器,包括毫米波雷达甚至激光雷达,以便对周围环境进行感知来保证车辆的安全。

机器视觉在基本原理上跟计算机视觉类似,可以说是计算机视觉在自动化检测和工业控制方面的系统工程分支。跟计算机视觉不同的是,机器视觉侧重于以新的方式集成现有技术,并用于解决现实世界的图像处理问题。一个基本的机器视觉系统主要包括光源、摄像头、视觉处理器和输出组件。其主要应用在于自动化检测和工业机器人导视系统,最近几年发展起来的无人机也是机器视觉的一个新兴应用市场。