电脑与信息技术

计算机视觉技术在物联网中的发展与应用

 

今日分享

By Frank Lee is the co-founder and CEO of Eurika Solutions

计算机视觉的发展演进

我们可以轻松地在日常产品中找到计算机视觉技术的应用,从可以识别手势的游戏机到可以自动聚焦于人脸的智能手机摄像头。如今,计算机视觉正在影响我们生活的许多领域。

实际上,计算机视觉在商业和政府使用中已有悠久的历史。可以感测各种光谱范围内的光波的光学传感器已在许多应用中部署:像制造中的产品质量检测,用于环境管理的遥感或在战场上收集情报的高分辨率相机。这些传感器中的一些是固定的,而另一些则附着在移动的物体上,例如卫星、无人机和车辆。

过去,这些计算机视觉应用中有许多都限于某些封闭的平台。但是,当与IP连接技术结合使用时,它们会创建一套以前无法实现的新应用。计算机视觉,再加上IP连接性、高级数据分析和人工智能,将成为彼此的催化剂,从而引发物联网(IoT)创新和应用的革命性飞跃。

推动计算机视觉的多个领域的进步

专为视觉设计的环境

视力或视觉是人类五种感官中最发达的。我们每天都使用它来认识我们的朋友、发现前进道路上的障碍、完成任务并学习新事物。我们设计视觉环境的物理环境,有路标和信号灯可以帮助我们从一个地方到达另一个地方;商店有标牌来帮助我们找到它们;电脑和电视屏幕显示我们消费的信息和娱乐。考虑到视觉的重要性,将其扩展到计算机和自动化领域并不是一个大飞跃。

什么是计算机视觉?

计算机视觉始于捕获和存储图像或一组图像的技术,然后将这些图像转换为可以进一步作用的信息。它由多种技术共同组成(图1)。计算机视觉工程是一个跨学科领域,需要许多这些技术的跨功能和系统专业知识。

例如,Microsoft Kinect使用3D计算机图形算法来使计算机视觉能够分析和理解三维场景。它允许游戏开发人员将实时的全身运动捕捉与人工3D环境合并。除了游戏以外,这还在机器人技术、虚拟现实(VR)和增强现实(AR)应用等领域开辟了新的可能性。

传感器技术的进步也在许多方面超越了传统的相机传感器而迅速发展。最近的一些例子包括:

红外传感器和激光结合起来可感应深度和距离,这是自动驾驶汽车和3D映射应用的关键推动力之一

非侵入式传感器,无需物理接触即可跟踪医疗患者的生命体征

高频摄像头可以捕捉人眼无法察觉的细微动作,帮助运动员分析步态

超低功耗和低成本视觉传感器,可以长时间部署在任何地方

图1.由多个领域的进步推动的计算机视觉。图片来源:IFA

计算机视觉变得智能

早期应用

监控行业是图像处理技术和视频分析的较早采用者之一。视频分析是计算机视觉的一种特殊用例,其重点是从数小时的录像中查找模式。在现实世界中自动检测和识别预定义模式的能力代表着数百个用例的巨大市场机会。

首批视频分析工具使用手工算法来识别图像和视频中的特定功能。它们在实验室设置和模拟环境中都是准确的。但是,当输入数据(例如光照条件和摄像机视图)偏离设计假设时,性能会迅速下降。

研究人员和工程师花了很多年时间开发和调整算法,或者提出新的算法来应对不同的条件。但是,使用这些算法的摄像机或录像机仍然不够坚固。尽管这些年来取得了一些渐进的进步,但现实世界的糟糕表现限制了该技术的实用性和采用性。

深度学习突破

近年来,深度学习算法的出现重新激发了计算机视觉。深度学习使用模仿人类大脑神经元的人工神经网络(ANN)算法。

从2010年代初开始,通过图形处理单元(GPU)加速的计算机性能已经变得足够强大,足以让研究人员实现复杂的人工神经网络的功能。此外,部分地受视频站点和流行的IoT设备驱动,研究人员拥有庞大的视频和图像数据库来训练他们的神经网络。

2012年,一种称为卷积神经网络(CNN)的深度神经网络(DNN)版本在准确性上实现了巨大飞跃。这一发展带动了人们对计算机视觉工程领域的兴趣和兴奋。现在,在需要图像分类和面部识别的应用中,深度学习算法甚至超过了人类。更重要的是,就像人类一样,这些算法具有学习和适应不同条件的能力。

图2.场景的语义表示

随着深度学习的发展,我们正在进入认知技术的时代,其中计算机视觉和深度学习融合在一起,以解决人脑领域中的高级复杂问题(图2)。我们只是在探索一切可能的事物。随着更快的处理器,更先进的机器学习算法以及与边缘设备的更深入集成,这些系统将继续得到改善。计算机视觉将彻底改变物联网。