电脑与信息技术

华为诺亚方舟实验室计算机视觉首席科学家田奇

 

[亿欧导读 ]诺亚方舟实验室在计算机视觉领域的研究主要分为六个方向,它们分别是:底层视觉、3D视觉、语义理解、数据生成、视觉计算、视觉与多模态的融合。

作者:周文猛,图片来自“亿欧图库”

在刚结束的2019国际智能科技峰会上,华为诺亚方舟实验室计算机视觉首席科学家田奇教授发表了以《大算力大数据时代的计算机视觉前沿探索》为主题的演讲,并且在随后的媒体沟通环节发表了自己对于AI算法、数据、算力等方面的观点。

自2018年6月份底加入华为诺亚方舟实验室,并担任计算视觉首席科学家,田奇教授便一直主导诺亚方舟实验室视觉方向的前沿研究,构建华为在各视觉业务下的算法竞争力和护城河。然而田奇教授和华为诺亚视觉实验室成员一直都非常低调,媒体曝光率较少。华为诺亚视觉实验室具体的研究方向和最新进展等相关信息也难以从网络上获得。

下文结合田奇教授在大会上的演讲以及媒体沟通会上所交流的观点,分别从诺亚方舟实验室在计算机视觉领域的主要研究方向、相关研究成果、以及田奇教授对于人工智能产业发展的观点等角度展开介绍,对华为诺亚方舟实验室正在开展的工作带来多角度的诠释。

诺亚方舟实验室六大CV研究方向及相关挑战

目前,华为拥有着超过18万名员工,在全球170多个国家经营业务,2018年营收额高达1085亿美元,并且成功跻身财富500强第72位。在华为高速增长的企业财富以及超强的业务布局能力背后,最为关键的一股力量莫过于华为遍布全球各地的14个研发中心。

作为华为的AI研究中心,华为诺亚方舟实验室便是这14大研究中心当中不可或缺的一员,同时也承载着华为打造世界顶级人工智能实验室、帮助公司以及整个产业实现AI战略转型的宏伟使命。

以田奇教授为代表的AI研发人员主要专注于诺亚方舟实验室计算机视觉领域的研究。据田奇教授介绍,诺亚方舟实验室在计算机视觉领域的研究主要分为六个方向,它们分别是:底层视觉、3D视觉、语义理解、数据生成、视觉计算、视觉与多模态的融合。

第一个研究方向是底层视觉,该部分的研究课题主要致力于提升拍照体验。目前低分辨率和噪声是影响拍照体验的重要因素,虽然对已拍摄的照片进行超分和去噪可有效提升用户体验,但是也存在噪声统计特性难以估计、多重处理后原始图像和噪声难以恢复、图像退化模糊之后还原难等缺点。

第二个研究方向是语义理解。图像视频内容中通常包含着非常丰富的语义信息,诸如扔东西、偷窃等个体行为以及聚会、斗殴等群体事件。因此,语义理解技术的发展能为平安城市、终端视觉等业务带来巨大的商业价值。但目前相关技术的发展也存在一些挑战,一方面,同类事件之间的不同表现行为不易辨识;另一方面,不同场景当中的相似行为可能代表的语义不一致。

第三个研究方向是3D视觉。相较于二维数据来说,三维数据中蕴含着更为丰富的信息,因此也被一致认为是计算机视觉的未来。但是三维视觉发展也面临着众多挑战,以医疗影像为例:医疗影像的数据标注需要极为专业的知识,在大数据时代,获取具有精准标注的医疗数据困难且昂贵;此外,医疗影像当中区分正常样本和不正常样本难度较大,譬如需要对一些器官病变的细微之处进行识别。此外,视频数据当中存在大量的冗余信息,如何从这种海量的冗余信息中挖掘出有用的信息也是一个很大的挑战。

第四个研究方向是数据生成。丰富的数据是算法研究的保障和基石,但是在实际场景当中,由于版权和隐私等限制会导致数据获取难度大、人工标注成本高等问题。如何通过低成本的方式获取实用的数据已经成为了行业发展的重中之重。通过现有的数据生成技术生成的数据大多存在图像质量差、同质化现象严重等问题。

第五个研究方向是视觉计算。视觉计算是深度学习应用落地非常重要的一环,现在行业内有两个研究比较多的课题方向:一个是现有网络模型的压缩与加速,另外一个就是自动搜索新的网络结构。由于目前边缘计算的算法相对独立,行业缺乏统一的平台,调用极其困难,而且行业内更缺乏一些针对特定视觉任务的网络压缩与加速算法,这导致了这一课题研究方向存在巨大的挑战。此外,现在神经网络人工构建策略费时费力,虽然网络结构搜索能够在一定程度上解决这一问题,但是其在算法和效率上仍有较大的进步空间。