计算机视觉技术包括很多能够理解图像的算法,它们是许多创新型关键技术——从自动驾驶汽车到智能工业机械甚至手机上的软件等的基础,也是我们正在努力构建的能像人类自身一样理解和学习周围世界的机器的基础。
到2022年底,计算机视觉技术的市场价值预计将达到480亿美元,并可能成为许多持续创新和突破的来源。美国《福布斯》杂志网站在近日的报道中,列出了计算机视觉技术在2022年的五大发展和应用趋势。
优化数据的质量
计算机视觉的飞速发展多亏了深度学习技术的不断进步。
深度学习领域的重要开拓者吴恩达博士开发了一些基于深度学习的图像识别模型,其目的是训练计算机识别猫的图片,这些模型尤其依赖它们被“喂食”的数据的质量,而不仅仅是数量。使用自动提取并标记数据的技术提升了对标记数据的质量,将使计算机视觉技术能用更少的数据获得同样的结果,从而降低资金投入和计算资源等方面的成本,并开辟出更多新的潜在使用案例。
应用于健康和安全领域
计算机视觉的一个关键应用是发现危险并在出现问题时发出警报。科学家们已经开发出了一些方法,让计算机能够检测建筑工地上的不安全行为,比如,没有佩戴安全帽等行为,以及监控叉车等重型机械工作范围内的各种环境,如果有人误入工作范围,它们会自动关闭。美国劳工统计局的数据显示,每年有270万人受工伤,越来越多企业加大了在该领域的投入,以减少因疏忽造成的人力和财务成本。
当然,防止病毒的大范围传播也是一个重要的应用案例,计算机视觉技术正越来越多地被用于监控某人是否遵守社交距离规定以及是否佩戴口罩等。在新冠疫情肆虐期间,科学家们还开发出了计算机视觉算法,可以通过寻找感染证据和肺部图像受损情况,帮助诊断患者的病情。
应用于零售业
2022年,计算机视觉技术将会在购物和零售领域大力普及。
此前,亚马逊开创了无收银员商店Amazon Go,该杂货店配备了摄像头,可以简单识别顾客从货架上拿走的物品。2022年预计将有更多分店开业,包括特易购在内的其他零售商也将加入其中,如特易购将在英国开设其首家无收银员的超市。
除了能自动扫描商品外,计算机视觉在零售业还有许多其他用途,例如,应用于库存管理领域,摄像头可检查货架上商品的摆放情况和仓库内的库存情况,并在必要时自动订购补货。它还被用来监控和了解顾客在商店内的移动模式,以优化商品的摆放位置,当然,也可以用来防止商品被盗。计算机视觉技术另一个越来越流行的使用案例是让客户可以用手机扫描条形码来获取产品信息。而在时装零售业,计算机视觉的一个特别有趣的应用是“虚拟试衣间”,顾客可以在不触摸物品的情况下虚拟试穿物品,甚至可以识别顾客正在试穿的产品,并提供搭配建议。
在自动驾驶汽车领域“大显身手”
计算机视觉已经应用于现有的智能网联汽车领域。智能网联汽车指搭载先进的车载传感器、控制器、执行器等装置,并融合现代通信与网络技术,实现车与人、路、后台等智能信息交换共享,实现安全、舒适、节能、高效行驶,并最终可替代人来操作的新一代汽车。
科学家们已经开发出一些视觉系统,能使用摄像头跟踪驾驶员的面部表情,发出警告信号,如驾驶员可能很疲劳,并有可能在开车时睡着。调查显示,高达25%的致命和严重交通事故由这一因素引起,因此,这样的技术和措施可以更好地挽救生命。
这项技术已经在货运卡车等商用车辆上使用,到2022年,它有望进入私家车领域。计算机视觉在汽车领域的其他可能用途包括监控乘客是否系好安全带,甚至下车时是否落下钥匙和电话等。
当然,计算机视觉也将在自动驾驶汽车领域发挥重要作用。如特斯拉公司今年宣布,其汽车将主要依靠计算机视觉,而不是使用雷达来为汽车行驶周围的环境建模。
应用于边缘计算领域
边缘计算是指在数据源头的附近,采用开放平台,就近直接提供最近端的服务。边缘计算与云计算相反,云计算是指通过网络,把众多数据计算处理程序分解,通过服务器组成的系统,把这些分解的小程序再处理分析来得到结果。
在计算机视觉领域,边缘计算技术的重要性与日俱增,因为计算机视觉系统经常需要快速作出决定,比如,在自动驾驶汽车等领域,因此根本没有时间将数据发送到云。
随着边缘计算的计算速度不断提高,计算机视觉将在安全领域产生重大影响,鉴于企业商业和个人在捕获和使用视频数据的方式上面临更严格的审查和监管,这一点日益重要。使用边缘设备,如配备了计算机视觉的安全摄像头,人们可以动态分析数据,并在没有理由保留数据(如没有检测到可疑活动)的情况下丢弃数据。
来源:科技日报