乐天集团中国产业园区品牌连锁运营商

谷歌新算法可识别迷雾中的物体

发布时间:2020-06-28 发布者:亚时财经

在海拔较高的山区或湿气弥漫的山谷,总是容易出现雾气缭绕的情况,能见度较低。遇到一些特殊情况,人们肉眼完全无法分辨雾中模糊出现的物体究竟是什么。但现在,谷歌新推出的目标检测算法Context R-CNN就能帮忙识别。


 

(图源:网络)


日前,谷歌提出了一种目标检测的新方法Context R-CNN,该方法将利用摄像头长时间的拍摄内容,推理出模糊画面里的目标。这种模型的性能优于单帧Faster R-CNN。这个新的对象检测体系结构能利用网络中每个摄像机在整个时间范围内的上下文线索,无需依赖大量摄像机的额外训练数据,即可提高对目标的识别能力。

 

资料显示,Context R-CNN是对两阶段目标检测模型Faster R-CNN的改进,利用静态相机拍摄的图像内的高度相关性,以提高具有挑战性的数据的性能,并改进对新相机部署的通用性,无需额外的人工数据标记。

 

具体来看,Context R-CNN使用冻结的特征提取器来建立时间跨度较长的上下文存储库。由于这项技术最初用于野生动物的监测,时间跨度甚至能长达一个月。然后改算法在每个单帧图像中检测对象,并从内存库中聚合相关上下文,从而能在检测出特殊情况下的物体(如大雾天)。

 

该算法会从Faster R-CNN的第一阶段中获取建议的对象,并且将每个对象都与内存库中的素材进行比较,确定相关性。最后把这一系列相关性加权后放回原来目标身上,来构建这个目标的特征。最后,Faster R-CNN的第二阶段对已添加了上下文信息的每个对象进行最终分类。

 

简单来说,新算法会建立素材库,并将监测对象中可能的物体与素材库进行对比,寻找其相似性。而后根据相似度来推理出肉眼无法辨别的物体最有可能是何物。

 

据悉,该算法在Snapshot Serengeti(SS)和Caltech Camera Traps(CCT)两个野生动物数据集上进行了测试。结果显示,Context R-CNN不仅能发现浓雾、夜色里的动物,即使是动物被树木遮挡了一部分也能发现。

 

并且相比于Faster R-CNN,新算法在SS上的平均精度(mAP)相对提高了47.5%,而CCT上的mAP则相对提高了34.3%。其性能还会随着时间范围的增加而增加。

 

谷歌表示,此模型将作为TensorFlow目标检测API的一部分开放给用户,简化在数据集上训练和测试Context R-CNN模型的过程,另外相关代码也已经开源。

 

责任编辑:Carrick

特别声明:本站转载或引用之图文若侵犯了您的合法权益,请与本站联系,本站将及时更正、删除。版权问题及网站合作,请通过亚时财经邮箱联系:asiatimescn@sina.com

热门话题更多>>

扫一扫手机阅读

ATimesCN手机网站