据外媒报道,北卡罗来纳州立大学(North Carolina State University)研究人员开发出新技术,使人工智能程序能够使用二维图像更准确地绘制三维空间,从而使未来自动驾驶汽车能够更好地在道路上行驶。
图片来源:Multi-View Attentive Contextualization for Multi-View 3D Object Detection (2024)
“大多数自动驾驶汽车都使用强大的人工智能程序,即视觉转换器,从多个摄像头拍摄二维图像,并创建车辆周围三维空间的表示,”北卡罗来纳州立大学电气与计算机工程副教授、新技术论文通讯作者Tianfu Wu表示。“然而,虽然这些人工智能程序都采用不同的方法,但仍有很大的改进空间。”虽然这些人工智能程序使用的方法不同,但Wu及其合作者开发的新技术有可能大幅改进它们。
“我们的技术称为多视图注意力语境化(Multi-View Attentive Contextualization,MvACon),是一种即插即用的补充,可以与这些现有的视觉转换器人工智能结合使用,以提高它们绘制3D空间的能力,”Wu表示。“视觉转换器不会从摄像头中获取任何额外的数据,它们只是能够更好地利用数据。”
研究团队使用目前市场上的三款领先视觉转换器测试了MvACon的性能,所有这些转换器都依靠一组六个摄像头来收集它们转换的2D图像。MvACon显著提高了这三款视觉转换器的性能。“在定位物体以及物体的速度和方向方面,性能得到了特别的改善。”
研究团队在今年的IEEE/CVF计算机视觉与模式识别会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition)上发表了题为《多视图注意力语境化用于多视图3D物体检测》(Multi-View Attentive Contextualization for Multi-View 3D Object Detection)的论文。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:goldenhorseconnect@gmail.com