当前位置: 首页 > news >正文

做pc端网站资讯全屋整装家装

做pc端网站资讯,全屋整装家装,网页界面设计的概念,asp.net 网站 代理基于多视角融合的夜间无人车三维目标检测 人工智能技术与咨询 来源#xff1a;《应用光学》#xff0c;作者王宇岚等 摘 要#xff1a;为了提高无人车在夜间情况下对周围环境的物体识别能力#xff0c;提出一种基于多视角通道融合网络的无人车夜间三维目标检测方法。引入…基于多视角融合的夜间无人车三维目标检测 人工智能技术与咨询  来源《应用光学》作者王宇岚等 摘 要为了提高无人车在夜间情况下对周围环境的物体识别能力提出一种基于多视角通道融合网络的无人车夜间三维目标检测方法。引入多传感器融合的思想在红外图像的基础上加入激光雷达点云进行目标检测。通过对激光雷达点云进行编码变换成鸟瞰图形式和前视图形式与红外图像组成多视角通道各通道信息之间融合互补从而提高夜间无人车对周围物体的识别能力。该网络将红外图像与激光雷达点云作为网络的输入网络通过特征提取层、候选区域层和通道融合层准确地回归检测出目标的位置以及所属的类别。实验结果表明该方法能够提高无人车在夜间的物体识别能力在实验室的测试数据中准确率达到90%速度0.43 s/帧达到了实际应用要求。 关键词红外图像激光雷达点云多视角通道三维目标检测 引言 夜间无人车在道路上行驶需要感知周围环境的车辆、行人[1-2]等基于红外摄像头的感知方案[3-5]虽然能够感知车辆前方的障碍物但是无法准确获取障碍物的位置信息且准确率有限。激光雷达是一种主动传感器通过发射与接收激光光束获取环境中物体的信息[6-7]。近几年陆续有研究人员利用深度学习在激光雷达点云上进行目标检测斯坦福大学的Point Net[8]直接将激光点云作为输入并解决了旋转问题和无序性问题。2017年苹果公司Voxel Net[9]将激光雷达分成等间距的体素并引入新的体素特征编码表示在KITTI[10]上取得很好的成绩。清华大学提出了MV3D[11]将彩色图像与激光雷达点云融合进行三维目标检测该算法在KITTI 上也表现出色。 上述前人的研究工作基本都是在白天条件下的彩色图像上进行而在夜间无人车往往需要依赖红外图像但红外图像的成像原理是通过红外摄像头探测物体自身的红外辐射再通过光电变换将物体的温度分布变换成图像。红外图像具有无色彩、简纹理、低信噪比等特点。因此在红外图像上进行目标检测效果较差。考虑到各个传感器在不同方面均有利弊本文利用多传感器融合的思想提出了利用多视角通道融合网络的基于红外图像与激光雷达点云的夜间无人车三维目标检测方法。实验结果证明该方法的准确率高且能基本满足实时性的要求。 1 多视角通道融合网络 本文所采用的多视角通道融合网络由特征提取模块、候选区域生成模块和通道融合模块组成整体结构图如图1所示。 特征提取模块由特征编码网络和特征解码网络2 部分组成结构如图2所示。 图1 多视角通道融合网络结构图 Fig.1 Structure diagram of multi-view channel fusion network 图2 特征提取模块结构图 Fig.2 Structure diagram of feature extraction module 特征编码网络采用的是改进后的VGG(visual geometry group)16 网络[12]将原VGG16 网络的通道数减少一半至50%然后在网络中加入批标准化层并在Conv4 删除最大池化层。特征编码网络将M×N×C的红外图像、鸟瞰图或前视图作为输入并输出  的特征图。式中M表示图像的长N表示图像的宽C表示通道数。对于红外图像C为1。特征解码网络采用特征金字塔网络[13]的形式学习将特征映射上采样回原始的输入大小。特征解码网络将特征编码网络的输出作为输入输出新的 M×N×D的特征图如图2所示通过转换-转置操作对输入进行上采样处理并和来自特征编码网络的对应特征映射进行级联操作最后通过3×3 卷积来融合二者。 输入一幅鸟瞰图候选区域生成模块会生成一系列的三维候选区域。每个三维候选区域有六维的参数(x,y,z,l,w,h)分别表示三维候选区域在激光雷达坐标系中的中心坐标和长宽高尺寸。对于每个三维候选区域对应在鸟瞰图中的参数(xbv,ybv,lbv,wbv)利 用离散的 (x,y,l,w)变换可以得到表示三维候选区域在鸟瞰图中的坐标和长宽其中 离散分辨率为0.1 m。 通道融合模块结合各个视角的特征对各视角上的目标进行联合分类并针对三维候选区域进行定向回归。由于不同的视角有不同的分辨率对于每个视角通道所输出的不同分辨率的特征向量通过ROIregion of interest池化操作将每个视角通道所输出的特征向量调整到相同的长度。通过下式得到3 个视角不同的ROI。 式中T3D→v表示从激光雷达点云坐标系到鸟瞰图形式、前视图形式和红外图像的转换函数P3D表示三维候选区域参数向量。对于区域候选网络所生成的三维候选区域将其投影到经过ROI池化操作的鸟瞰图形式(BV)特征向量、前视图(FV)特征向量和红外图像(IR)特征向量中。对于从某个视角特征提取通道中输出的特征向量 x通过ROI池化获得固定长度的特征 fv。 式中R表示相应的矩阵变换。为了融合来自各个视角通道的特征信息采用多层次融合的方法分层融合多视角特征使得各通道的信息可以在中间层有更多的交互。如图3所示。 图3 通道融合网络结构图 Fig.3 Structure diagram of channel fusion network 对于通道融合网络的每一层输入为鸟瞰图形式、前视图形式以及红外图像3 个通道的特征经过一次逐元素平均计算后再经过各自的中间卷积层进一步提取特征。具体的融合过程如下式所示。 式中fl表示第 l层的融合结果fBV、fFV和 fIR分别表示鸟瞰图通道、前视图通道以及红外图像通道的输入特征 表示第l层不同通道的中间卷积层⊕表示逐元素平均运算经过通道融合网络融合各个视角通道的特征之后利用融合结果对候选区域模块生成的三维候选区域进行回归校正并将融合结果输入Softmax 分类器对三维候选区域内的物体进行分类识别。 2 实验内容 2.1 实验配置与数据预处理 本文算法中的网络基于Tensor Flow[14]框架实验硬件配置为处理器Intel i5-6600内存16 GB显卡NVIDIA GTX 1070操作系统Ubuntu14.04。实验的所有数据由载有红外摄像头和激光雷达的车辆在南京理工大学夜晚的校园道路上拍摄所得有车辆、行人和骑自行车的人3 种类别。其中训练集为1 500 张红外图像及其对应的由激光雷达点云数据验证集为500 张红外图像及其对应的由激光雷达点云数据测试集为600 张红外图像及其对应的由激光雷达数据。 对于激光雷达点云数据其中每一个点由其三维坐标 (x,y,z)和 反射率 r组成本文将其转化为鸟瞰图与前视图的形式。鸟瞰图形式指的是沿水平坐标系(地面)将激光雷达点云分割成700×800 的网格再沿Z轴方向把激光雷达点云平均分成5 层。对于每一个区域提取其中最大高度的点的高度作为高度特征该长方体区域内点的数目作为密度特征对于密度特征ρ作归一化处理。 式中N是长方体区域内点的数目。最后将激光雷达点云转换成通道数为700×800×6 的鸟瞰图形式。前视图形式指的是将激光雷达点云投射到一个前方的圆柱体平面上。给定激光雷达点云中的一个点的三维坐标 p(x,y,z)其在前视图中的坐标 pfv(r,c)可以通过下式计算得出。 式中Δθ是 激光的水平分辨率Δϕ是垂直分辨率。 2.2 实验结果及分析 把红外图像与激光点云数据输入到多视角通道融合网络中网络给出检测结果。由于红外摄像头与激光雷达的采集频率不一致本文根据激光雷达帧号匹配红外图像设定阈值为10 帧寻找与雷达帧号小于阈值且最接近的图像作为对应图像如图4所示。 图4 输入的红外图像与对应的激光雷达点云 Fig.4 Input infrared image and lidar point cloud 使用传统的AdaBoost[15]算法、和二维的目标检测算法Fast RCNN[16]算法、Faster RCNN[17]算法以及三维的目标检测算法Voxel Net[10]在测试集中进行测试并与本文算法进行结果对比结果见表1。 从表1的结果中可得本文算法在牺牲部分时间的情况下提高了夜间目标检测的正确率。为了更直观地显示本文算法结果将目标检测的结果显示在激光雷达点云的鸟瞰图形式上和红外图像上其中绿色矩形框表示行人红色矩形框表示车辆。如图5所示。 表1 不同算法在测试集上的结果对比 Table1 Comparison of results for different algorithms on test sets 图5 目标检测可视化结果 Fig.5 Visualized result of detection 由图5可以看出对于图5(a 组)本文算法可以很好地定位行人的位置对于图5(b 组)虽然红外图像分辨率较低连人眼也不容易分辨图片中的车辆但加入激光雷达点云信息后对于该车的定位准确对于图5(c 组)本文算法定位结果与人工标注信息一致。 3 结论 本文采用多传感器融合的思想在原有红外图像的基础上加入激光雷达点云并使用多视角通道融合网络对这2 种数据进行特征融合准确地检测出目标的位置以及类别。实验结果表明该方法能够提高无人车在夜间的物体识别能力在实验室的测试数据中准确率达到90%每帧耗时0.43 s达到实际应用要求。 我们的服务类型 公开课程 人工智能、大数据、嵌入式                     内训课程 普通内训、定制内训                          项目咨询 技术路线设计、算法设计与实现图像处理、自然语言处理、语音识别
http://www.huolong8.cn/news/149074/

相关文章:

  • 汕头微网站网站图标文件下载
  • 知名网站建设多少钱教你如何建设网站
  • 网站个性化制作百度识图网页版 在线
  • 网站域名过期个人网站前置审批项
  • 找券网站怎么做建设部评职称网站
  • 东莞网站制作有名 乐云践新管理咨询的定义
  • 中国建设银行信用卡官网站设计一个小程序需要多少钱
  • 家具网站策划书网站开发demo版本
  • 外贸网站建设soho徐州三华网架公司
  • 深圳的网站建设公司的外文名是深圳创业补贴政策2023申请条件
  • wordpress 手风琴插件唐山网站建设方案优化
  • 大气的门户网站什么是网页设计师
  • 找工作网站建设怎么建网上商城
  • 厦门设计师网站智联招聘企业登录入口
  • 个人网站首页导航栏ps制作教程廊坊网站建设-纵横网络 网站
  • 做一个网站要花多少钱网站建设是什么意思 打不开
  • 西安做网站哪家便宜网页美工设计流程的正确排序
  • 网站备案申请模板定制网站哪个好
  • 关于字体设计的网站珠海建网站价格
  • php网站开发模式有哪些企业网站建设的作用
  • 帝国 cms 网站关键字哈尔滨seo网站排名
  • 做投标的网站千库网怎么免费下
  • 南京网站建设网站制作公司的分类
  • 官方网站在哪里凉山建设局网站
  • 现代建设中国公司网站外贸wap网站
  • 建站公司还赚钱吗整个网站与网站模板的区别
  • 新开传奇网站单职业aspnet网站开发例题
  • 贵州住房和城乡建设局网站阿里巴巴网站建设基础服务
  • 上海十大网站排名如何备份wordpress
  • 公司网站建设款计什么科目湖南营销型网站建设磐石网络省钱