网站内容建设和运营工作内容,wordpress如何引入layui路径,国美在线网站建设,郑州网站优化工资见人细过 掩匿盖覆” 1. 意义2. 做法2.1 词袋模型和字典2.1.2 感知偏差和感知变异2.1.2 词袋2.1.3 字典 2.2 匹配(相似度)计算 3. 提升 前言#xff1a; 前端提取数据#xff0c;后端优化数据#xff0c;但误差会累计#xff0c;需要回环检测构建全局一致的地图… 见人细过 掩匿盖覆” 1. 意义2. 做法2.1 词袋模型和字典2.1.2 感知偏差和感知变异2.1.2 词袋2.1.3 字典 2.2 匹配(相似度)计算 3. 提升 前言 前端提取数据后端优化数据但误差会累计需要回环检测构建全局一致的地图
1. 意义
通俗的讲机器人两次经过同一个场景为了检测是同一个场景这就是回环检测。它可以用来构建全局一致的地图。有了时隔更加久远的约束一定程度消除累计飘移。形象的想弹簧就是把原来已经优化好的拉的更贴近真实位置。回环检测还可以做重定位在跟踪丢失的时候。
2. 做法
以下是几种做法
取当前图像和历史所有图像一一进行特征提取并比对通过匹配的数量确定。O( n 2 n^2 n2)缺点资源还是上边的方法但不一一匹配随机抽取可检测到的帧少很多里程计配合给一个大致位置这里的进行回环检测缺点里程计自带误差只能小范围基于外观主流其中一种就是词袋模型。
2.1 词袋模型和字典
2.1.2 感知偏差和感知变异
感知偏差(假阳性)感知变异(假阴性) 准确率(检测正确的数量 / 检测的总数量): P r e c i s i o n T P / ( T P F P ) Precision TP/(TPFP) PrecisionTP/(TPFP) 召回率(实际检测出来的数量 / 理应检测出来的数量): R e c a l l T P / ( T P F N ) Recall TP/(TPFN) RecallTP/(TPFN)
一般这两个数据呈矛盾不取极端只说在recall为多少pre为多少时候效果最好一般我们对P的要求更高。这是回环检测的严格性导致的。
2.1.2 词袋
字典实际就是对所有图片中的特征进行提取比如人车等它们是单词对全部图像特征提取所有单词(特征)后构成一个字典。词袋说的是一帧图像中能够提取出来的单词。
比如现在有一本4个特征的字典 D [ x 1 , x 2 , x 3 , x 4 ] D [x_1,x_2,x_3,x_4] D[x1,x2,x3,x4] 而我们有两个 x 1 x_1 x1 一个 x 3 x_3 x3 特征的图像那用词袋可以记为 A 2 ⋅ x 1 0 ⋅ x 2 1 ⋅ x 3 0 ⋅ x 4 A 2\cdot x_1 0\cdot x_2 1\cdot x_3 0\cdot x_4 A2⋅x10⋅x21⋅x30⋅x4 它的向量就是 A [ 2 , 1 , 0 , 0 ] A [2,1,0,0] A[2,1,0,0]
那么检测两个图像则举例可以用 s ( a , b ) 1 − 1 W ∣ ∣ a − b ∣ ∣ 1 s(a,b) 1 - \frac{1}{W}||a-b||_1 s(a,b)1−W1∣∣a−b∣∣1
L1范数各元素绝对值之和向量完全一样则得到1是回环。
2.1.3 字典
字典里的单词是某一类特征的组合类似于一个聚类问题UML(无监督学习常见问题)。
假设要做 k k k 个单词的字典可以用K-meansK-means等实现这里以K-means(均值)为例 字典规模大要在字典中查找单词属于哪个逐个查找复杂度 O ( n ) O(n) O(n)参考数据结构这里有很多优化方法这里以最简单的K叉树为例去优化字典结构 又很像K-D树聚类类中类聚中聚哈哈。一棵深度为 d d d 分支为 k k k 的树可以容纳 k d k^d kd 单词。
2.2 匹配(相似度)计算
两个概念
TF(Term Frequency)译频率 某单词在一副图像中经常出现它的区分度就高IDFInverse Document Frequency)逆文档频率 某单词在字典中出现的频率低它的区分度就高 在做字典时候用IDF假设所有特征总数为 n n n 当前要统计的单词特征 w i w_i wi 的数量为 n i n_i ni 则此单词的IDF为 I D F i l o g n n i IDF_i log \frac{n}{n_i} IDFilognin 对一副图像而言假设特征/单词 w i w_i wi 出现了 n i n_i ni 次而这幅图一共出现的单词数量为 n n n则TF为 T F i n i n TF_i \frac{n_i}{n} TFinni 基于以上知识一个图像的特征点可以对应到很多单词则它的词袋BOW为 A ( w 1 , η 1 ) , ( w 2 , η 2 ) , . . . , ( w N , η N ) ⟺ v A A {(w_1, \eta _1), (w_2, \eta _2), ... , (w_N, \eta _N)} \iff v_A A(w1,η1),(w2,η2),...,(wN,ηN)⟺vA 词袋中有很多0值因为它不能包含字典中所有词。 计算两图词袋的差异(匹配度)给出一种方式(一范数)还有很多 s ( v A − v B ) 2 ∑ i 1 N ∣ v A i ∣ ∣ v B i ∣ − ∣ v A i − v B i ∣ s(v_A - v_B) 2\sum^N_{i1}|v_{Ai}| |v_{Bi}|-|v_{Ai}-v_{Bi}| s(vA−vB)2i1∑N∣vAi∣∣vBi∣−∣vAi−vBi∣
3. 提升
对于回环检测有几点可以提升的部分
增加字典规模相似性评分处理 对于环境外观相似比如教室同款椅子很多利用先验的相似度(某时刻关键帧图像与上一时刻关键帧的相似性)进行归一化 s ( v t , v t j ) ′ s ( v t , v t j ) / s ( v t , v t − Δ t ) s(v_t,v_{tj}) s(v_t,v_{tj})/s(v_t,v_{t-\Delta t}) s(vt,vtj)′s(vt,vtj)/s(vt,vt−Δt) 关键帧处理 相邻帧肯定满足回环检测条件因为变化太小所以回环检测的帧一般稀疏检测到的回环相邻帧意义不大一帧就可以优化轨迹因此会把相近的回环聚类成一类使算法不会反复检测同一类。 验证 词袋没有顺序相机颠倒也是回环如何验证 回环缓存机制是一种单词检测到的回环不足以构成约束在一段时间内一直检测到的回环才是正确的回环(时间上的一致性检测) 机器学习应用于类别 图像连续变化产生不同类别甚至可以认为是连续的 图像间相似性可以利用深度学习方法 词袋方法的物体识别能力不如神经网络回环检测类似。