网站建设的几点体会,男的做直播网站,成武菏泽网站建设,住房和城乡建设厅证书查询网2022CIKM
1 intro
1.1 背景
轨迹相似度计算是轨迹分析任务#xff08;相似子轨迹搜索、轨迹预测和轨迹聚类#xff09;最基础的组件之一现有的关于轨迹相似度计算的研究主要可以分为两大类#xff1a; 传统方法 DTW、EDR、EDwP等二次计算复杂度O(n^2)缺乏稳健性 会受到非…2022CIKM
1 intro
1.1 背景
轨迹相似度计算是轨迹分析任务相似子轨迹搜索、轨迹预测和轨迹聚类最基础的组件之一现有的关于轨迹相似度计算的研究主要可以分为两大类 传统方法 DTW、EDR、EDwP等二次计算复杂度O(n^2)缺乏稳健性 会受到非均匀采样、噪点的影响基于学习的方法 旨在减少计算复杂度和/或提高稳健性根据它们的目的将它们分为两个方向 神经逼近方法 利用强大的神经网络在隐藏空间中逼近任何现有的轨迹测量 训练一个神经网络g以将轨迹编码到隐藏空间 最小化估计的相似性和基准之间的差异 Dh是隐藏空间中的差异相似性测量例如欧几里得距离 不需要两个轨迹之间的点对齐因此计算复杂度在轨迹的长度上是线性的 由于要逼近的测量而遭受 稳健性问题 auto-encoder 方法 无监督地学习映射函 为了提高潜在表示相对于低质量的鲁棒性这些方法采用了不同的策略 t2vec利用去噪顺序自编码器 Trembr整合了路网信息并设计了多个任务 在训练编码模型方面 效率低下。 这是由于顺序自编码器架构的固有限制其中解码过程和逐步重构非常耗时 t2vec 在 Tesla K40 GPU 上训练 2千万轨迹的一个epoch大约需要 14 小时平均每个轨迹有 60 个样本 这些方法试图学习相同基础路线轨迹高采样轨迹的一致表示以解决质量问题 换句话说即使来自相同基础路线的轨迹具有不同的采样率和噪点表示应该是相同的 论文认为由于他们的目标是重构轨迹而不是基础路线顺序自编码器无法实现这一目标 ——对于顺序自编码器来说 获得一致的表示是非常困难的
1.2 论文思路
提出了一种基于对比学习的轨迹相似性计算的新型鲁棒模型CL-TSim 遵循常见的范例首先学习轨迹的表示然后使用欧几里得距离在编码空间中计算轨迹之间的相似性对轨迹 Ti 进行预处理以获得增强轨迹 Tj 其中使用下采样和扭曲增强来适应轨迹特征包括非均匀采样率和噪点同时将它们编码到隐藏空间并最大化它们之间的一致性 遵循对比学习架构CL-TSim 只包含一个编码器和一个投影器 编码器用于编码原始轨迹以学习它们的表示投影器用于将表示映射到损失函数的度量空间与顺序自编码器相比它不需要解码器和逐步重构这可以显著减少训练时间。 2 Preliminary
2.1 基础路线
由移动对象生成的连续空间曲线只存在于理论中因为配备了 GPS 的设备无法连续记录时空位置
2.2 轨迹
移动对象的轨迹记为 T从基础路线中采样的一系列有限点的序列形式为 ((1,1,1),(2,2,2),...,(,,))xi,yi 代表在时间戳 的采样位置的经度和纬度信息受采样方法和设备的影响轨迹通常基于不同的采样率生成并包含有噪点
2.3 问题定义
给定一组轨迹我们的问题是设计一个高效且鲁棒的模型以计算轨迹之间的相似性目标如下
1高效的表示学习有效地为每个轨迹 T 学习一个表示 t其中 t 可以反映轨迹 T 的基础路线用于计算轨迹相似性 2模型的鲁棒性换句话说两个任意轨迹Ti 和Tj 之间的相似性是一致的不受非均匀采样率和噪点的影响
3 模型 4 实验
4.1 数据 4.2 评估方法
4.2.1 自相似性
给定一组轨迹随机选择 m 条轨迹和 n 条轨迹分别记为 Q 和 D 对于 Q 中的每条轨迹通过交替从中取点来创建两个子轨迹称为双胞胎轨迹并将第一个子轨迹加入 Q1而另一个加入 Q2对于 Q1 中的每条轨迹称为查询轨迹我们在Q2∪D 中检索最相似的轨迹称为数据库轨迹显然Q2 中的轨迹应该排在 D 之前因为它们是由与 Q1 中相同的轨迹生成的假设 Ti 是 Q1 中的一个查询轨迹而 Tj 是 Q2 中的相应双胞胎轨迹 计算 Ti 与 Q2∪D1 之间轨迹的相似性根据相似性对轨迹进行排序并记 Tj 的排名为 ri基于此采用两个广泛使用的度量标准即精确度 P 和平均排名 MR
当 ri 等于 0 时pi 等于 1否则pi 等于 0。只有查询数据集里面Tj是最相似的才会是1
更大的 P 或更小的 MR 值意味着更好的自相似性性能。
4.2.2 交叉相似性
一个好的相似性度量应该能够保持两个不同轨迹之间的相似性而不考虑数据采样策略
交叉距离偏差CDD来评估性能 Ta 和 Tb 是具有原始率的两个不同的轨迹Ta′(rd) 是通过以 d 的速率随机丢弃或扭曲样本点获得的Ta 的变体而 Tb′(rd) 是以与 Ta′(rd) 相同的方式获得的 Tb 的变体。
较小的 CDD 值表明评估的相似性即距离更接近真实值。 4.3 结果 、