营销型网站建设申请域名,免费开源小程序商城源码,html个人网页完整代码模板,wordpress误删插件这是期刊论文的版本#xff0c;不是会议论文的版本。看了论文之后#xff0c;只能说#xff0c;太TM聪明了。膜拜~~ 视频的表示方法有很多#xff0c;一般是把它看作帧的序列。论文提出一种新的方法去表示视频#xff0c;用ranking function的参数编码视频的帧序列。它使用…这是期刊论文的版本不是会议论文的版本。看了论文之后只能说太TM聪明了。膜拜~~ 视频的表示方法有很多一般是把它看作帧的序列。论文提出一种新的方法去表示视频用ranking function的参数编码视频的帧序列。它使用一个排序函数ranking function主要基于这样的假设帧的appearance的变化与时间相关如果帧vt1在vt后面则定义此外假设同一动作的视频帧序列学习到的排序函数的参数应该的大致一致的。但实际上后面的假设并没有给出严格的证明只能说实验的结果证明了这样的想法。 参数定义 假设输入的原始帧为x则一个视频的帧序列为。把原始帧序列经过smooth操作得到新的序列。但实际上这个新的序列可以是与原始帧有同样大小的image也可以是原始帧的特征向量。视频的实际动态信息为D而使用一个线性排序函数编码视频的动态信息为u是函数的参数也就是需要学习的对象并用它来表示一个视频。那么学习的目标就是 Rank pooling Rank pooling 的方法是使用一个RankSVM的学习排序算法计算的。整个Rank pooling的学习过程可以总结如下1输入的数据为处理过的帧序列V由于RankSVM实际上是有监督学习所以序列的顺序是知道的2如上定义了序列的先后顺序定义正例样本为其中时间ti在tj之后反例样本为它的相反数。3可以通过SVM的学习算法学习如下的凸优化问题 4如果学习到的参数为u则一个vi的score定义为并且有。 Rank pooling方法的优点 1与其他的pooling方法对比如max poolingaverage pooling对比它的鲁棒性更好。 2训练的过程是一个最优化问题所以它的参数可以很好地表达数据的隐含结构。 其他参数化的视频表示方法 论文在这里主要介绍了一种PCA的方法提取k个特征向量达到降维的目标这k个主成分同样反映了视频序列的结构。 Smooth操作 这里使用的smooth的操作是time varying mean vector定义一个mean为则smooth后的image为。使用time varying mean vector学习RankSVM之后的向量u计算每一帧的score如下图 可以看到它几乎是有序严格上升的这表明可以很好地区分出帧的先后顺序。从另一个方面而言这种方法可以看到它刻画了帧与时间的关系。 非线性的rank pooling 通过对输入应用一个非线性映射来获得。由于RankSVM其实也是学习SVM所以可以应用一个非线性的核论文选用的是Hellinger核 训练的过程 1对输入的每一帧计算它们的特征向量HOG、HOF、MBH、TRJ2对特征向量进行smooth然后通过学习RankSVM得到参数u3通过训练数据来类别的SVM。 对于第1、2步的提取特征向量一步似乎并不是必要的个人认为。转载于:https://www.cnblogs.com/jie-dcai/p/5755650.html