全球旧事资料 分类
局部空时片段LocalSpatio.TemporalPatches之间的运动相似度来寻求匹配。然而,从视频体分割出分体再进一步得到空时片段,反复地匹配空时片段之间的相似度,同样也会产生巨大的计算花费。Shechtma
和Ira
i221通过发掘空时运动之间的相关性实现未知行为数据与模板之间的匹配。Ke掣241通过空间观上的像素点聚类得到分体,分体是空间上的连续区域,而视频体可以看成是任意形状分体的集合。给定的一段视频被重复分割成多个分体,将每个分体区域与已知行为的模板相匹配,寻找与模板达到最大匹配的最少分体的集合。Yua
等【5I】利用基于贝叶斯的互信息最大化方法将提取的空时兴趣点根据其所属的行为类别按正/负投票输出,行为检测即是寻找包含最大投票输出值的分体。分体匹配法容易受到背景变化的影响,但对噪声及遮挡等干扰因素则具有一定征【23】,则可降低这类方法对表观变化的敏感性。4基于张量的方法将行为表示为三维空时体,则可以很自然地作为一个三阶张量,其中两维表示空间,另一维表示时间。传统的视频处理方法需要将视频中人体行为所在的每帧图像转为向量并按时问顺序堆叠成矩阵处理,由于矩阵的向量由图像转换而来,一般具有很高的维数,以100x120大小的图像为例,对应于矩阵中的向量为12000维。与这种传统表示相比,张量以自然地形式表示数据,既避免造成了维数灾难,又保留了视频数据内部图像的窄问结构信息。Kim等【25】将典型性相关分析CCA扩展应用到三阶张量情形,实现测试行为与已知类别行为之间相关性的直接度量。Vasilescu261将行为类别、人的身份及关节轨迹分别作为张量独立的一维,构成高阶三阶或三阶以上张量,张量分解为对应的模式则可得到行为类别或行为者的身份。Wblf等27】把Low.Ra
kSVM扩展到张量空间并用于行为识别。当然,张量方法也可与其它方法相结合,如凌等【521采用Te
sorPCA、Te
sorLPP及有监督的Te
sorLPP获取行为的低维特征表示,进而通过最近邻方法识别各种不同行为。基于张量的方法不需要中间层表示,比如部分、分体等,直接在行为之间实现整体匹配。其它特征如光流场、空时滤波响应等也可加入到张量框架中,作为张量空间中任何独立的一维构成高阶张量,以增强不同行为之问的可辨识度。2.3参数时序方法非参数方法和空时体方法一般用于识别简单行为固,而参数时序法则更适用于复杂行为,如芭蕾舞视频中的旋转动作,交响乐中的指挥手势等。1隐马尔可夫模型删隐马尔可夫模型能够匹配时变数据,是一种r
好听全球资料 返回顶部