Pose machine:Articulated Pose Estimation via Inference Machines
由显式的图模型推断人体铰链模型到隐式地表达丰富的多部件关系的转折点!
介绍
估计铰链式人体姿态的复杂度来源有两个:
- 潜在骨架模型的自由度(20大约)导致的高位配置空间的搜索范围
- 图像中人体姿态的多变性
传统的图模型,基于树结构或者星状结构的简单图模型难以捕捉多部件之间的关系和依赖性,而且容易导致双重计数错误产生。 非树模型需要近似推断来解决,参数学习非常复杂! 图模型的第二个困难的地方是: > A second limitation of graphical models is that defining the potential functions requires careful consideration when specifying the types of interactions. This choice is usually dominated by parametric forms such as simple quadratic models in order to enable tractable inference [1]. Finally, to further enable efficient inference in practice, many approaches are also restricted to use simple classifiers such as mixtures of linear models for part detection [5]. These are choices guided by tractabilty of inference rather than the complexity of the data. Such tradeoffs result in a restrictive model that do not address the inherent complexity of the problem.
论文建立了一个类似于场景解析的层级推断机制来估计人体姿态
Pose machine
它是一个序列预测算法,它效仿了信息传递的机制来预测每一个人体部件的置信度,在每个阶段迭代提升它的预测能力
1.它联合了多变量之间的交互关系
2.它从数据中学习空间关系,而不需要精确的参数模型
3.它模块化的架构能够允许使用高承载的预测器来处理不同形状的姿态
解决在传统模型人体姿态估计的两大难点。
可以这么说,pose machine最重要的想法就是:运用级联,将对每个单独部件的估计信息结合起来,从中提取语义特征再进一步地精确估计下个阶段的每个部件位置。这个思想是开创性的,它不仅符合人类的直觉,并且实验证明是有提升效果的,后来的CPM,用卷积网络的架构准确实现了这一方法,取得了当时的最好效果,对各种形状的人体姿态都有帮组,在2016年,CPM在MPII,LSP,FLIC数据库上都到达了最好表现,而近年来成功的关于姿态估计的所有论文都几乎蕴含了这一思想:试图归纳出图中全局的信息作为下个级联阶段的预测,比如stacker hourglass、cpn
本博客详见 Pose-Machine