这个repo的内容是我在硕士研究生期间学到的很多deep learning内容的大汇总,我的研究方向是pose estimation。仓库里包含了2d和3d pose estimation的一些代码和我的一些读过的觉得比较有用的文章、简单的paper reading和理解内容。代码部分包含了一些pose estimation常用的工具,其中一些需要用到的比如关键点gaussian heatmap生成的代码,性能评估,一些数据集的不同框架下的dataloader,比如mpii下的pytorch dataloader等等。
以2d相关工作为主。长期更新,看到新文章或是有意思的问题都会更新汇总进来。
大幅更新dl相关心得。
深度学习相关内容请参见传送门:https://github.com/IcewineChen/Pose-estimation_tutorials/tree/master/deep_learning从扯王八犊子到很多炼丹体验心得到具体的一些理论分析。
长期更新,总结和分享学到的pose estimation和deep learning,计算机视觉相关的内容。
目前的2D Pose estimation主要分为两类:第一类是单人pose estimation,目前主流方法以stacked hourglass或者convulution pose machine结构为基础为主,后续多次的state-of-the-art主要基于这两种结构的基础上再进行改动,多数以堆积一些新的trick提高性能为主。
到底什么是pose estimation?可以这么理解:对人体的姿态信息进行估计,通过人体骨架的形式表现出来。如下面这张图:
这张图表明了姿态估计的任务要求:获取关键点位置,最终表达成骨架的形式。目前常见的姿态估计的任务细分主要是单人的姿态估计和多人姿态估计,单人姿态估计较成熟,以stacked hourglass为基础结构的一系列网络已经基本摸到了天花板。多人上目前还有提升空间,主要以自顶向下方法:先检测人再对每个人分别做姿态估计,和自底向上方法:先检测所有关键点,再分配的人构建多人姿态估计结果为主。自顶向上依赖检测器和后续的冗余信息处理,但是随着目前检测器性能的上升,将各种精度高的模块组合之后性能好。自底向下性能不如自顶向下好,但是由于省去了检测人的步骤,速度快,可以实现实时的多人pose estimation。具体的一些介绍和tutorial可参见tutorials部分,传送门:https://github.com/IcewineChen/Pose-estimation_tutorials/blob/master/tutorials/Posetutorial.ipynb
关于自顶向下和自底向上方法的区别,请见https://github.com/IcewineChen/Pose-estimation_tutorials/blob/master/tutorials/top-down.ipynb
Cascaded Pyramid Network for Multi-Person Pose Estimation, 2018 CVPR
MultiPoseNet: Fast Multi-Person Pose Estimation using Pose Residual Network, 2018 ECCV
DensePose: Dense Human Pose Estimation In The Wild, 2018 CVPR
LSTM Pose Machines, CVPR 2018
Generative Partition Networks for Multi-Person Pose Estimation,2018 ECCV
18年目前没看到很好的单人估计相关文章。大概stacked hourglass融入的各种trick已经导致性能很难大幅上升,基于stacked hourglass相对最好的工作大概是17 ICCV的PRM?目前18年ECCV的MSSNet已经超过PRM-B(2018.9.5更新),在下面的经典文章中有提到。一些经典的单人姿态估计文章和方法在下面会有提到。
18年ECCV文章列表:
Multi-Scale Structure-Aware Network for Human Pose Estimation,2018 ECCV
Pose partition networks for Multi-person Pose Estimation, 2018 ECCV
Integral Human Pose Regression,MSRA
Stacked Hourglass Networks for Human Pose Estimation, 2016 ECCV
Convolutional pose machines, 2016 CVPR
Learning Feature Pyramids for Human Pose Estimation, 2017 ICCV
Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields, 2017 CVPR
Associative Embedding: End-to-End Learning for Joint Detection and Grouping, 2017 NIPS
RMPE: Regional Multi-person Pose Estimation, 2017 ICCV
Adversarial PoseNet: A Structure-aware Convolutional Network for Human Pose Estimation,arxiv
Self Adversarial Training for Human Pose Estimation
stacked hourglass频繁作为baseline,被后续很多文章借鉴和改进。这几天对ECCV的pose文章进行了调研,把accepted list中挂在arxiv上的文章简单读了一下,发现2016年的stacked hourglass直到18年还是很多方法在借鉴和修改。很多文章在上面已经提到了,在这里总结一下,把一些有代表性思路的文章贴出来,方便大家沿着这条线研究,也整理一下自己的思路。
and so on……还有不少,但是我一时间印象深刻的就这几篇。想起一点更新一点。
很多top-down方法用stacked hourglass做姿态估计器的多人pose estimation暂时先不归类。
版本 3.4.6 1 Introduction to OpenCV OpenCV介绍 Learn how to setup OpenCV-Python on your computer! 2 Gui Features in OpenCV Here you will learn how to display and save images and videos, control mouse even
机器人 检测点云中的抓取姿势 Grasp Pose Detection (GPD) 扩展实例编写 flyfish 环境 Ubuntu16.04 ROS kinetic Detect Grasps With an RGBD camera 使用RGBD摄像机检测抓取 语言:C++ 相机:astra 在CmakeLists中添加: add_compile_options(-std=c++11) add
Pose Estimation tutorials https://github.com/IcewineChen/Pose-estimation_tutorials