行人检测(Pedestrian Detection)资源整合

晋弘义

2023-12-01

一、纸
评论文章分类：
[1] D. Geronimo, and A. M.Lopez. Vision-based Pedestrian Protection Systems for Intelligent Vehicles, BOOK, 2014.
[2] P.Dollar, C. Wojek,B. Schiele, et al. Pedestrian detection: an evaluation of the state of the art [J].IEEE Transactions on PatternAnalysis andMachine Intelligence, 2012, 34(4): 743-761.
[3]苏松志, 李绍滋, 陈淑媛等. 行人检測技术综述[J]. 电子学报, 2012, 40(4): 814-820.
[4]M. Enzweiler, and D.Gavrila. Monocular pedestrian detection: survey and experiments [J]. IEEE Transactions on Pattern Analysis andMachine Intelligence, 2009, 31(12): 2179-2195.
[5] D. Geronimo, A. M.Lopez and A. D. Sappa, et al. Survey of pedestrian detection for advanced driverassistance systems [J]. IEEE Transactionson Pattern Analysis and Machine Intelligence, 2010, 32(7): 1239-1258.
[6]贾慧星, 章毓晋.车辆辅助驾驶系统中基于计算机视觉的行人检測研究综述[J], 自己主动化学报, 2007, 33(1): 84-90.
[7] 许言午, 曹先彬,乔红. 行人检測系统研究新进展及关键技术展望[J], 电子学报, 2008, 36(5): 368-376.
[8] 杜友田; 陈峰;徐文立; 李永彬;基于视觉的人的运动识别综述, 电子学报, 2007. 35(1): 84-90.

[9]朱文佳. 基于机器学习的行人检測关键技术研究[D]. 第一章, 硕士学位论文, 上海交通大学. 2008. 指导教师: 戚飞虎.

2014_ECCV_30Hz Object Detection with DPM V5
2014_ECCV_Knowing a good HOG filter whenyou see it: Efficient selection of filters for detection
2014_ECCV_Unsupervised Dense ObjectDiscovery, Detection, Tracking and Reconstruction
2014_ECCV_Comparing Salient ObjectDetection Results without Ground Truth
2014_ECCV_RGBD Salient Object Detection: ABenchmark and Algorithms
2014_ECCV_Saliency Detection with Flash andNo-flash Image Pairs
2014_ECCV_Object Co-Detection via EfficientInference in a Fully-Connected CRF
2014_ECCV_Context as Supervisory Signal:Discovering Objects with Predictable Contex
2014_ECCV_Object Detection and ViewpointEstimation with Auto-masking Neural Network
2014_ECCV_Deep Learning of Scene-specificClassifier for Pedestrian Detection
2014_ECCV_Spatio-Temporal Object DetectionProposals
2014_ECCV_Strengthening the Effectivenessof Pedestrian Detection with Spatially Pooled Features
2014_ECCV_Video Object Discovery andCo-segmentation with Extremely Weak Supervision
2014_ECCV_Face detection without bells andwhistles
2014_ECCV_Human Detection using LearnedPart Alphabet and Pose Dictionary
2014_ECCV_SPADE: Scalar Product Acceleratorby Integer Decomposition for Object Detection
2014_ECCV_Towards UnifiedObject Detection and Segmentation
2014_ECCV_Depth Based Object Detection fromPartial Pose Estimation of Symmetric Objects
2014_ECCV_Training Deformable Object Modelsfor Human Detection based on Alignment and Clustering
2014_ECCV_Spatio-temporal Matching forHuman Detection in Video
2014_ECCV_Facial Landmark Detection by DeepMulti-task Learning
2014_ECCV_Latent-Class Hough Forests for 3DObject Detection and Pose Estimation
2014_ECCV_GIS-assisted Object Detection andgeospatial localization
2014_ECCV_Sliding Shapes for 3D Object Detectionin Depth Images
2014_ECCV_Integrating Context and Occlusionfor Car Detection by Hierarchical And-Or Model
2014_ECCV_Simultaneous Detection andSegmentation
2014_ECCV_Learning Rich Features from RGB-DImages for Object Detection and Segmentation
2014_ITS_Toward real-time pedestrian detection based on a deformable template model
2014_PAMI_Scene-specific pedestrian detection for static video surveillance
2014_CVPR_Pedestrian Detection in Low-resolution Imagery by Learning Multi-scale Intrinsic Motion Structures (MIMS)
2014_CVPR_Switchable Deep Network for Pedestrian Detection
2014_CVPR_Informed Haar-like Features Improve Pedestrian Detection
2014_CVPR_Word Channel Based Multiscale Pedestrian Detection Without Image Resizing and Using Only One Classifier
2013_BMVC_Surveillance camera autocalibration based on pedestrian height distribution
2013_Virtual and real world adaptation for pedestrian detection
2013_Search space reduction in pedestrian detection for driver assistance system based on projective geometry
2013_CVPR_Robust Multi-Resolution Pedestrian Detection in Traffic Scenes
2013_CVPR_Optimized Pedestrian Detection for Multiple and Occluded People
2013_CVPR_Pedestrian Detection with Unsupervised and Multi-Stage Feature Learning
2013_CVPR_Single-Pedestrian Detection aided by Multi-pedestrian Detection
2013_CVPR_Modeling Mutual Visibility Relationship in Pedestrian Detection
2013_CVPR_Local Fisher Discriminant Analysis for Pedestrian Re-identification

二、DataSets

MIT数据库
该数据库为较早公开的行人数据库，共924张行人图片（ppm格式。宽高为64x128）。肩到脚的距离约80象素。该数据库仅仅含正面和背面两个视角。无负样本，未区分训练集和測试集。

Dalal等採用“HOG+SVM”。在该数据库上的检測准确率接近100%。

INRIA数据库
该数据库是眼下使用最多的静态行人检測数据库，提供原始图片及对应的标注文件。训练集有正样本614张（包括2416个行人）。负样本1218张。測试集有正样本288张（包括1126个行人）。负样本453张。图片中人体大部分为站立姿势且高度大于100个象素，部分标注可能不对。图片主要来源于GRAZ-01、个人照片及google，因此图片的清晰度较高。在XP操作系统下部分训练或者測试图片无法看清晰，但可用OpenCV正常读取和显示。

Daimler行人数据库
该数据库採用车载摄像机获取，分为检測和分类两个数据集。

检測数据集的训练样本集有正样本大小为18x36和48x96的图片各15560（3915x4）张，行人的最小高度为72个象素；负样本6744张（大小为640x480或360x288）。

測试集为一段27分钟左右的视频（分辨率为640x480），共21790张图片，包括56492个行人。

分类数据库有三个训练集和两个測试集。每一个数据集有4800张行人图片。5000张非行人图片，大小均为18x36，另外还有3个辅助的非行人图片集。各1200张图片。

Caltech行人数据库
该数据库是眼下规模较大的行人数据库。採用车载摄像头拍摄，约10个小时左右，视频的分辨率为640x480，30帧/秒。标注了约250,000帧（约137分钟）。350000个矩形框。2300个行人。另外还对矩形框之间的时间相应关系及其遮挡的情况进行标注。

数据集分为set00~set10，当中set00~set05为训练集，set06~set10为測试集（标注信息尚未公开）。性能评估方法有下面三种：（1）用外部数据进行训练，在set06~set10进行測试。（2）6-fold交叉验证，选择当中的5个做训练。另外一个做測试，调整參数，最后给出训练集上的性能；（3）用set00~set05训练，set06~set10做測试。因为測试集的标注信息没有公开。须要提交给Pitor Dollar。结果提交方法为每30帧做一个測试。将结果保存在txt文档中（文件的命名方式为I00029.txt I00059.txt ……）。每一个txt文件里的每行表示检測到一个行人，格式为“[left, top,width, height, score]”。假设没有检測到不论什么行人，则txt文档为空。该数据库还提供了对应的Matlab工具包，包含视频标注信息的读取、画ROC（Receiver Operatingcharacteristic Curve）曲线图和非极大值抑制等工具。

TUD行人数据库
TUD行人数据库为评估运动信息在行人检測中的作用。提供图像对以便计算光流信息。训练集的正样本为1092对图像（图片大小为720x576，包括1776个行人）。负样本为192对非行人图像（手持摄像机85对，车载摄像机107对）。另外还提供26对车载摄像机拍摄的图像（包括183个行人）作为附加训练集。

測试集有508对图像（图像对的时间间隔为1秒，分辨率为640x480）。共同拥有1326个行人。Andriluka等也构建了一个数据库用于验证他们提出的检測与跟踪相结合的行人检測技术。该数据集的训练集提供了行人的矩形框信息、切割掩膜及其各部位（脚、小腿、大腿、躯干和头部）的大小和位置信息。

測试集为250张图片（包括311个全然可见的行人）用于測试检測器的性能。2个视频序列（TUD-Campus和TUD-Crossing）用于评估跟踪器的性能。

NICTA行人数据库
该数据库是眼下规模较大的静态图像行人数据库，25551张含单人的图片，5207张高分辨率非行人图片，数据库中已分好训练集和測试集，方便不同分类器的比較。

Overett等用“RealBoost+Haar”评估训练样本的平移、旋转和宽高比等各种因素对分类性能的影响：（1）行人高度至少要大于40个象素；（2）在低分辨率下，对于Haar特征来说。添加样本宽度的性能好于添加样本高度的性能。（3）训练图片的大小要大于行人的实际大小。即背景信息有助于提高性能。（4）对训练样本进行平移提高检測性能，旋转对性能的提高影响不大。

以上的结论对于构建行人数据库具有非常好的指导意义。

ETH行人数据库
Ess等构建了基于双目视觉的行人数据库用于多人的行人检測与跟踪研究。该数据库採用一对车载的AVT Marlins F033C摄像头进行拍摄。分辨率为640x480，帧率13-14fps，给出标定信息和行人标注信息，深度信息採用置信度传播方法获取。

CVC行人数据库
该数据库眼下包括三个数据集（CVC-01、CVC-02和CVC-Virtual）。主要用于车辆辅助驾驶中的行人检測研究。

CVC-01[Geronimo,2007]有1000个行人样本，6175个非行人样本（来自于图片中公路区域中的非行人图片。不像有的行人数据库非行人样本为天空、沙滩和树木等自然图像）。CVC-02包括三个子数据集（CVC-02-CG、CVC-02-Classification和CVC-02-System），分别针对行人检測的三个不同任务：感兴趣区域的产生、分类和系统性能评估。图像的採集採用Bumblebee2立体彩色视觉系统，分辨率640x480，焦距6mm，对距离摄像头0~50m的行人进行标注。最小的行人图片为12x24。

CVC-02-CG主要针对候选区域的产生。有100张彩色图像，包括深度和3D点信息。CVC-02-Classification主要针对行人分类。训练集有1016张正样本，7650张负样本，測试集分为基于分割窗体的分类（570张行人。7500张非行人）和整张图片的检測（250张包括行人的图片，共587个行人）。CVC-02-System主要用于系统的性能评估，包括15个视频序列（4364帧），7983个行人。

CVC-Virtual是通过Half-Life 2图像引擎产生的虚拟行人数据集。共包括1678虚拟行人，2048个非行人图片用于測试。

USC行人数据库
该数据库包括三组数据集（USC-A、USC-B和USC-C），以XML格式提供标注信息。

USC-A[Wu, 2005]的图片来自于网络。共205张图片，313个站立的行人，行人间不存在相互遮挡，拍摄角度为正面或者背面；USC-B的图片主要来自于CAVIAR视频库，包括各种视角的行人，行人之间有的相互遮挡，共54张图片，271个行人。USC-C有100张图片来自网络的图片。232个行人（多角度）。行人之间无相互遮挡。

三、Source Code
1.INRIA Object detection and Localization Toolkit, Dalal于2005年提出了基于HOG特征的行人检測方法，行人检測领域中的经典文章之中的一个。

HOG特征眼下也被用在其它的目标检測与识别、图像检索和跟踪等领域中。
2. Real-time Pedestrian Detection. Jianxin Wu实现的高速行人检測方法。
3. Hough Transfom for Pedestrian Detection. Olga Barinova, CVPR 2010 Paper: On detection of multiple object instances using Hough Transforms
4. HIKSVM, HOG+LBP+HIKSVM, 行人检測的经典方法.
5. GroundHOG, GPU-based Object Detection with Geometric Constraints, In: ICVS, 2011. CUDA版本号的HOG+SVM, video.
6. 100FPS_PDS, Pedestrian detection at 100 frames per second, R. Benenson. CVPR, 2012. 实时的(⊙o⊙)哦。 Real-time!!!
7. POM: Probabilistic Occupancy Map. Multiple camera pedestrian detection.
8. Pitor Dollar Detector. Integral Channel Feature + 多尺度特征近似+多特征融合. Real-Time!

行人检测(Pedestrian Detection)资源整合

相关阅读

相关文章

相关问答

相关文档