像玩乐高一样拆解Faster R-CNN:详解目标检测的实现过程
https://mp.weixin.qq.com/s/M_i38L2brq69BYzmaPeJ9w
直接参考开源目标检测代码luminoth
https://github.com/tryolabs/luminoth
选择这份代码原因是此代码结构清晰、有完善的文档,且使用主流框架tensorflow,python语言编程易于修改调试。
文档:http://luminoth.readthedocs.io/en/latest/
几点经验:
1. 初次接触可直接使用文档提供的现成模型,并使用predict预测输出标注后的图片
http://luminoth.readthedocs.io/en/latest/usage/quickstart.html
2. 可下载预训练好的基础网络vgg、resnet。尽量使用并固定训练模型。
3. 只要学习率不高,loss不容易在迭代中发散
4. 使用标注数据时注意数据量需要足够好足够多,实践证明特定任务使用6000+张图片(意在参考VOC2007)能得到不错的效果
5. 使用多个GPU并行训练多组模型。
6. 遇到过的问题
存在路径设置的问题,有些文件会保存到默认位置,而非当前目录
参考:
基于深度学习的视频目标检测综述