Tensorflow 目标检测项目
图片logo水印识别。识别中国军网、中国军视网Logo水印。
image
image
Step 0 下载项目
代码语言:javascript复制git clone https://github.com/tensorflow/models/tree/master/research/object_detection
Step 1 在将项目目录添加到PYTHONPATH
作者bourdakos1整合了tensorflow中的object-detection和slim两个子项目。 设置环境,把当前目录、slim、object_detection 三个目录加到环境变量PYTHONPYTHON。
代码语言:javascript复制export PYTHONPATH=/root/workspace/Custom-Object-Detection:/root/workspace/Custom-Object-Detection/slim:/root/workspace/Custom-Object-Detection/object_detection:$PYTHONPATH
Step 2 安装labelImg标注数据
代码语言:javascript复制#如果提示缺少组件,逐步安装
pip install labelImg
# 启动
labelImg
Step 3 标注数据
labelImg标注图片,生成xml文件。
- /images目录下保存图片文件。
- /annotations/label_map.pbtxt,logo标识配置文件:设置军网logo为pic1,军视网logo为pic2。
- /annotations/trainval.txt,训练图片列表
- /annotations/xmls,保存标注xml文件。
Step 4 转化训练的图片生成record文件
创建好标注文件后,运行下面的文件。
代码语言:javascript复制python object_detection/create_tf_record.py
# 运行上面的命令,在项目上生成train.record,val.record两个文件
Step 5 选择网络
作者给出里5种网络结构,本次选用faster_rcnn_reset101。网络性能特点如下表,
Model name | Speed | COCO mAP | Outputs |
---|---|---|---|
ssd_mobilenet_v1_coco | fast | 21 | Boxes |
ssd_inception_v2_coco | fast | 24 | Boxes |
rfcn_resnet101_coco | medium | 30 | Boxes |
faster_rcnn_resnet101_coco | medium | 32 | Boxes |
faster_rcnn_inception_resnet_v2_atrous_coco | slow | 37 | Boxes |
Step 6 迁移学习
需要两个文件,(1)config文件和(2)model.ckpt文件。
- config文件在路径
object_detection/samples/configs/
下,包含多种网络,config文件中描述了网络参数、训练参数等配置。 - 下载model文件,解压后将model.ckpt开头的三个文件保存在项目根目录下。下载链接在上表中。
Step 7 训练模型
只需要指明config文件,默认加载根目录下的model.ckpt文件
代码语言:javascript复制python object_detection/train.py
--logtostderr
--train_dir=train
--pipeline_config_path=faster_rcnn_resnet101.config
在训练的过程中,会将模型参数保存到train目录下。
Step 8 生成模型,导出图
将train目录下生成的model.ckpt-数字三个文件拷贝到项目根目录,运行命令
代码语言:javascript复制python object_detection/export_inference_graph.py
--input_type image_tensor
--pipeline_config_path faster_rcnn_resnet101.config
--trained_checkpoint_prefix model.ckpt-数字
--output_directory output_inference_graph
Step 9 测试
将测试文件放在test_images路径下,运行
代码语言:javascript复制python object_detection/object_detection_runner.py
# 结果保存在output文件夹下
Step 10 GPU训练
基于阿里云GN4型服务器1个NVIDIA M40 GPU,训练6000轮,最终得到了较好的识别效果。
image
Step 11 问题
深度神经网络识别Logo水印,方法简单,构建较小数据集,而且训练时间也不是很长。
但预测时间比较长,模型比较大,下一步改用mobilenet,希望能将预测时间降到0.1秒。
如果使用YOLO,模型算法上会比rcnn更快。