基于Keras-YOLO实现目标检测

Keras-YOLO 3项目使用Python语言实现了YOLO v3网络模型，并且可以导入Darknet网络预先训练好的权重文件信息直接使用网络进行目标识别。

1. 下载Keras-YOLO 3项目

执行如下命令下载Keras-YOLO 3项目代码：

git clone https://github.com/qqwweee/keras-yolo3.git

2. 转换Darknet的weights文件格式为Keras支持的格式

将上一小节中从Darknet官方网站下载的权重文件yolov3.weights放到Keras-YOLO 3项目根目录下，执行如下命令将Darknet的权重文件转换为Keras-YOLO 3支持的.h5格式：

python3 convert.py yolov3.cfg yolov3.weights model_data/yolo.h5

执行成功会输出类似如图7.19所示的信息和结果。

图7.19 输出结果

执行完成后，Keras-YOLO 3项目的目录结构如图7.20所示。

图7.20 Keras-YOLO 3项目的目录和文件结构

其中，各选项说明如下：

yolo.py实现了主要的使用功能。
yolo_video.py是整个项目的入口文件，调用了yolo.py文件。
model.py实现了YOLO v3算法框架。
utils.py封装了实现过程中需要的应用功能。
kmeans.py用于获取数据集的全部锚点边界框（Anchor Box），通过K-Means算法将这些边界框的宽和高聚类为9类，获取9个聚类中心，面积从大到小排列，作为9个锚点边界框（Anchor Box）。
train.py用于训练自己的数据集。
coco_annotation.py和voc_annotation.py用于在训练COCO以及VOC数据集时生成对应的Annotation文件。
convert.py用于将Darknet中YOLO v3的.cfg模型文件和.weights权重文件转换为Keras支持的.h5文件，并存放于model_data子目录下。
font子目录中包含一些字体，model_data子目录中包含COCO数据集和VOC数据集的类别及相关的Anchors文件。
yolov3.weights文件是从Darknet下载的预先训练好的权重文件。
model_data/yolo.h5是根据yolov3.weight文件转换生成的Keras格式的权重文件。

3. 执行YOLO目标检测任务

将待检测的输入文件提前准备在Keras-YOLO 3项目根目录下，本案例中我们依然使用了上一小节使用的person.jpg输入文件，然后在Keras-Yolo 3项目根目录下执行如命令启动YOLO v3模型的目标检测任务：

python3 yolo_video.py --image

yolo_video.py更详细的使用说明如下：

usage: yolo_video.py [-h] [--model MODEL] [--anchors ANCHORS]

                     [--classes CLASSES] [--gpu_num GPU_NUM] [--image]

                     [--input] [--output]

positional arguments:

  --input        Video input path

  --output       Video output path

optional arguments:

  -h, --help         show this help message and exit

  --model MODEL      path to model weight file, default model_data/yolo.h5

  --anchors ANCHORS  path to anchor definitions, default

                     model_data/yolo_anchors.txt

  --classes CLASSES  path to class definitions, default

                     model_data/coco_classes.txt

  --gpu_num GPU_NUM  Number of GPU to use, default 1

  --image            Image detection mode, will ignore all positional arguments

输入待检测的图像文件名后，输出结果如图7.21所示。

图7.21 Keras-YOLO 3的输入和输出结果

输出结果显示已经成功检测出的目标数量、置信度、预测框的位置等信息，与Darknet网络一样，也会同时以可视化的图形方式显示检测结果，如图7.22所示。

图7.22 Keras-YOLO 3生成的检测结果

本文节选自《Python深度学习原理、算法与案例》，内容发布获得作者和出版社授权。

posted @ 2023-05-24 09:33 brucexia 阅读(207) 评论(0) 收藏举报

刷新页面返回顶部

brucexia

清华大学出版社图格事业部编辑 IT图书出版 QQ49659450

基于Keras-YOLO实现目标检测

公告

brucexia

清华大学出版社图格事业部 编辑 IT图书出版 QQ49659450

基于Keras-YOLO实现目标检测

公告

清华大学出版社图格事业部编辑 IT图书出版 QQ49659450