前言
之前写过一个将YOLO中txt格式进行可视化的脚本目标检测】小脚本:YOLO标签可视化,这次来实现一个Xml格式标签可视化的脚本。
不啰嗦,直接放代码,效果和上文一样。
脚本代码
代码语言:javascript复制import xml.dom.minidom
import cv2
import os
"""
该脚本用于目标框可视化
IMAGE_INPUT_PATH:输入图片路径
XML_INPUT_PATH:输入标记框路径
IMAGE_OUTPUT_PATH:生成可视化图片路径
"""
IMAGE_INPUT_PATH = 'VOC2007/JPEGImages'
XML_INPUT_PATH = 'VOC2007/Annotations'
IMAGE_OUTPUT_PATH = 'VOC2007/show_output'
imglist = os.listdir(IMAGE_INPUT_PATH)
xmllist = os.listdir(XML_INPUT_PATH)
for i in range(len(imglist)):
# 每个图像全路径
image_input_fullname = IMAGE_INPUT_PATH '/' imglist[i]
xml_input_fullname = XML_INPUT_PATH '/' xmllist[i]
image_output_fullname = IMAGE_OUTPUT_PATH '/' imglist[i]
img = cv2.imread(image_input_fullname)
dom = xml.dom.minidom.parse(xml_input_fullname)
root = dom.documentElement
# 读取标注目标框
objects = root.getElementsByTagName("bndbox")
for object in objects:
xmin = object.getElementsByTagName("xmin")
xmin_data = int(float(xmin[0].firstChild.data))
ymin = object.getElementsByTagName("ymin")
ymin_data = int(float(ymin[0].firstChild.data))
xmax = object.getElementsByTagName("xmax")
xmax_data = int(float(xmax[0].firstChild.data))
ymax = object.getElementsByTagName("ymax")
ymax_data = int(float(ymax[0].firstChild.data))
# xmin, ymin, xmax, ymax分别为xml读取的坐标信息
left_top = (int(xmin_data), int(ymin_data))
right_down = (int(xmax_data), int(ymax_data))
cv2.rectangle(img, left_top, right_down, (255, 0, 0), 1)
"""
# 直接查看生成结果图
cv2.imshow('show', img)
cv2.waitKey(0)
"""
cv2.imwrite(image_output_fullname, img)