不系安全带抓拍自动识别

2023-09-16 17:50:34 浏览数 (1)

不系安全带抓拍自动识别通过yolo系列算法框架模型利用高清摄像头,不系安全带抓拍自动识别算法对高空作业场景进行监控,当检测到人员未佩戴安全带时会自动抓拍并进行告警记录。不系安全带抓拍自动识别算法选择YOLO系列模型框架是一类典型的one-stage目标检测算法,其利用anchor box将分类与目标定位的回归问题结合起来,从而做到了高效、灵活和泛化性能好,所以在工业界也十分受欢迎,接下来我们介绍不系安全带抓拍自动识别算法中使用到的YOLO 系列算法。

不系安全带抓拍自动识别算法Yolo模型中采用一个单独的CNN模型实现end-to-end的目标检测,核心思想就是利用整张图作为网络的输入,直接在输出层回归 bounding box(边界框) 的位置及其所属的类别。Yolo意思是You Only Look Once,它并没有真正的去掉候选区域,而是创造性的将候选区和目标分类合二为一,看一眼图片就能知道有哪些对象以及它们的位置。不系安全带抓拍自动识别算法中Yolo模型采用预定义预测区域的方法来完成目标检测,具体而言是将原始图像划分为 7x7=49 个网格(grid),每个网格允许预测出2个边框(bounding box,包含某个对象的矩形框),总共 49x2=98 个bounding box。我们将其理解为98个预测区,很粗略的覆盖了图片的整个区域,就在这98个预测区中进行目标检测。

不系安全带抓拍自动识别算法中YOLO的结构非常简单,就是单纯的卷积、池化最后加了两层全连接,不系安全带抓拍自动识别算法从网络结构上看,与前面介绍的CNN分类网络没有本质的区别,最大的差异是输出层用线性函数做激活函数,因为需要预测bounding box的位置(数值型),而不仅仅是对象的概率。所以粗略来说,不系安全带抓拍自动识别算法的整个结构就是输入图片经过神经网络的变换得到一个输出的张量,根据YOLO的设计,输入图像被划分为 7x7 的网格(grid),输出张量中的 7x7 就对应着输入图像的 7x7 网格。或者我们把 7x7x30 的张量看作 7x7=49个30维的向量,也就是输入图像中的每个网格对应输出一个30维的向量。

0 人点赞