利用先进技术保家卫国:深度学习进行小目标检测(适合初学者入门)

2022-01-28 19:37:27 浏览数 (1)

论文地址:https://arxiv.org/pdf/2201.03243v1.pdf

计算机视觉研究院专栏

作者:Edison_G

一种改进且高效的基于深度学习的自主系统,该系统可以高精度地检测和跟踪非常小的无人机。 整体的介绍都比较基础简单,初学者可以简单了解!

一、前言

如今,无人机等被广泛用于各种用途,例如从航空图像中捕获和目标检测等。这些小型ariel车辆轻松进入公众可能会造成严重的安全威胁。例如,关键地点可能会被混入公共场所的间谍使用无人机监控。

Study in hand提出了一种改进且高效的基于深度学习的自主系统,该系统可以高精度地检测和跟踪非常小的无人机。所提出的系统由一个定制的深度学习模型“Tiny YOLOv3”组成,这是一种非常快速的目标检测模型“You Look Only Once”(YOLO)被构建并用于检测。目标检测算法将有效地检测无人机。与之前的YOLO版本相比,所提出的架构显示出明显更好的性能。在资源使用和时间复杂度方面得到了改进。

二、背景

随着世界在融合最新技术的同时不断进步,安全系统也在快速发展,以利用创新的力量来应对可能出现的任何安全威胁。在过去的几年里,无人机的使用量急剧增加,包括对公众的可及性,这进一步增加了其使用量。随着无人机使用量的增加,安全威胁也随之增加。我们已经看到了一些无人机飞越不同建筑物的事件,包括一些需要安全的敏感区域。

无人机还提出了许多威胁,包括无人机被用作毒品走私工具、入侵无人机导致它们爆炸或使用它们窃取敏感信息,无人机还被用于进行非法监视,造成安全和隐私威胁。这些事件对安全和隐私构成了巨大威胁。因此,解决这些安全问题的方法是检测和跟踪这些无人机,以便采取反制技术来阻止这些无人机,以确保安全和隐私。

此外,大多数安全或防御系统都具有检测可能发生的威胁程度的能力,但是,很少有人能够深入分析威胁。随着机器学习和人工智能的进步,通过减少人为干预使此类系统变得智能化,有效的目标检测可以帮助提高安全系统的效率并执行更好的分析。

三、新框架分析

前期主要介绍了深度学习的一些基础知识:

Image matrix convolution operation with multiplies filter matrix

Convolution with 3 x3 filter using Stride 2

ReLU operation

Max-Pooling

Fully Connected Layer

如上展示,尽管Tiny YOLOv3比YOLOv3快得多,但它因为它在2个尺度上执行检测,并没有提供更好的准确度。

为了更好地实现准确性,研究者引入了一个修改后的Tiny YOLOv3架构。该架构总共包括31层:16个卷积层,3个检测层,其余是用最大池化和ReLU层。以前的YOLOV3微型架构由总共24层组成,其中包括13个卷积层、3个检测层。

研究者修改了Tiny YOLOv3架构,通过使用前几层的ReLU层提取特征,将在三个尺度上进行检测。这意味着3个yolo层将负责检测对象。锚框用于计算预测边界框的宽度和高度。通常,YOLOv3为每个单元使用3个锚点,这些锚点预测三个边界框,总共9个锚点框。对于研究者的自定义目标检测器,总共使用了6个锚框。

预测特征图将分别为3个尺度上的13x13、26x26和52x52。随着网络向前传播图像,在第一个yolo层,得到一个13x13的输出特征图。在放置第一个yolo层之后,对下一层进行了两倍的采样,然后将具有相似大小的前一层的特征图连接起来。对于第二个yolo层,得到26x26的输出特征图,在第三个yolo层,得到一个52x52的特征图。这种架构比原始的yolov3架构更简洁、更小,后者在3个尺度上进行检测。此外,研究者的小而轻的架构可以检测具有高置信度分数的小物体。

四、实验

Results Evaluated

AVG FPS

© The Ending

0 人点赞