新智元报道
来源:Roboflow
编辑:舒婷
【新智元导读】YOLOv5的发布备受关注,在多个社区引发热议。6月14日,Roboflow联合YOLOv5开发者,正面回应了Hacker News社区对于YOLOv5的质疑。
YOLOv5自发布之后就受到了许多关注,无论是Hacker News,Github还是Reddit,在各个机器学习有关的平台上都引发了广泛的讨论。当然,也不少用户对YOLOv5提出了各方面的质疑。
这些质疑主要围绕在两个方面:
1、该模型是否能被命名为YOLOv5?
2、Roboflow发布的最初基准测试是否准确且可重复?
针对以上两个问题,Roboflow汇总了YOLOv4作者Alexey Bochkovskiy和YOLOv5作者Glenn Jocher的想法,回应了有关YOLOv5的问题。
YOLOv5不再是YOLO?开发者们这样说
HackerNews社区中许多用户认为YOLOv5应该改名,不再属于YOLO系列。
赞同YOLOv5改名的支持者的观点大致如下:
- Glenn Jocher并不是YOLO模型的原作者。
- Glenn Jocher并没有发表论文。
- 现行的YOLOv5这个模型不是一个完备的模型。
回顾YOLO的发展,这个小而精致的模型从第一版开始就备受瞩目。
Joseph Redmon在2016年的一篇论文中,引入了YOLO最初版的模型。YOLO一出生便技惊四座。人们简直不敢相信小小体积的YOLO竟然能表现出如此超高的性能!简直就是实时条件和设备上部署环境的理想候选人。
之后的2017年和2018年,Redmon团队发表了对这个模型进行了改良,以论文形式发布了YOLOv2和YOLOv3。
历史的转折点发生在2020年2月,Redmon突然宣布退出计算机视觉研究!
大众此时都默认YOLOv3将是YOLO的最后一个版本。
但是,Glenn Jocher横空出世,在PyTorch中创建了最为大众接受的YOLOv3的实现。
2020年4月23日,Alexey Bochkovskiy、Chien-Yao Wang和Hong-Yuan Mark Liao推出了YOLOv4,展示了令人印象深刻的成果。这个模型甚至收到了Redmon的称赞。
然而,距离YOLOv4发布一个月多的时间,YOLOv5又进入了大众的视野。Glenn Jocher发布的YOLOv5有许多不同之处和改进。Glenn从YOLOv3开始就参与到模型搭建的工作,是YOLOv4中一个非常关键的技术「mosaic augmentation」的创建者。
看过YOLO的历史之后就发现,赞同改名者所陈述的确实是事实:Glenn并没有参与最初的YOLO创建,且成果未发表成论文,模型也并不完备。
但是,科研人员似乎应该更着眼于科研成果是否真切的改变了人们的生活,而不应该陷入「命名」的桎梏中,毕竟连在计算机视觉领域已经「退休」的Redmon都非常嘉许其他研究人员对于YOLO的改进。
正如Roboflow在Hacker News中所说的那样:
「我们只是机器学习和人工智能的「粉丝」。我们对这个领域的发展如此之快感到惊讶。在命名范畴,我们没有立场。我们的核心重点是帮助开发人员处理数据,构建任何模型,无论它是一个有名的模型与否。」
Roboflow表示会和Hacker News的各位积极沟通,以决定是否更换命名。
Roboflow:承认错误,正式摘要由Jocher在今年晚些时候发布!
模型体系结构发布时,有一定的数据集来评估其性能来确定模型的质量。这就是Roboflow要做的工作,此次的最初的基准测试也是Roboflow来协助YOLOv5完成的。
但是Roboflow的目标并不是去将模型改良为「通用」的,数据集是否使用还是以建模团队的需求为准。Roboflow的目标是使团队能够在他们自己的特定领域的自定义数据集上快速轻松地利用计算机视觉模型。
显然,这样的数据及测试并不能替代关于COCO的正式基准测试。同时,针对YOLOv4和YOLOv5的比较也是建立在一个不完善的数据集上,因此结果可能不是全面的。
Roboflow在此次回应中也承认,对于YOLOv4和YOLOv5,在推理速度上的比较并不合理。
Glenn Jocher的YOLOv5正在积极开发中。同时,Jocher表示他计划在今年晚些时候发布YOLOv5摘要,这将是这个模型较为严格的一个质量评估报告。
参考链接:https://blog.roboflow.ai/yolov4-versus-yolov5/