80.97%@Plain，重参数思想再续新篇章RepNAS=Re-parameterization+NAS

arXiv：https://arxiv.org/pdf/2109.03508.pdf

本文首次将结构重参数技术与NAS进行了结合，基于结构重参数设计了一种新的搜索空间，同时设计了一种新的NAS方案。通过RepNAS搜索得到的ODBB具有比人工设计重参数模块更高的性能，将plain模型的精度从80.52%刷新到80.97%。但是，这篇文章尚未开源。如果开源的是融合后的模型，笔者会非常怀疑RepNAS的真实性。期待RepNAS尽快开源！

Abstract

在过去几年里，NAS技术取得了长足进展。然而，由于搜索约束与实际推理之间的差异导致高效网络搜索仍极具挑战性。为搜索一个具有高性能、低推理延迟的模型，已有方案往往在算法中添加计算复杂度约束。然而，推理速度会受多种因此影响，如FLOPs、MACs等，单一因素相关性可能并不强。

近来，重参数技术旨在将多分支结构转换成推理友好的单分支架构。尽管如此，训练阶段的多分支架构仍是人工设计的，较为低效。

本文提出提出一种适合于结构重参数技术的搜索空间，提出了一阶段NAS方法RepNAS对每一层在分支数量约束下进行ODBB(Optimal Diverse Branch Block)搜索。实验结果表明：搜索到的ODBB可以轻易超越人工设计的DBB，同时训练高效。

本文贡献主要包含以下几点：

提出了一种Rep搜索空间，它使得所搜到的模型在训练阶段保持任意分支结构，而在推理阶段融合为单分支结果。
为利用上述搜索空间，提出了一种一阶段NAS方案RepNAS；
实验结果表明：搜索的ODDB具有比人工设计DBB和NAS模型更优性能。

Re-parameterization Neural Architecture Search

我们首先对所提RepNAS进行整体性介绍并讨论与其他NAS方案的区别，然后提出一种基于Rep技术的搜索空间，最后提出RepNAS方法以适配该搜索空间。

Overview

Rep技术旨在通过插入多分支结构提升CNN的训练效率，所插入的多分支结构在完成训练后可以进行融合且不会造成任何性能损失、复杂度提升。然而，多分支结构训练会占据大量GPU显存，进而导致无法进行过多分支模型优化。所提方法的核心在于：以可微分方式对某些不重要分支进行剪枝，参见下图。

该剪枝过程有两个重要步骤：

给定CNN架构(比如MobileNet、VGG)，我们在原始卷积操作基础上插入多个线性操作。对每个分支而言，它还存在一个可学习参数用于表征分支重要性。在训练阶段，我们同时对架构参数与与网络参数进行优化。在完成训练后，我们得到一个具有最优网络参数的剪枝架构。
在推理阶段，残留分支可以直接融合到原始卷积操作中，即多分支转换成单分支结构且不会造成性能损失。

相比其他NAS架构，RepNAS中不再包含复杂的多分支结构与跳过连接。相比之前的结构重参数方案，RepNAS中每一层的模块通过NAS自适应决定，而无需人工介入。