CNN卷积神经网络框架_fpga 神经网络

大家好，又见面了，我是你们的朋友全栈君。

理论建立与效果展示

环境：Vivado2019.2。 Part：xcku040-ffva1156-2-i，内嵌DSP个数 1920个，BRAM 600个也就是21.1Mb。

说明：通过识别加高斯白噪声的正弦波、余弦波、三角波较简单的实例来利用FPGA实现一维CNN网络，主要是实现CNN网络的搭建。也就是将下列数据传输至FPGA，识别出下面哪些是正弦波、余弦波、三角波，通过简单实例实践，在融会贯通，最终实现雷达辐射源调制方式识别。

实现流程：训练参数：通过pytorch对10000个训练集进行训练获得训练参数，反向计算不在FPGA中实现。数据产生：Matlab产生1000个测试集。数据传输：通过Pcie高速总线将数据传输到FPGA中进行识别。实践效果：信噪比在 -20~5dB之间识别率100%。数据长度：100。 CNN网络：第一层卷积：1个通道，6个卷积核，卷积核元素为5。 CNN网络：池化。 CNN网络：第二层卷积：6个通道，16个卷积核，卷积核元素为5。 CNN网络：池化。 CNN网络：第三层卷积：16个通道，16个卷积核，卷积核元素为5。 CNN网络：全连接。 CNN时效：100M时钟下，一条长度为100的数据识别耗时239个时钟周期，也就是2390ns=2.39us（因为综合实践太长了，还没实现最优，网络中有可以优化的地方，可以控制在200个时钟周期，也就是2us左右，也就是长度为100的数据的第一个数据到达FPGA到波形识别完成耗时为2us）。

第一节：基于FPGA的一维卷积神经网络CNN的实现（一）框架第二节：基于FPGA的一维卷积神经网络CNN的实现（二）资源分配第三节：基于FPGA的一维卷积神经网络CNN的实现（三）训练网络搭建及参数导出（附代码）第四节：基于FPGA的一维卷积神经网络CNN的实现（四）Matlab前向验证（附代码）第五节：基于FPGA的一维卷积神经网络CNN的实现（五）数据量化（附代码）第六节：基于FPGA的一维卷积神经网络CNN的实现（六）卷积层实现第七节：基于FPGA的一维卷积神经网络CNN的实现（七）池化层实现第八节：基于FPGA的一维卷积神经网络CNN的实现（八）激活层实现

文章目录
一、卷积层
1.二维卷积
2.一维卷积
二、池化层
三、全连接层
四、网络搭建与演示
五、温故知新
六、结果展示
1.正弦波识别
2.余弦波识别
3.三角波识别
七、资源占用情况

对CNN网络先进行简单介绍，详细了解请移至互联网。

一、卷积层

数学表达式

连续形式： f ∗ g = ∫ − ∞ ∞ f ( τ ) g ( t − τ ) d τ {rm{f * g = }}int_{ – infty }^infty {f(tau )} g(t – tau )dtau f∗g=∫−∞∞f(τ)g(t−τ)dτ 离散形势： f ∗ g = ∑ τ = − ∞ ∞ f ( τ ) g ( n − τ ) {rm{f * g = }}sumlimits_{tau= – infty }^infty {f(tau )} g(n – tau ) f∗g=τ=−∞∑∞f(τ)g(n−τ)

先对g函数进行向左翻转，然后再把g函数平移到n，在这个位置两个函数对应点相乘，再把所有位置相乘的结果相加。

1.二维卷积

二维卷积matlab演示：

5×5的矩阵a与3×3的矩阵b相卷积：

二维卷积图示（图中卷积核翻转还是和原来一样）：

所谓两个函数的卷积，本质上就是先将一个函数翻转，然后进行滑动相应位置相乘然后再叠加。

2.一维卷积

一维卷积matlab演示：

一维卷积图示（注意卷积核是翻转后的）：

卷积结果的长度=数据长度卷积核长度-1。

总而言之卷积的本质就是翻转→滑动（对应相乘）→叠加的结果。

二、池化层

池化即降采样，即降低数据的大小，池化方法主要有最大池化、平均池化，其中最常用的就是最大池化。

一维最大池化过程：简而言之就是在卷积结果中以步长为2提取相邻结果的最大值。减少了特征，导致参数减少，进而简化卷积网络计算时的复杂度。

数据长度为10，卷积的结果我们取和数据长度一样的长度，池化结果的长度为5。

三、全连接层

这里只说怎么做，原理自行了解，简而言之就是将最终多个通道的卷积结果拼接成一条数据。

四、网络搭建与演示

波形识别网络如下：

网络层	输入	详细	输出
第一层卷积	1通道 100点数据	6个卷积核，卷积核元素为5	6通道每通道100点数据
第一层池化	6通道每通道100点数据	最大池化	6通道每通道50点数据
第二层卷积	6通道每通道50点数据	16个卷积核，卷积核元素为5	16通道每通道50点数据
第二层池化	16通道每通道50点数据	最大池化	16通道每通道25点数据
第三层卷积	16通道每通道25点数据	16个卷积核，卷积核元素为5	16通道每通道25点数据
全连接	16通道每通道25点数据	数据拼接	1通道 400点数据

网络层参数分析： 训练、训练、训练，训练的结果是什么？无非就是下面的权重和偏置参数。知道这些参数导入到FPGA搭建的加速网络里面，完整的人工智障CNN就搭建出来了。

网络层	通道数	核和核内元素	权重个数	偏置个数	总
第一层卷积	1	6个核，每个核5个元素	1×6×5	6	36
第二层卷积	6	16个核，每个核5个元素	6×16×5	16	496
第三层卷积	16	16个核，每个核5个元素	16×16×5	16	1296
全连接	1	三种波形，最后一层卷积16通道每通道25点数据	3×400	3	1203