最新 最热

《解密并行和分布式深度学习:深度并发分析》摘要记录

在单个处理器上处理图所需的时间是T_1 = W,在无限多个进程上处理图所需的时间是。计算中的平均并行度是,在个处理器上的执行时间受限于:

2022-09-02
1

标签平滑 Label Smoothing 详解及 pytorch tensorflow实现

标签平滑(Label smoothing),像L1、L2和dropout一样,是机器学习领域的一种正则化方法,通常用于分类问题,目的是防止模型在训练时过于自信地预测标签,改善泛化能力差的问题。...

2022-01-27
2

机器学习 深度学习中激活函数sigmoid relu tanh gelu等汇总整理

这篇博客主要总结一下常用的激活函数公式及优劣势,包括sigmoid relu tanh gelu

2021-09-12
2