最新 最热

推荐系统与深度学习(十七)——DIN模型原理

随着推荐算法逐渐的发展,大佬们的研究方向主要切分成了两部分:一个是对特征的调整,大家想尽办法挖掘特征中的隐含信息,寻找新的特征而且不断进行组合交叉,例如:FM、FFM系列的模型;另一个是对模型的结构调整,另一群人又想尽办...

2020-10-27
0

训练GAN的常用技巧

GAN的训练调参过程总是很让人头疼,为了让训练过程能够快速收敛,我尝试了很多的训练技巧,这里记录一下我尝试过有用的技巧以及博客中常常提到的技巧。...

2020-10-26
0

百万级类别的分类模型的拆分训练

很多人脸识别算法都是以分类的方式进行训练的,分类的训练方式中存在一个很大的问题,就是模型的最后一个全连接层的参数量太大了,以512为特征为例:...

2020-10-26
1

深度学习调参tricks总结!

学习率是一个非常非常重要的超参数,这个参数呢,面对不同规模、不同batch-size、不同优化方式、不同数据集,其最合适的值都是不确定的,我们无法光凭经验来准确地确定lr的值,我们唯一可以做的,就是在训练中不断寻找最合适当前...

2020-10-23
1

自定义PyTorch中的Sampler

在训练GAN的过程中,一次只训练一个类别据说有助于模型收敛,但是PyTorch里面没有预设这种数据加载方式,要这样训练的话,需要自己定义Sampler,即自定义数据采样方式。下面是自定义的方法:...

2020-10-23
0

Keras SGD 随机梯度下降优化器参数设置方式

Keras 中包含了各式优化器供我们使用,但通常我会倾向于使用 SGD 验证模型能否快速收敛,然后调整不同的学习速率看看模型最后的性能,然后再尝试使用其他优化器。...

2020-10-21
1

Keras – GPU ID 和显存占用设定步骤

初步尝试 Keras (基于 Tensorflow 后端)深度框架时, 发现其对于 GPU 的使用比较神奇, 默认竟然是全部占满显存, 1080Ti 跑个小分类问题, 就一下子满了. 而且是服务器上的两张 1080Ti....

2020-10-21
1

踩坑:pytorch中eval模式下结果远差于train模式介绍

首先,eval模式和train模式得到不同的结果是正常的。我的模型中,eval模式和train模式不同之处在于Batch Normalization和Dropout。Dropout比较简单,在train时会丢弃一部分连接,在eval时则不会。Batch Normalization,在train...

2020-10-21
0

keras和tensorflow使用fit_generator 批次训练操作

fit_generator 是 keras 提供的用来进行批次训练的函数,使用方法如下:

2020-10-21
0

Pytorch mask-rcnn 实现细节分享

Dataset不能满足需求需自定义继承torch.utils.data.Dataset时需要override __init__, __getitem__, __len__ ,否则DataLoader导入自定义Dataset时缺少上述函数会导致NotImplementedError错误...

2020-10-21
0