最新 最热

Transformer

Transformer是谷歌大脑在2017年底发表的论文attention is all you need中所提出的seq2seq模型。现在已经取得了大范围的应用和扩展,而BERT就是从Transformer中衍生出来的预训连语言模型...

2020-04-26
0

YOLOv4: 虽迟但到,大型调优现场,43mAP/83FPS | 论文速递

论文: YOLOv4: Optimal Speed and Accuracy of Object Detection

2020-04-24
0

深度残差网络+自适应参数化ReLU激活函数(调参记录9)

本文在调参记录6的基础上,继续调整超参数,测试Adaptively Parametric ReLU(APReLU)激活函数在Cifar10图像集上的效果。

2020-04-24
1

linux下crontab与anacrontab的使用

每个人或多或少都有一些约会或者是工作,有的工作是例行性的,例如每年一次的加薪、每个月一次的工作报告、每周一次的午餐会报、每天需要的打卡等等; 有的工作则是临时发生的,例如刚好总公司有高官来访,需要你准备演讲器材...

2020-04-23
0

【调参实战】BN和Dropout对小模型有什么影响?全局池化相比全连接有什么劣势?

大家好,欢迎来到专栏《调参实战》,虽然当前自动化调参研究越来越火,但那其实只是换了一些参数来调,对参数的理解和调试在机器学习相关任务中是最基本的素质,在这个专栏中我们会带领大家一步一步理解和学习调参。...

2020-04-23
0

估算聚类正确性&使用小批量KMeans来处理更多数据

We talked a little bit about assessing clusters when the ground truth is not known. However, we have not yet talked about assessing KMeans when the cluster is k...

2020-04-23
0

3 Building Models with Distance Metrics建立距离度量的模型

This chapter will cover the following topics:这章将包含如下主题:

2020-04-23
0

【调参实战】那些优化方法的性能究竟如何,各自的参数应该如何选择?

(1) Linux系统,使用windows系统也可以完成,但是使用Linux效率更高。

2020-04-22
0

经验分享 | 解决NN不work的37个方法

和这篇文章的作者一样,有时想到一个很棒的点子,辛苦写好代码,终于运行正常了,但是效果就是不咋地,不免懊恼地产生一种“难道我的点子不行?”的想法。真的是点子不行吗?未必,NN不work的原因有很多种,作者在这篇博客中根据自己的...

2020-04-21
0