最新 最热

Bert不完全手册9. 长文本建模 BigBird & Longformer & Reformer & Performer

这一章我们来唠唠如何优化BERT对文本长度的限制。BERT使用的Transformer结构核心在于注意力机制强大的交互和记忆能力。不过Attention本身O(n^2)的计算和内存复杂度,也限制了Transformer在长文本中的应用。...

2022-10-27
1

阿里天池算法大赛:中医药领域的问题生成冠军方案

UniLM也是一个多层Transformer网络,跟bert类似,但是UniLM能够同时完成三种预训练目标,如上述表格所示,几乎囊括了上述模型的几种预训练方式,而且新增了sequence-to-sequence训练方式,所以其在NLU和NLG任务上都有很好的表现...

2022-10-27
1

优化PyTorch速度和内存效率的技巧汇总

深度学习模型的训练/推理过程涉及很多步骤。在有限的时间和资源条件下,每个迭代的速度越快,整个模型的预测性能就越快。我收集了几个PyTorch技巧,以最大化内存使用效率和最小化运行时间。为了更好地利用这些技巧,我们还需...

2022-10-27
0

PyTorch 常用 Tricks 总结

设置当前使用的GPU设备为0, 1号两个设备,名称依次为 /gpu:0、/gpu:1: os.environ["CUDA_VISIBLE_DEVICES"] = "0,1" ,根据顺序表示优先使用0号设备,然后使用1号设备。...

2022-10-27
1

ES面试题,看这一篇就够了

(2)cordinate node 计算路由,使用round-robin方式将请求转发到对应node的主分片或副本分片节点上

2022-10-27
1

用 Go 实现一个 LRU cache

早在几年前写过关于 LRU cache 的文章:https://crossoverjie.top/2018/04/07/algorithm/LRU-cache/

2022-10-27
1

不会 find 命令这 7 种用法!你算啥运维人

可以很肯定地说,find 命令是 Linux 后台开发人员必须熟知的操作之一,除非您使用的是 Windows Server。

2022-10-27
1

Memcache内存分配机制

memcached 默认情况下采用了 Slab Allocator 的机制分配和管理内存. 在该机制出现之前内存分配简单的通过 malloc 和 free 来管理所有的记录, 旧的方式会导致产生很多内存碎片, 加重机器管理内存的负担, 甚至有可能导...

2022-10-27
1

Building a widget for Druid

https://www.pauljmiller.com/posts/druid-widget-tutorial.html

2022-10-26
1

Mysql进阶优化篇05——子查询的优化和排序优化

MySQL 从 4.1 版本开始支持子查询,使用子查询可以进行 SELECT 语句的嵌套查询,即一个 SELECT 查询的结果作为另一个 SELECT 语句的条件。子查询可以一次性完成很多逻辑上需要多个步骤才能完成的操作 。...

2022-10-26
1