最新 最热

基于预训练模型的金融事件分析及应用

作者介绍: 马永亮 ,澜舟科技搜索与金融 NLP 技术负责人。2009年硕士毕业于哈尔滨工业大学,先后在阿里巴巴和微软工作,主要从事搜索引擎、问答、翻译、NLP 相关的技术和产品研发。2021年4月加入澜舟科技。...

2022-09-02
1

影响高端AI炼丹!英伟达、AMD断供高端GPU!

每天给你送来NLP技术干货!----今天看到一条热搜:英伟达。我以为是 RTX 40 系显卡的预热内容,想着距离把我饱经风霜的 2060 换掉又近了一步。结果看到的是:8月31日,全球两大 GPU 厂商 NVIDIA 和 AMD 均证实,已收到美国政府通...

2022-09-02
0

DiffCSE: 将Equivariant Contrastive Learning应用于句子特征学习

知乎:李加贝方向:跨模态检索来自:深度学习自然语言处理公众号虽然不同的数据增强(随机裁剪、颜色抖动、旋转等)被发现对预训练视觉模型至关重要,但这种增强在应用于句子嵌入的对比学习时通常不成功。之前的工作发现,通过简...

2022-09-02
0

县城再无清华北大

每天给你送来NLP技术干货!----来源 | 文化纵横(ID:whzh_21bcr)作者 | 白如冰、梁晨编辑 | 学妹最近很流行一个说法,就是北京的学生考清华北大很容易,那么考入清北的北京学生和那些外省学霸们相比,水平到底有差么?如果在进...

2022-09-02
1

一文详解Transformers的性能优化的8种方法

前言自BERT出现以来,nlp领域已经进入了大模型的时代,大模型虽然效果好,但是毕竟不是人人都有着丰富的GPU资源,在训练时往往就捉襟见肘,出现显存out of memory的问题,或者训练时间非常非常的久,因此,这篇文章主要解决的问题就...

2022-09-02
0

论文修改100遍也别慌!Meta发布全新写作语言模型PEER:参考文献都会加

---- 新智元报道  编辑:LRS【新智元导读】Meta最近放出全新写作语言模型PEER,完全模拟人类写作过程,从打草稿到重复编辑修改都帮你干了,还能解释修改原因!2020年5月至今,GPT-3发布近两年半的时间里,在其神奇的文本生成能力...

2022-09-02
0

从普通双非到百度算法岗,优秀!

今天给大家分享一位23届普通双非硕士参加腾讯、百度和京东等大厂的日常实习经历,最终斩获百度算法岗实习offer,面经干货十足,希望能帮助到即将面试的小伙伴们,以下为原文。...

2022-09-01
0

滴滴开源DELTA:AI开发者可轻松训练自然语言模型

8月2日消息,自然语言处理领域顶级会议ACL2019在意大利弗洛伦萨继续召开。会上滴滴正式宣布开源基于深度学习的语音和自然语言理解模型训练平台DELTA,以进一步帮助AI开发者创建、部署自然语言处理和语音模型,构建高效的解...

2022-09-01
0

词向量表示[通俗易懂]

语音中,用音频频谱序列向量所构成的矩阵作为模型的输入;在图像中,用图像的像素构成的矩阵数据作为模型的输入。这些都可以很好表示语音/图像数据。而语言高度抽象,很难刻画词语之间的联系,比如“麦克风”和“话筒”这样的...

2022-09-01
0