最新 最热

Bert/Transformer 被忽视的细节

作者:阎覃链接:https://zhuanlan.zhihu.com/p/559495068引言自从 “Attention is All You Need” 提出 Transformer 以来,该模型在 NLP 的各种任务上取代了 RNN / CNN,成为了 NLP 的一种新架构。该论文最初的目的是在翻译...

2022-09-06
1

中文保险小样本多任务竞赛 - SmellSong团队方案

每天给你送来NLP技术干货!----来自:世界AI创新大赛2022年AIWIN世界人工智能创新大赛春季赛与太平洋保险、国泰君安、SMG技术中心(上海东方传媒技术有限公司)三家出题方联合举办了中文保险小样本多任务竞赛、发债企业的违...

2022-09-06
0

一个1024的MLP,击败了几乎所有的GNN模型

每天给你送来NLP技术干货!----整理:图神经网络与推荐系统近些年,一些NLP研究者尝试利用GNN来做一些NLP相关的任务。但是,ACL2022一篇论文的实验结果:一个1024的MLP,击败了几乎所有的GNN模型。上述结论来自"Bag-of-Words vs....

2022-09-06
0

词向量:如何评价词向量的好坏

词向量、词嵌入或者称为词的分布式表示,区别于以往的独热表示,已经成为自然语言任务中的一个重要工具,对于词向量并没有直接的方法可以评价其质量,下面介绍几种间接的方法。...

2022-09-06
0

7 Papers & Radios | 华为配置管理研究获SIGCOMM 2022最佳论文;用即插即用模块改进ViT和卷积模型

机器之心 & ArXiv Weekly Radiostation参与:杜伟、楚航、罗若天本周主要论文包括MSU 联合 MIT-IBM 提出首个黑箱防御框架;CMU 提出首个快速知识蒸馏的视觉框架等...

2022-09-06
0

覆盖200+服务场景,阿里「通义」大模型系列打造国内首个AI统一底座

机器之心原创作者:杜伟在大模型领域,阿里持续发力,用技术和思路创新走出一条不一样的路。时至今日,大模型已经成为整个 AI 产学界追逐的技术「宠儿」,炼大模型如火如荼,各式各样参数不一、任务导向不同的大模型层出不穷。大...

2022-09-06
0

统计机器学习理论

模型选择的方法,正则化可以理解成一种对学习策略的改进(防止模型过拟合),在常规的风险函数或者损失函数的基础上加上一个正则化项或者叫罚项,一般具有以下形式:...

2022-09-06
1

NLP 类问题建模方案探索实践

NLP全称Neuro Linguistic Programming,一般翻译为自然语言处理,是一门研究计算机处理人类语言的技术,简单的说就是帮助计算机理解人类语言。常见的NLP类问题包括命名实体识别、文本分类、机器翻译、信息检索、语音识别、...

2022-09-04
0

TVP尖峰对话李开复&沈春华:AI未来进行式与技术的发展

从 1956 年的达特茅斯会议至今,AI 已经走过了近 70 年的历程。这 70 年间,对于AI 的期待有之,对于 AI 的恐慌有之,资本对于 AI 的追捧此起彼伏,技术人对于 AI 的探索应用也从未停歇。...

2022-09-03
1