最新 最热

【一】最新多智能体强化学习方法【总结】

【三】多智能体强化学习(MARL)近年研究概览 {Analysis of emergent behaviors(行为分析)_、Learning communication(通信学习)}

2022-12-21
1

WSDM'23 推荐系统论文梳理

WSDM'23已公布录用结果,共收到投稿690篇,录用123篇,录用率为17.8% ,完整录用论文列表见WSDM'23 Accepted Papers。

2022-12-17
1

NeurlPS'22 推荐系统论文梳理

本文对NeurlPS'22推荐系统相关论文进行梳理,后续选择感兴趣的论文进行单独解读,相关论文可在公众号后台回复NeurlPS2022-RecSys-Papers获取,我也会更新到Github-Currently_Awesome-RecSys-Papers中 (部分未公开的论...

2022-12-17
1

Bengio、LeCun 等人联名上书,呼吁美国投资神经AI,攻破「具身图灵测试」

「长期以来,神经科学一直是人工智能进步的重要驱动力。我们提议,为了加速人工智能的进展,必须投资于 NeuroAI 的基础研究。」

2022-12-15
1

算法工程师深度解构ChatGPT技术

引言 | 本栏目特邀腾讯知名语言文本项目算法工程师冉昱、薛晨,用专业视野带你由浅入深了解ChatGPT技术全貌。它经历了什么训练过程?成功关键技术是什么?将如何带动行业的变革?开发者如何借鉴ChatGPT思路和技术,投入到日常...

2022-12-10
1

DeepMind VS Meta:实现纳什均衡理性最优解,还是多人非零和博弈算法更强大?

DeepMind被谷歌收购之后,一直开启着“败家烧”的模式。不过也着实“烧”出了不少成果。曾经大火的AlphaGo,编程机器人系统Alpha Code,智能体Gato……都是让业界认可的手笔。不过,尽管在AI技术上全面开花,DeepMind仍没有放...

2022-12-10
1

重磅!2022年剑桥AI全景报告出炉,文本生成图像掀起新风暴!

作为每年发布的AI报告,作者从研究、产业、政策、安全、预测五个维度对最新人工智能发展现状和未来预期进行了深入分析和说明。

2022-12-10
1

AI解数学题,答案是对的过程却是错的?DeepMind新研究改进谷歌思维链方法

众所周知,随着谷歌思维链(chain of thought)概念的提出,AI做题时已经能像人类一样生成解题步骤。

2022-12-09
0

AI看了70000小时《我的世界》视频学会人类高级技巧,网友:它好痛苦

以“钻石镐”(diamond pickaxe)为例,这个东西高级人类玩家要快速点击20分钟、约2.4万个动作才能制作完成。

2022-12-09
1

NeurIPS2022 | 基于 Transformer Attention的联邦强化学习(滑铁卢大学&&含源码)

联邦强化学习的核心问题是如何将来自多个agent的见解聚合为一个。常见的解决方法是将每个agent的模型权重的平均值带入到一个通用模型(FedAvg)中。相反,「本文提出了一种新的联邦学习策略FedFormer,它利用Transformer A...

2022-12-06
1