最新 最热

从0单排强化学习原理(三)

。求解分为两个过程,首先是策略评估,即通过高斯-塞德尔迭代法求解值函数,然后是策略改善过程,通过

2021-05-14
1

为什么AI无法解决一般智能问题?

但大家都同意的是,目前的人工智能系统与人类的智力相去甚远。直接表现是:AI只在特定任务中表现优异,无法将其能力扩展到其他领域。

2021-05-11
1

谷歌实现2种新的强化学习算法,“比肩”DQN,泛化性能更佳!|ICLR 2021

来自Google Research的研究人员,证明可以使用图表示 (graph representation)和AutoML的优化技术,来学习新的、可解析和可推广的RL算法!

2021-05-11
1

Michael Jordan:人工智能研究的目标变了,不再是构建单个智能

【专栏:研究思路】我们认为,人工智能进入了新的拐点。在一个后深度学习时代,不同的学者对未来智能发展道路的理解逐渐清晰,当然也逐渐开始分化,由此导致了开展布局完全不同的研究工作。智源社区将系统分析全球范围内知名学...

2021-04-29
1

ICDE 2021 | 可微图神经网络架构搜索

近年来GNN (Graph Neural Network)受到了很大的关注,越来越多GNN方法应用在节点分类(node classification)[1],推荐系统(recommendation)[2],欺诈检测(fraud dection)[3]等。不同的GNN方法最大的差别,在于邻居聚合函数 (n...

2021-04-29
0

ICLR2020 | GraphAF:基于FLOW的分子图自回归生成模型

今天给大家介绍的是北京大学和上海交通大学的Chence Shi等人在2020年的ICLR上发表的会议论文GraphAF: A flow-based autoregressive model for molecular graph generation。分子的图生成作为药物发现的基本问题,正在...

2021-04-26
0

要提升微信看一看推荐混排的长期收益?试试深度强化学习

在微信AI背后,技术究竟如何让一切发生?关注微信AI公众号,我们将为你一一道来。今天我们将放送微信AI技术专题系列“微信看一看背后的技术架构详解”的第四篇——《深度强化学习在微信看一看推荐混排的应用》。...

2021-04-22
0

【路径规划】开源 | 潜空间进化规划:超越标准的无模型强化学习方法

论文地址: http://arxiv.org/pdf/2011.11293v1.pdf

2021-04-22
0

yyds!用飞桨玩明日方舟

每个游戏玩家都有一个梦,希望自己在虚拟世界中成为万众瞩目、无所不能的英雄。然后…然后…闹钟响了梦醒了,又到了挤地铁上班的时间。

2021-04-20
0

15个图神经网络的应用场景总结

社会影响的预测社会影响预测侧重于朋友之间行为的影响,尤其是在社交网络中。例如,如果一些社交网络上的朋友买了一件衣服,他/她会不会也买呢?以社交图作为输入,DeepInf为用户学习网络嵌入(一种潜在的...

2021-04-16
0