最新 最热

从0单排强化学习原理(四)

双十一刚过,大家要么熬夜加班(比如十方),要么熬夜购物,是不是都忘了要一起学强化学习了。其实是十方一直没更新(从未见过如此厚颜...),一元哥已经吐槽十方无数次了,今天必须更,这一系列必须更完。估摸下,原理相关的估计还要...

2021-05-14
0

从0单排强化学习原理(三)

。求解分为两个过程,首先是策略评估,即通过高斯-塞德尔迭代法求解值函数,然后是策略改善过程,通过

2021-05-14
0

因果推断文献解析|A Survey on Causal Inference(5)

本系列,我们介绍因果推断的经典综述论文《A Survey on Causal Inference》,上一篇ZZ介绍了本篇综述的第二个因果推断方法:“分层方法“;

2021-05-13
0

因果推断文献解析|A Survey on Causal Inference(4)

上一篇ZZ介绍了本篇综述的第一个因果推断方法:“权重更新方法“;通过之前的阅读我们明确因果推断的核心任务是搞定反事实结果

2021-05-13
0

因果推断文献解析|A Survey on Causal Inference(3)

上一篇ZZ介绍了本篇综述的背景知识和相关数学符号表示,了解到了本篇文章主要是关于基于“潜在结果框架”的因果推断方法综述,并且明确了样本,策略,潜在结果,混杂和混杂带来的辛普森悖论和选择性偏差等概念。下面我们书接上...

2021-05-13
0

基于潜在结果框架的因果推断入门(上)

本文是一篇综述文章 「A Survey on Causal Inference」 的阅读笔记(大部分内容参照原文进行了较为通俗易懂的翻译,小部分内容加入了自己的理解)。

2021-05-13
0

谷歌实现2种新的强化学习算法,“比肩”DQN,泛化性能更佳!|ICLR 2021

来自Google Research的研究人员,证明可以使用图表示 (graph representation)和AutoML的优化技术,来学习新的、可解析和可推广的RL算法!

2021-05-11
0

FAIR最新无监督研究:视频的无监督时空表征学习

近期,FAIR的Kaiming He组发布了关于视频的无监督学习研究:A Large-Scale Study on Unsupervised Spatiotemporal Representation Learning,这篇论文被CVPR2021收录。论文的核心是将近期图像中的无监督学习方法应用在视频...

2021-05-11
1

十种方法实现图像数据集降维

降维是通过单幅图像数据的高维化,对单幅图像转化为高维空间中的数据集合进行的一种操作。机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。降维的本质是学习一个映射函数...

2021-05-08
0

终于有人把任务T、性能P和经验E讲明白了

该定义没有突出人类进行机器学习的目的——决策,即机器学习是计算机根据数据做出或改进预测或行为的方法。

2021-05-06
1