学习方法_字节宝

从0单排强化学习原理(四)

双十一刚过，大家要么熬夜加班(比如十方)，要么熬夜购物，是不是都忘了要一起学强化学习了。其实是十方一直没更新(从未见过如此厚颜...)，一元哥已经吐槽十方无数次了，今天必须更，这一系列必须更完。估摸下，原理相关的估计还要...

强化学习学习方法编程算法

2021-05-14

从0单排强化学习原理（三）

。求解分为两个过程，首先是策略评估，即通过高斯-塞德尔迭代法求解值函数，然后是策略改善过程，通过

强化学习学习方法编程算法

2021-05-14

因果推断文献解析|A Survey on Causal Inference(5)

本系列，我们介绍因果推断的经典综述论文《A Survey on Causal Inference》，上一篇ZZ介绍了本篇综述的第二个因果推断方法：“分层方法“；

编程算法学习方法

2021-05-13

因果推断文献解析|A Survey on Causal Inference(4)

上一篇ZZ介绍了本篇综述的第一个因果推断方法：“权重更新方法“；通过之前的阅读我们明确因果推断的核心任务是搞定反事实结果

学习方法编程算法数据分析

2021-05-13

因果推断文献解析|A Survey on Causal Inference(3)

上一篇ZZ介绍了本篇综述的背景知识和相关数学符号表示，了解到了本篇文章主要是关于基于“潜在结果框架”的因果推断方法综述，并且明确了样本，策略，潜在结果，混杂和混杂带来的辛普森悖论和选择性偏差等概念。下面我们书接上...

编程算法学习方法 tcpip

2021-05-13

基于潜在结果框架的因果推断入门（上）

本文是一篇综述文章「A Survey on Causal Inference」的阅读笔记（大部分内容参照原文进行了较为通俗易懂的翻译，小部分内容加入了自己的理解）。

编程算法学习方法机器学习神经网络深度学习

2021-05-13

谷歌实现2种新的强化学习算法，“比肩”DQN，泛化性能更佳！｜ICLR 2021

来自Google Research的研究人员，证明可以使用图表示（graph representation）和AutoML的优化技术，来学习新的、可解析和可推广的RL算法！

强化学习学习方法 https 编程算法腾讯云测试服务

2021-05-11

FAIR最新无监督研究：视频的无监督时空表征学习

近期，FAIR的Kaiming He组发布了关于视频的无监督学习研究：A Large-Scale Study on Unsupervised Spatiotemporal Representation Learning，这篇论文被CVPR2021收录。论文的核心是将近期图像中的无监督学习方法应用在视频...

编程算法 linux 无监督学习学习方法监督学习

2021-05-11