最新 最热

强化学习从基础到进阶-常见问题和面试必知必答3:表格型方法:Sarsa、Qlearning;蒙特卡洛策略、时序差分等以及Qlearning项目实战

状态、动作、状态转移概率和奖励,分别对应$(S,A,P,R)$,后面有可能会加上折扣因子构成五元组。

2023-06-23
0

Adam效果不好?Decouple Weight Decay Regulaization阅读笔记

论文首先发现问题,和其他相关研究类似,L2和weight decay在adam这种自适应学习率上的表现很差,导致很多人还是采用SGD+momentum策略。类似的有相关研究,从各种方面出发,作者发现效果差的最主要原因是L2效果不好。因此其最主...

2023-06-23
1

【经验帖】深度学习如何训练出好的模型

数据质量:数据应该是准确,完整,无误,且具有代表性。如果数据集有错误或缺失,将会影响模型的性能,选择分辨率越高肯定对模型是越好的,但是也要考虑到模型训练占用的内存够不够,因为分辨率越高,数据量就越大...

2023-06-21
0

强化学习从基础到进阶-常见问题和面试必知必答[2]:马尔科夫决策、贝尔曼方程、动态规划、策略价值迭代

(2)另外,我们想把不确定性也表示出来,希望尽可能快地得到奖励,而不是在未来的某个时刻得到奖励。

2023-06-20
0

强化学习从基础到进阶-常见问题和面试必知必答1:强化学习概述、序列决策、动作空间定义、策略价值函数、探索与利用、Gym强化学习实验

本质上是智能体与环境的交互。具体地,当智能体在环境中得到当前时刻的状态后,其会基于此状态输出一个动作,这个动作会在环境中被执行并输出下一个状态和当前的这个动作得到的奖励。智能体在环境里存在的目标是最大化期望...

2023-06-19
0

基于深度学习的图像分类:使用卷积神经网络实现猫狗分类器

摘要: 深度学习在计算机视觉领域中具有广泛的应用。本文将介绍如何使用卷积神经网络(CNN)实现一个猫狗分类器。我们将使用Python和TensorFlow框架搭建一个简单的卷积神经网络模型,并利用猫狗图像数据集进行训练和测试。通...

2023-06-10
1

深度学习实战:3.使用PyTorch搭建VGG网络

VGG在我之前的博客中已经做过详解,详情见:https://blog.csdn.net/muye_IT/article/details/123797416

2023-06-08
1

基于腾讯云CVM(国内)搭建stable-diffusion-webui环境 三

本文主要是介绍在腾讯云CVM的中国大陆地区服务器中搭建stable-diffusion-webui(https://github.com/AUTOMATIC1111/stable-diffusion-webui)环境。为什么在中国大陆地区服务器需要另外一份教程了,就是【慢】。各种依赖,下...

2023-06-08
1

基于PaddlePaddle实现的目标检测模型PP-YOLO

PP-YOLO是PaddleDetection优化和改进的YOLOv3的模型,其精度(COCO数据集mAP)和推理速度均优于YOLOv4模型,PP-YOLO在COCO test-dev2017数据集上精度达到45.9%,在单卡V100上FP32推理速度为72.9 FPS, V100上开启TensorRT下FP...

2023-06-04
1

《我的PaddlePaddle学习之路》笔记五——验证码的识别

本次使用的验证码是方正系统,现在很多的大学的教务系统用的就是这个方正系统,刚好既然那么普遍,我们就用它练一练手。经过观察大量的验证码发现,该系统的验证码只有小写的字母和数字,这样分类就少了很多了。该系统的验证码...

2023-06-04
1