最新 最热

【python】Fraction类详解及生成分数四则运算“试卷”

使用整数作为分子和分母创建一个分数。在这里,Fraction(16, -10)创建了一个分数,分子为16,分母为-10。由于分母为负数,Fraction对象会自动将其转换为正数,结果为Fraction(-8, 5)。...

2024-07-30
1

【论文复现】Conditional Generative Adversarial Nets(CGAN)

具体内容详见:【论文复现】Generative Adversarial Nets(GAN基础理论)

2024-07-30
1

【论文复现】基于CGAN的手写数字生成实验——模型改进

关于超参数优化,有网格搜索、随机搜索、贝叶斯优化等多种方法,针对于本实验,由于设备限制选择手动调参,下面对实验结论进行总结:

2024-07-30
1

【深度学习】机器学习概述(二)优化算法之梯度下降法(批量BGD、随机SGD、小批量)

机器学习:通过算法使得机器能从大量数据中学习规律从而对新的样本做决策。   机器学习是从有限的观测数据中学习(或“猜测”)出具有一般性的规律,并可以将总结出来的规律推广应用到未观测样本上。...

2024-07-30
1

【深度学习】强化学习(七)基于策略函数的学习方法

强化学习的基本任务是通过智能体与环境的交互学习一个策略,使得智能体能够在不同的状态下做出最优的动作,以最大化累积奖励。这种学习过程涉及到智能体根据当前状态选择动作,环境根据智能体的动作转移状态,并提供即时奖励...

2024-07-30
2

【深度学习】强化学习(六)基于值函数的学习方法

强化学习的基本任务是通过智能体与环境的交互学习一个策略,使得智能体能够在不同的状态下做出最优的动作,以最大化累积奖励。这种学习过程涉及到智能体根据当前状态选择动作,环境根据智能体的动作转移状态,并提供即时奖励...

2024-07-30
1

【深度学习】强化学习(五)深度强化学习

强化学习的基本任务是通过智能体与环境的交互学习一个策略,使得智能体能够在不同的状态下做出最优的动作,以最大化累积奖励。这种学习过程涉及到智能体根据当前状态选择动作,环境根据智能体的动作转移状态,并提供即时奖励...

2024-07-30
1

【深度学习】强化学习(四)强化学习的值函数

强化学习的基本任务是通过智能体与环境的交互学习一个策略,使得智能体能够在不同的状态下做出最优的动作,以最大化累积奖励。这种学习过程涉及到智能体根据当前状态选择动作,环境根据智能体的动作转移状态,并提供即时奖励...

2024-07-30
1

【深度学习】强化学习(三)强化学习的目标函数

强化学习的基本任务是通过智能体与环境的交互学习一个策略,使得智能体能够在不同的状态下做出最优的动作,以最大化累积奖励。这种学习过程涉及到智能体根据当前状态选择动作,环境根据智能体的动作转移状态,并提供即时奖励...

2024-07-30
1

【深度学习】强化学习(一)强化学习定义

强化学习的基本任务是通过智能体与环境的交互学习一个策略,使得智能体能够在不同的状态下做出最优的动作,以最大化累积奖励。这种学习过程涉及到智能体根据当前状态选择动作,环境根据智能体的动作转移状态,并提供即时奖励...

2024-07-30
1