写点什么

深度强化学习

0 人感兴趣 · 4 次引用

  • 最新
  • 推荐

强化学习调参技巧二:DDPG、TD3、SAC 算法为例:

强化学习调参技巧二:DDPG、TD3、SAC算法为例:先写一个简化版的训练环境。把任务难度降到最低,确保一定能正常训练。记录正常训练的智能体的分数,与随机动作、传统算法得到的分数做比较。

https://static001.geekbang.org/infoq/d9/d918f8a6016d9bc91e2e538cd4d43ebb.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

强化学习—DQN:不讲前世,就论今生

用户头像
打工人!
2021-04-04

相信小可爱们点进这篇文章,要么是对强化学习有一定的了解,要么是想要了解强化学习算法的魅力所在,要么是了解了很多基础知识,但是不知道代码如何写。今天我就以最经典和基础的算法(DQN)带大家一探强化学习的强大基因

https://static001.geekbang.org/infoq/2c/2c1632f9b1d0ba48e4d47197481169dd.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

什么是深度强化学习?

用户头像
华章IT
2020-08-06

终于有人把强化学习和深度强化学习讲明白了

深度强化学习_深度强化学习技术文章_InfoQ写作社区