0 人感兴趣 · 1 次引用
强化学习(Reinforcement learning,简称RL)是机器学习中的一个领域,区别与监督学习和无监督学习,强调如何基于环境而行动,以取得最大化的预期利益。强化学习从基础到进阶-案例与实践[5.1]:Policy Gradient策略梯度-Cart pole游戏展示
InfoQ签约作者、腾讯云社区优秀创作者
某某某技术有限责任公司架构师
行动就在当下。
🏆 InfoQ写作平台-签约作者 🏆
提供全面深入的云计算技术干货