0 人感兴趣 · 1 次引用
强化学习(Reinforcement learning,简称RL)是机器学习中的一个领域,区别与监督学习和无监督学习,强调如何基于环境而行动,以取得最大化的预期利益。强化学习从基础到进阶-案例与实践[5.1]:Policy Gradient策略梯度-Cart pole游戏展示
一个日语专业的程序猿。
提供全面深入的云计算技术干货
InfoQ签约作者
还未添加个人签名
专注分享阿里技术的丰富实践和前沿创新。