强化学习_强化学习技术文章

强化学习

0 人感兴趣 · 22 次引用

关注

最新
推荐

https://static001.geekbang.org/infoq/ab/abf6d24c10d372dfb4511fd12acddb20.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

什么是人工智能领域的深度学习？

Jerry Wang

05-10

深度学习是人工智能领域的一个重要分支，它是机器学习的一个子集，专注于构建和训练神经网络。深度学习算法试图模拟人脑的工作原理，从大量原始数据中学习复杂的特征和模式。这种学习方法使得机器能够在许多任务中实现类人的性能，如图像识别、自然语言处理、

人工智能深度学习强化学习三周年连更

https://static001.geekbang.org/infoq/e0/e08f94eb69f273bb608be98b0658b221.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

什么是人工智能领域的过拟合和欠拟合

Jerry Wang

05-08

在人工智能领域中，过拟合和欠拟合是两个常见的问题，它们都会对模型的性能和效果产生负面影响。本文将介绍过拟合和欠拟合的概念、原因以及解决方法。

人工智能机器学习深度学习强化学习三周年连更

什么是人工智能领域模型的 Presence Penalty 参数？

Jerry Wang

05-07

在人工智能领域中，模型的质量往往受到许多因素的影响，其中一个重要的因素是模型的 Presence Penalty 参数。Presence Penalty 可以被理解为一种正则化项，它被添加到模型的损失函数中，以惩罚模型对一些特定的特征或信息进行过多地关注。

人工智能机器学习深度学习强化学习三周年连更

https://static001.geekbang.org/infoq/ca/cac4ff2da6d3d665a86252cbff5a2778.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

PyTorch 深度学习实战 | 自然语言处理与强化学习

TiAmo

03-13

PyTorch是当前主流深度学习框架之一，其设计追求最少的封装、最直观的设计，其简洁优美的特性使得PyTorch代码更易理解，对新手非常友好。

强化学习 PyTorch 自然语言

https://static001.geekbang.org/infoq/63/6336f239ed1e3b2f4f0c513b0bd2f5ab.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

强化学习在智能补货场景的应用

观远数据

01-13

本文以供应链全景方案中的智能补货场景为例。为你揭秘观远 AI 解决方案如何赋能企业智能补货。现有智能补货方案主要分为端到端架构和多步骤架构。

强化学习

强化学习调参技巧二：DDPG、TD3、SAC 算法为例：

汀丶

2022-12-15

强化学习调参技巧二：DDPG、TD3、SAC算法为例：先写一个简化版的训练环境。把任务难度降到最低，确保一定能正常训练。记录正常训练的智能体的分数，与随机动作、传统算法得到的分数做比较。

强化学习深度强化学习 12月日更 12月月更

https://static001.geekbang.org/infoq/ac/ac30e4ff211d52938ecf70e6a05e7f06.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

基于强化学习的测试日志智能分析实践

华为云开发者联盟

2022-10-20

随着软件规模的不断扩增，加快测试时间降低成本、实现智能化测试是至关重要的，而测试日志智能分析是提升智能化测试效率的一个关键步骤。

人工智能测试华为云强化学习企业号十月 PK 榜

https://static001.geekbang.org/infoq/e1/e11daee79eac68b6b0338b20438a6426.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

网易伏羲 4 篇论文入选 ACM MM2022，再创游戏 AI 领域佳绩

网易伏羲

2022-08-23

网易伏羲本次入选的4篇论文方向，分别从多个角度解决了游戏虚拟角色构建过程中不同环节的疑难杂症，并推动了AI技术在游戏角色构建方向的落地应用。

人工智能机器学习算法强化学习

https://static001.geekbang.org/infoq/fa/fa11eb324dbfc16ba434c071c5f4ceec.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

浅谈德州扑克 AI 核心算法：CFR

行者AI

2022-06-21

本文首发于行者AI

人工智能 AI 强化学习

昇思 MindSpore 全场景 AI 框架 1.6 版本，更高的开发效率，更好地服务开发者

华为云开发者联盟

2022-03-09

本文带大家快速浏览昇思MindSpore全场景AI框架1.6版本的关键特性。

强化学习 mindspore ai框架图学习昇思MindSpore

https://static001.geekbang.org/infoq/6d/6d35695ffd520c1df0ac8560b5036277.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

详解策略梯度算法

行者AI

2022-01-20

本文首发于行者AI

人工智能强化学习

没想到，学棋五年的我竟然输给了昇腾 CANN！

华为云开发者联盟

2022-01-07

摘要：整整两天，上百场对弈，TA竟然未尝一败，真是让人拍案叫绝。

机器人强化学习 CANN 昇腾机械臂

万字详解什么是生成对抗网络 GAN

华为云开发者联盟

2021-12-09

摘要：这篇文章将详细介绍生成对抗网络GAN的基础知识，包括什么是GAN、常用算法（CGAN、DCGAN、infoGAN、WGAN）、发展历程、预备知识，并通过Keras搭建最简答的手写数字图片生成案。

算法推荐算法 GAN 强化学习生成对抗网络

强化学习中，Q-Learning 与 Sarsa 的差别有多大？

行者AI

2021-08-25

本文首发于：行者AI

强化学习

什么是强化学习？

华为云开发者联盟

2021-08-17

摘要：本文尝试以一种通俗易懂的形式对强化学习进行说明，将不会包含一个公式。

机器学习强化学习智能体环境动作空间

强化学习落地：竞态场景下基于锁机制的闲置端口查用

行者AI

2021-05-25

在强化学习的游戏领域落地中，我们常把逻辑复杂的真实游戏当做一个黑盒子，使用网络通信与其数据交互达到训练的目的。

强化学习

https://static001.geekbang.org/infoq/d9/d918f8a6016d9bc91e2e538cd4d43ebb.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

强化学习—DQN：不讲前世，就论今生

打工人！

2021-04-04

相信小可爱们点进这篇文章，要么是对强化学习有一定的了解，要么是想要了解强化学习算法的魅力所在，要么是了解了很多基础知识，但是不知道代码如何写。今天我就以最经典和基础的算法（DQN）带大家一探强化学习的强大基因

深度学习强化学习深度强化学习图解源码分析 DQN

MindSpore：基于本地差分隐私的 Bandit 算法

华为云开发者联盟

2021-03-09

摘要：本文将先简单介绍Bandit 问题和本地差分隐私的相关背景，然后介绍基于本地差分隐私的 Bandit 算法，最后通过一个简单的电影推荐场景来验证 LDP LinUCB 算法。

算法强化学习 mindspore Bandit 隐私

https://static001.geekbang.org/infoq/22/223ab1e984f93e0aab60abec854b14b1.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

论文阅读：通过动态预测 / 完备在稀疏知识图谱上进行多跳推理

Alocasia

2021-02-28

以前的大多数推理方法都是为实体之间具有足够路径的稠密知识图谱设计的，但是在稀疏知识图谱（KG）上的效果不佳。一方面，稀疏知识图谱包含的信息较少，这使得模型难以选择正确的路径。另一方面，缺乏到目标实体的证据途径也使推理过程变得困难。为

自然语言处理深度学习 nlp 强化学习

https://static001.geekbang.org/infoq/e2/e240ea07a79b381a4d91a9013aa6629a.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

用 AI「驯服」人类幼崽，手头有娃的可以试试

博文视点Broadview

2021-01-15

为了能安心追剧，技术宅奶爸都做了些什么……

人工智能联邦学习强化学习集成学习技术宅

https://static001.geekbang.org/infoq/35/3512fb666dba35c99f0bffa0b9b43bcb.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

强化学习入门必看之强化学习导识

Alocasia

2020-11-20

强化学习是近几年比较火热的研究领域，自从2017年AlphaGo战胜了李世石之后，强化学习算法成为了学术界和工业界追捧的热点。那么强化学习适合解决什么问题呢？强化学学习的体系结构是什么样的呢？下面仔细进行说明。

人工智能学习

https://static001.geekbang.org/infoq/2c/2c1632f9b1d0ba48e4d47197481169dd.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

什么是深度强化学习？

华章IT

2020-08-06

终于有人把强化学习和深度强化学习讲明白了

学习智能体

创作场景

强化学习

推荐作者

推荐标签