写点什么

强化学习

0 人感兴趣 · 22 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/ab/abf6d24c10d372dfb4511fd12acddb20.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

什么是人工智能领域的深度学习?

深度学习是人工智能领域的一个重要分支,它是机器学习的一个子集,专注于构建和训练神经网络。深度学习算法试图模拟人脑的工作原理,从大量原始数据中学习复杂的特征和模式。这种学习方法使得机器能够在许多任务中实现类人的性能,如图像识别、自然语言处理、

https://static001.geekbang.org/infoq/e0/e08f94eb69f273bb608be98b0658b221.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

什么是人工智能领域的过拟合和欠拟合

在人工智能领域中,过拟合和欠拟合是两个常见的问题,它们都会对模型的性能和效果产生负面影响。本文将介绍过拟合和欠拟合的概念、原因以及解决方法。

https://static001.geekbang.org/infoq/e0/e08f94eb69f273bb608be98b0658b221.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

什么是人工智能领域模型的 Presence Penalty 参数?

在人工智能领域中,模型的质量往往受到许多因素的影响,其中一个重要的因素是模型的 Presence Penalty 参数。Presence Penalty 可以被理解为一种正则化项,它被添加到模型的损失函数中,以惩罚模型对一些特定的特征或信息进行过多地关注。

https://static001.geekbang.org/infoq/ca/cac4ff2da6d3d665a86252cbff5a2778.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

PyTorch 深度学习实战 | 自然语言处理与强化学习

用户头像
TiAmo
03-13

PyTorch是当前主流深度学习框架之一,其设计追求最少的封装、最直观的设计,其简洁优美的特性使得PyTorch代码更易理解,对新手非常友好。

https://static001.geekbang.org/infoq/63/6336f239ed1e3b2f4f0c513b0bd2f5ab.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

强化学习在智能补货场景的应用

本文以供应链全景方案中的智能补货场景为例。为你揭秘观远 AI 解决方案如何赋能企业智能补货。现有智能补货方案主要分为端到端架构和多步骤架构。

强化学习调参技巧二:DDPG、TD3、SAC 算法为例:

用户头像
汀丶
2022-12-15

强化学习调参技巧二:DDPG、TD3、SAC算法为例:先写一个简化版的训练环境。把任务难度降到最低,确保一定能正常训练。记录正常训练的智能体的分数,与随机动作、传统算法得到的分数做比较。

https://static001.geekbang.org/infoq/ac/ac30e4ff211d52938ecf70e6a05e7f06.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

基于强化学习的测试日志智能分析实践

随着软件规模的不断扩增,加快测试时间降低成本、实现智能化测试是至关重要的,而测试日志智能分析是提升智能化测试效率的一个关键步骤。

https://static001.geekbang.org/infoq/e1/e11daee79eac68b6b0338b20438a6426.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

网易伏羲 4 篇论文入选 ACM MM2022,再创游戏 AI 领域佳绩

用户头像
网易伏羲
2022-08-23

网易伏羲本次入选的4篇论文方向,分别从多个角度解决了游戏虚拟角色构建过程中不同环节的疑难杂症,并推动了AI技术在游戏角色构建方向的落地应用。

没想到,学棋五年的我竟然输给了昇腾 CANN!

摘要:整整两天,上百场对弈,TA竟然未尝一败,真是让人拍案叫绝。

万字详解什么是生成对抗网络 GAN

摘要:这篇文章将详细介绍生成对抗网络GAN的基础知识,包括什么是GAN、常用算法(CGAN、DCGAN、infoGAN、WGAN)、发展历程、预备知识,并通过Keras搭建最简答的手写数字图片生成案。

什么是强化学习?

​​​​摘要:本文尝试以一种通俗易懂的形式对强化学习进行说明,将不会包含一个公式。

强化学习落地:竞态场景下基于锁机制的闲置端口查用

用户头像
行者AI
2021-05-25

在强化学习的游戏领域落地中,我们常把逻辑复杂的真实游戏当做一个黑盒子,使用网络通信与其数据交互达到训练的目的。

https://static001.geekbang.org/infoq/d9/d918f8a6016d9bc91e2e538cd4d43ebb.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

强化学习—DQN:不讲前世,就论今生

用户头像
打工人!
2021-04-04

相信小可爱们点进这篇文章,要么是对强化学习有一定的了解,要么是想要了解强化学习算法的魅力所在,要么是了解了很多基础知识,但是不知道代码如何写。今天我就以最经典和基础的算法(DQN)带大家一探强化学习的强大基因

MindSpore:基于本地差分隐私的 Bandit 算法

摘要:本文将先简单介绍Bandit 问题和本地差分隐私的相关背景,然后介绍基于本地差分隐私的 Bandit 算法,最后通过一个简单的电影推荐场景来验证 LDP LinUCB 算法。

https://static001.geekbang.org/infoq/22/223ab1e984f93e0aab60abec854b14b1.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

论文阅读:通过动态预测 / 完备在稀疏知识图谱上进行多跳推理

用户头像
Alocasia
2021-02-28

以前的大多数推理方法都是为实体之间具有足够路径的稠密知识图谱设计的,但是在稀疏知识图谱(KG)上的效果不佳。 一方面,稀疏知识图谱包含的信息较少,这使得模型难以选择正确的路径。 另一方面,缺乏到目标实体的证据途径也使推理过程变得困难。 为

https://static001.geekbang.org/infoq/35/3512fb666dba35c99f0bffa0b9b43bcb.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

强化学习入门必看之强化学习导识

用户头像
Alocasia
2020-11-20

强化学习是近几年比较火热的研究领域,自从2017年AlphaGo战胜了李世石之后,强化学习算法成为了学术界和工业界追捧的热点。那么强化学习适合解决什么问题呢?强化学学习的体系结构是什么样的呢?下面仔细进行说明。

https://static001.geekbang.org/infoq/2c/2c1632f9b1d0ba48e4d47197481169dd.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

什么是深度强化学习?

用户头像
华章IT
2020-08-06

终于有人把强化学习和深度强化学习讲明白了

强化学习_强化学习技术文章_InfoQ写作社区