写点什么

强化学习

0 人感兴趣 · 5 次引用

  • 最新
  • 推荐

MindSpore:基于本地差分隐私的 Bandit 算法

摘要:本文将先简单介绍Bandit 问题和本地差分隐私的相关背景,然后介绍基于本地差分隐私的 Bandit 算法,最后通过一个简单的电影推荐场景来验证 LDP LinUCB 算法。

https://static001.geekbang.org/infoq/22/223ab1e984f93e0aab60abec854b14b1.png?x-oss-process=image/resize,w_416,h_234

论文阅读:通过动态预测 / 完备在稀疏知识图谱上进行多跳推理

用户头像
Alocasia2 月 28 日

以前的大多数推理方法都是为实体之间具有足够路径的稠密知识图谱设计的,但是在稀疏知识图谱(KG)上的效果不佳。 一方面,稀疏知识图谱包含的信息较少,这使得模型难以选择正确的路径。 另一方面,缺乏到目标实体的证据途径也使推理过程变得困难。 为

https://static001.geekbang.org/infoq/35/3512fb666dba35c99f0bffa0b9b43bcb.jpeg?x-oss-process=image/resize,w_416,h_234

强化学习入门必看之强化学习导识

用户头像
Alocasia2020 年 11 月 20 日

强化学习是近几年比较火热的研究领域,自从2017年AlphaGo战胜了李世石之后,强化学习算法成为了学术界和工业界追捧的热点。那么强化学习适合解决什么问题呢?强化学学习的体系结构是什么样的呢?下面仔细进行说明。

https://static001.geekbang.org/infoq/2c/2c1632f9b1d0ba48e4d47197481169dd.jpeg?x-oss-process=image/resize,w_416,h_234

什么是深度强化学习?

用户头像
华章IT2020 年 8 月 6 日

终于有人把强化学习和深度强化学习讲明白了

强化学习_强化学习资料文章-InfoQ写作平台