元强化学习_元强化学习技术文章_InfoQ写作社区

全部标签 



写点什么

登录注册

元强化学习

0 人感兴趣 · 4 次引用

关注

最新
推荐

https://static001.geekbang.org/infoq/ef/ef22d6fa64cd85f515d3620961ba0c34.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

深度学习应用篇 - 元学习 [16]：基于模型的元学习 -Learning to Learn 优化策略、Meta-Learner LSTM

汀丶人工智能

06-15

Learning to Learn by Gradient Descent by Gradient Descent 提出了一种全新的优化策略，用 LSTM 替代传统优化方法学习一个针对特定任务的优化器。

人工智能深度学习元学习元强化学习 6 月优质更文活动

https://static001.geekbang.org/infoq/ef/ef22d6fa64cd85f515d3620961ba0c34.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

深度学习应用篇 - 元学习 [15]：基于度量的元学习：SNAIL、RN、PN、MN

汀丶人工智能

06-15

元学习可以被定义为一种序列到序列的问题，在现存的方法中，元学习器的瓶颈是如何去吸收同化利用过去的经验。注意力机制可以允许在历史中精准摘取某段具体的信息。

人工智能深度学习元学习元强化学习 6 月优质更文活动

https://static001.geekbang.org/infoq/ef/ef22d6fa64cd85f515d3620961ba0c34.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

深度学习应用篇 - 元学习 [14]：基于优化的元学习 -MAML 模型、LEO 模型、Reptile 模型

汀丶人工智能

06-14

Model-Agnostic Meta-Learning (MAML)：与模型无关的元学习，可兼容于任何一种采用梯度下降算法的模型。MAML 通过少量的数据寻找一个合适的初始值范围，从而改变梯度下降的方向，找到对任务更加敏感的初始参数，使得模型能够在有限的数据集上快速拟合，并获

人工智能深度学习元学习元强化学习 6 月优质更文活动

https://static001.geekbang.org/infoq/ef/ef22d6fa64cd85f515d3620961ba0c34.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

深度学习应用篇 - 元学习 [13]：元学习概念、学习期、工作原理、模型分类等

汀丶人工智能

06-14

元学习 (Meta-Learning) 通常被理解为“学会学习 (Learning-to-Learn)”，指的是在多个学习阶段改进学习算法的过程。在基础学习过程中，内部（或下层/基础）学习算法解决由数据集和目标定义的任务。在元学习过程中，外部（或上层/元）算法更新内部学习算法，

人工智能深度学习元学习元强化学习 6 月优质更文活动

1

玩转社区

Q&A

优质合集

精选文章

企业号社区

行业技术资讯