元强化学习
0 人感兴趣 · 4 次引用
- 最新
- 推荐
深度学习应用篇 - 元学习 [16]:基于模型的元学习 -Learning to Learn 优化策略、Meta-Learner LSTM
Learning to Learn by Gradient Descent by Gradient Descent 提出了一种全新的优化策略,用 LSTM 替代传统优化方法学习一个针对特定任务的优化器。
深度学习应用篇 - 元学习 [15]:基于度量的元学习:SNAIL、RN、PN、MN
元学习可以被定义为一种序列到序列的问题,在现存的方法中,元学习器的瓶颈是如何去吸收同化利用过去的经验。注意力机制可以允许在历史中精准摘取某段具体的信息。
深度学习应用篇 - 元学习 [14]:基于优化的元学习 -MAML 模型、LEO 模型、Reptile 模型
Model-Agnostic Meta-Learning (MAML): 与模型无关的元学习,可兼容于任何一种采用梯度下降算法的模型。MAML 通过少量的数据寻找一个合适的初始值范围,从而改变梯度下降的方向,找到对任务更加敏感的初始参数,使得模型能够在有限的数据集上快速拟合,并获
深度学习应用篇 - 元学习 [13]:元学习概念、学习期、工作原理、模型分类等
元学习 (Meta-Learning) 通常被理解为“学会学习 (Learning-to-Learn)”,指的是在多个学习阶段改进学习算法的过程。在基础学习过程中,内部(或下层/基础)学习算法解决由数据集和目标定义的任务。在元学习过程中,外部(或上层/元)算法更新内部学习算法,