当前位置 : 中医|西医 → 文章正文

    从起源到具体算法这是一份适合所有人读的深度学习综述论文

    来源:本站整理| 作者:佚名 | 时间:2018-03-29 04:45:20

      像机器学习一样,深度学习方法可以分为以下几类:监督、半监督、部分监督以及无监督。此外,还有另一类学习方法称为强化学习(Reinforcement Learning)或深度强化学习(Deep Reinforcement Learning),它们经常在半监督或非监督学习方法的范围内讨论。

      一种使用标注数据的学习技术。在其案例中,包含一组对应的输入输出 。比如,输入是 x_t,智能体预测,则会获得损失值。接着智能体不断迭代调整网络参数,从而更好地近似期望输出。成功训练之后,智能体可对问题做出正确回答。监督学习主要有以下几种:深度神经网络 (DNN)、卷积神经网络 (CNN)、循环神经网络(包含 LSTM)以及门控循环单元(GRU)。上述网络将分别在 2、3、4、5 章节中详述。

      一种使用部分标注数据的学习技术(通常被称之为强化学习)。本文第 8 节调查了其方法。在一些案例中,深度强化学习(DRL)和生成对抗网络(GAN)常被用作半监督学习技术。此外,包含 LSTM 的 RNN 和 GRU 也可划分为半监督学习。GAN 将在第 7 节讨论。

      一种不使用标注数据的学习技术。在这种情况下,智能体学习内部表示或重要特征以发现输入数据中的未知关系或结构。无监督学习方法通常有聚类、降维和生成技术等。有些深度学习技术擅长聚类和非线性降维,如自编码器(AE)、受限玻尔兹曼机(RBM)和 GAN。此外,RNN(比如 LSTM)和 RL 也被用作半监督学习 [243]。本文第 6、7 节将分别详述 RNN 和 LSTM。

      一种适用于未知的学习技术。DRL 始于 2013 年谷歌 Deep Mind[5,6]。从此,人们基于 RL 提出了几种先进的方法,例如:如果样本输入:agent〜ρ,agentpredict:,agentreceivecost:,其中 P 是未知概率分布,向智能体提出问题,并给其一个有噪音的分值作为答案。有时这种方法也被称为半监督学习。许多半监督和无监督学习方法已经基于这个概念实施(第 8 节)。在 RL 中,我们没有一个简单的前向损失函数,因此与传统的监督方法相比,这使得机器学习变得更困难。RL 和监督学习之间的根本区别在于:首先,我们无法获取你正在优化的函数,而必须通过交互来查询它;其次,我们正在与基于状态的交互:输入 x_t 取决于先前的动作。

    上一页  [1] [2] [3] [4] [5]  下一页


合作伙伴: 开心笑话
Copyright 2010-2012 大戏院论文网 All Rights Reserved. 如需合作请联系站长
技术支持:FXT