深度学习和强化学习的区别
随着我们产生的数据量不断增加,我们的人工智能 (AI) 成熟度以及 AI 可能有助于解决的挑战类型也在不断增长。这些数据以及目前以可承受的价格提供的强大计算能力,正是推动 AI 技术取得巨大发展的原因,也是深度学习和强化学习得以实现的基础。在本文中,我将通过提供清晰易懂的定义,解释深度学习和强化学习之间的区别,这两种学习方法。
深度学习和强化学习与人工智能所拥有的计算能力密切相关。这些机器学习的自给自足功能为计算机在提出问题解决方案时制定自己的指导原则铺平了道路。
深度学习利用先前收集的数据,而强化学习则依靠行之有效的通过实验学习的方法。
什么是深度学习?
当时担任计算机科学教授的 Rina Dechter 于 1986 年首次提出了深度学习的概念。
深度学习利用最新的可用信息来教算法如何搜索相关模式,这在预测数据时至关重要。这样的系统利用构建方式类似于人脑神经元构成的不同层级的人工神经网络 (ANN)。如果算法能够访问复杂的链接,则它可能能够处理数百万条数据并缩小到更精确的预测。
当程序员希望软件识别各种图像中的紫色时,他们可以使用这种学习来训练软件。之后,各种图像(一些带有紫色,一些没有)将作为“深度学习”过程的一部分呈现给计算机程序。如果软件有机会通过聚类来做到这一点,它将能够识别模式并弄清楚何时将颜色标记为紫色。
深度学习用于各种识别程序,包括图像分析以及预测任务,包括时间序列预测。
什么是强化学习?
一般来说,强化学习将执行操作以最大化奖励。换句话说,学习是进行活动以获得有益结果的过程。这与我们学习骑自行车的方式非常相似,我们必须经历失败才能取得成功。
利用用户的反馈(哪些不起作用和哪些起作用),我们能够微调骑自行车所需的动作和理解。同样,计算机使用强化学习并尝试各种动作;然后,根据他们收到的反馈,他们学习并最终强化成功的动作。
让我们举个**例子**。该算法(称为强化学习)的应用之一是机器人正在教会自己如何行走。最初,一个足够大的机器人尝试向前迈出一步但失败了。
跌倒的结果是一个数据点,它代表了系统响应强化学习方式的重大进步。由于跌倒是一个作为负反馈来调整系统以尝试迈出更小一步的结果,因此有必要发生。最终,机器人获得了向前移动的能力。
深度学习和强化学习的区别
下表突出显示了深度学习和强化学习之间的主要区别 -
比较依据 | 深度学习 | 强化学习 |
---|---|---|
起源 | 深度学习的概念由 Rina Dechter 于 1986 年提出。 | 强化学习由 Richard Bellman 于 20 世纪 80 年代后期开发。 |
利用 | 在语音和图像识别、降维任务以及深度网络的预训练领域。 | 特别是在机器人、计算机游戏、电信、医疗保健中的 AI 和电梯调度领域。 |
数据存在 | 已经存在且学习所需的数据集。 | 由于其探索性,它不需要现有的数据集来学习。 |
与人脑的比较 | 强化学习是一种可以通过反馈改进的人工智能,这使得它比深度学习更类似于人脑的能力。 | 深度学习主要关注识别,与交互式学习的联系较弱。 |
教学方法 | 深度学习可以通过首先分析先前收集的数据,然后将获得的知识应用于新的数据集来执行所需的操作。 | 可以通过使用强化学习来改变答案,强化学习适应持续的输入。 |
应用 | 深度学习的应用包括图像和语音识别,以及深度网络预训练和降维。 | 相比之下,强化学习应用于在处理外部刺激时需要最优控制的情况。一些例子包括机器人、电梯调度、电信、电脑游戏和医疗保健中的 AI。 |
也称为 | 深度学习也称为分层学习或深度结构化学习。 | 强化学习没有其他常用的术语。 |
结论
深度学习(也称为强化学习)和计算学习彼此高度相关。深度学习起源于 1986 年,当时 Rina Dechter 首次向学术界提出了这一概念。另一方面,强化学习可以追溯到 20 世纪 80 年代后期,由 Richard Bellman 首次提出。
深度学习用于降维、语音和图像识别以及深度网络预训练等任务。另一方面,强化学习可以应用于机器人、计算机游戏、电信、医疗保健中的 AI 和电梯调度等领域。