深度学习和强化学习的区别

随着我们产生的数据量不断增加，我们的人工智能 (AI) 成熟度以及 AI 可能有助于解决的挑战类型也在不断增长。这些数据以及目前以可承受的价格提供的强大计算能力，正是推动 AI 技术取得巨大发展的原因，也是深度学习和强化学习得以实现的基础。在本文中，我将通过提供清晰易懂的定义，解释深度学习和强化学习之间的区别，这两种学习方法。

深度学习和强化学习与人工智能所拥有的计算能力密切相关。这些机器学习的自给自足功能为计算机在提出问题解决方案时制定自己的指导原则铺平了道路。

深度学习利用先前收集的数据，而强化学习则依靠行之有效的通过实验学习的方法。

什么是深度学习？

当时担任计算机科学教授的 Rina Dechter 于 1986 年首次提出了深度学习的概念。

深度学习利用最新的可用信息来教算法如何搜索相关模式，这在预测数据时至关重要。这样的系统利用构建方式类似于人脑神经元构成的不同层级的人工神经网络 (ANN)。如果算法能够访问复杂的链接，则它可能能够处理数百万条数据并缩小到更精确的预测。

当程序员希望软件识别各种图像中的紫色时，他们可以使用这种学习来训练软件。之后，各种图像（一些带有紫色，一些没有）将作为“深度学习”过程的一部分呈现给计算机程序。如果软件有机会通过聚类来做到这一点，它将能够识别模式并弄清楚何时将颜色标记为紫色。

深度学习用于各种识别程序，包括图像分析以及预测任务，包括时间序列预测。

什么是强化学习？

一般来说，强化学习将执行操作以最大化奖励。换句话说，学习是进行活动以获得有益结果的过程。这与我们学习骑自行车的方式非常相似，我们必须经历失败才能取得成功。

利用用户的反馈（哪些不起作用和哪些起作用），我们能够微调骑自行车所需的动作和理解。同样，计算机使用强化学习并尝试各种动作；然后，根据他们收到的反馈，他们学习并最终强化成功的动作。

让我们举个**例子**。该算法（称为强化学习）的应用之一是机器人正在教会自己如何行走。最初，一个足够大的机器人尝试向前迈出一步但失败了。

跌倒的结果是一个数据点，它代表了系统响应强化学习方式的重大进步。由于跌倒是一个作为负反馈来调整系统以尝试迈出更小一步的结果，因此有必要发生。最终，机器人获得了向前移动的能力。

Explore our latest online courses and learn new skills at your own pace. Enroll and become a certified expert to boost your career.