强化计划

强化行为意味着增加其在未来重复出现的可能性，而惩罚则意味着降低其出现的可能性。在许多情况下，这种计划成为一个重要方面，因为它会影响产生反应的总体程度。它控制着操作条件下补充的时机和强度。这些原则规范了强化的计划和发生，以增加该反应发生的概率。

什么是强化计划？

知识是一个逐渐发展并持续相当长时间的特征养成过程，在这个过程中，许多因素都起着作用。这也决定了需要加强的行为部分。在许多情况下，每一步都需要它，而在其他情况下则根本不需要。它们是在自然环境和更有组织的活动条件下发展的。许多强化计划都非常适合某种类型的实践情况。有时，它可能需要一种计划，然后转向另一种。它们分为两个子类别。

连续强化计划
部分强化计划

连续强化计划

在这种计划中，每次行为发生时都会得到强化。这是一个基本的模式，其中已习得的反应将产生结果。这广泛用于初级阶段，在这些阶段需要在行动和回应之间建立持久的联系。例如，要叫猫的名字，需要在每次叫猫的名字时都给予奖励。这种持续的回应最终将导致猫对被叫特定名字做出反应。

部分强化计划

一旦认识到基本的反应，连续强化计划就会转换为部分强化计划。在这种计划中，回应在部分时间得到强化。这种类型的计划行为学习速度较慢，但相比之下，它对消退的抵抗力更强。以猫为例，在建立基本行为之后，并在回应过程中经过一段时间后，将不再采用连续方法；它将转换为部分方法，其中将提供额外的强化。此外，它们细分为四种强化类型。

主要强化计划

以下是主要强化计划：

固定比率 (FR)

在这些活动中，在产生一定数量的反应后给予强化。这会产生较高的反应率，直到给予奖励，然后是行为停顿。在某些情况下，它只在几次准确的反应后才会强化行为。由于认为下一次反应可能会带来强化，所以有机体坚持反应。这种计划在赌场中很常见。例如，鞋匠每制作五双鞋后获得报酬，因此在完成五双鞋后会有一段休息或延迟时间。

可变比率 (VR)

与上述不同，在这种计划中，强化是在可变数量的反应后给予的。这会产生与固定比率类型一样的反应率。在这种情况下，有机体致力于做出反应，期望接下来的反应能够获得强化。这种行为在赌徒中非常普遍，因为他们的奖励是基于随机可变的计划。例如，在经典的赌博机案例中，用户不断拉动拉杆，希望在下一次拉动中获得奖励。

固定间隔 (FI)

第一个反应是在经过精确的时间段后给予的。在特定情况下，当特定时间量过去后给予强化。在这种情况下，有机体会倾向于在这个时间间隔结束时增加反应的相关性，而当奖励最近得到强化时，这个比率会显著下降。例如，一个很好的例子是考试；当考试临近时，反应速度会加快，而且每个人在考试结束后都会感到轻松。

可变间隔 (VI)

当强化在不可预测的时间段后给予时，就会发生这种情况。这会产生稳定而持续的强化速度，因为有机体不知道下一次奖励将在何时获得。例如，一个好学生会认真准备突击测试，因为顾名思义，这些测试可能随时发生。

	优势	劣势
固定比率计划	建立高反应率	如果强化中断，可能会导致不规律的反应。
可变比率计划	学习者的反应速度保持不变	对于教授新的行为无效
固定间隔计划	易于实施	强化后，学习者可能会停止使用目标技能，并在下一个强化周期之前恢复工作。
可变间隔计划	易于实施	对于教授新的行为无效

消退

当强化停止时，反应开始减少或下降。反应计划中的这种变化被称为消退。它可以理解为在停止强化后反应消失的时间长度。与可变计划相比，固定计划更容易发生这种情况。

选择强化计划

关于哪些类型的行为最适合用某些类型的计划进行奖励，已经有一些建议。你一定会发现一些方法可以调整这些计划，使它们在你的课堂上和某些孩子身上更容易实施和更有效。最重要的是，你仔细选择要使用的任何类型的计划，如果它似乎不起作用，请重新考虑它或你的功能分析。选择错误类型的强化计划可能会对行为改善有害。对于已经拥有其行为库中所需行为但选择不展示它的学习者，连续强化不会有所帮助。通过拒绝展示行为，直到明确你会提供所需的强化，他或她可能会学会操纵你是可能的。因此，选择奖励计划对于成为行为干预方法的重要组成部分至关重要。

结论

如上所述，这些计划有助于增强学习。这些计划可以与其他辅助方法一起使用，以提高行为的保持性和快速发展。确定何时以及如何强化行为阶段非常重要；通常，连续方法用于使主体熟悉预期的行为。在长时间使用连续方法后，应切换到部分方法，这预计会产生持久的影响，并且更容易应用。这些方法已成为心理学的重要组成部分。它们在许多情况下被用来治疗一个人，或者在某些情况下，提高一个人的整体学习能力。积极改善理解能力是现代世界的愿望之一，并且在这个领域可以取得进步。这种方法对于改善给予患有意识异常的人的心理治疗非常有益。

Utkarsh Shukla

更新于：2022年12月15日

114 次浏览

启动你的职业生涯

完成课程获得认证

开始