概率学习:含义和意义


在给定课程和整个进步过程中,个人获得概率数据以实时驱动活动的程度尚不清楚。然而,人们会跟踪概率,例如周围环境中事件之间的关系。成人和儿童参加了两项测试,他们在随机概率分配的站点寻找隐藏的奖励。幼儿和成人都在实验室中调整了他们的策略,以在实验过程中更好地最大化他们的奖励。然而,成年人在切换策略方面更为有效。延迟成功的策略会改变成人和儿童,从而增加理解既定概率的难度。总的来说,这些发现说明了幼儿和成人对新知识的适应能力,以及他们如何改变自己的行为。

什么是概率学习?

在学习科学中,使用概率学习的实证主义范式是一种常见的做法。这些实验的参与者通常被要求预测多个输入或事件中的一个。随着他们获得更多知识,他们的预测将越来越接近反映各种情况的真实可能性。

儿童的概率学习

即使在很小的年龄,儿童也表现出对概率数据的兴趣。例如,一群 7 个月大的新生儿观察了一位研究人员从一个盒子里抽出一系列球,这个盒子中红色球的数量明显多于白色球。当研究人员抽出一系列白色球时,婴儿比研究人员抽出一系列红色球时,注视盒子的时间长得多。婴儿意识到这些结果没有反映盒子内颜色的分布,这将在这些统计数据中得到体现。学龄前儿童在得出结论时也会考虑集合的抽样分布。当他们发现从一套彩色积木中取出一块特定的积木可以触发玩具的音乐和灯光时,他们感到惊讶。孩子们关于哪种颜色的积木触发了玩具的理论反映在红色和蓝色积木的相对丰度中。

示例

所有年龄段的孩子都可以从学习识别和跟踪概率中受益,并且还可以利用这些知识来指导他们的行为。例如,一个两岁的孩子被展示了两个物体,并被告知根据哪个物体更有可能激活灯光和音乐来选择其中一个,他选择了更有可能的选择。另一项研究中的学龄前儿童利用概率数据来对代理人的玩具请求做出适当的回应:那些之前见过代理人从盒子里选择最不常见的玩具类型的儿童后来给了代理人这种类型的玩具;那些之前见过代理人从盒子里选择最常见的玩具类型的儿童在为代理人选择玩具时没有表现出偏好。这些例子表明,孩子们如何利用概率数据来学习和回应周围的环境。

概率学习的规模

研究人员设计了一项概率学习任务来调查孩子们如何随着时间的推移利用他们不断增长的知识库。概率学习活动中的概率信息通常在多个试验中提供给学习者。在最简单的概率学习任务形式中,参与者可以选择两种替代方案中的一种,并被要求再次做出相同的决定,其中一种替代方案获得更高的强化率。用户不会收到有关这些隐藏概率的信息,因此他们必须依靠自己的观察结果在未来的试验中做出良好的决定。从这些努力中收集的信息通常被解释为一个人在实验期间的常规行为。这意味着以前的研究未能阐明人们是否会随着年龄和经验的增长而调整他们对知识的使用来改善他们的行为。

根据跨试验汇总的数据,研究人员发现人们在解决这些概率学习任务时采用了两种不同的方法:“机会匹配”和“最大化”。在一种称为“概率匹配”的方法中,玩家会根据行动导致积极结果的可能性来选择行动。

概率学习的变化

具有概率学术科目的人在各种任务结构甚至种族中始终如一地表现出匹配行为。这里讽刺的是,通过匹配,最终获得的奖励比最大化时少。因为即使他们知道平均奖励频率,用户仍然不知道何时会奖励特定位置或答案选择。

概率学习的变化

与上面讨论的新生儿和幼儿研究不同,如上所述,概率教学策略提供了跨年龄的直接比较。然而,在概率学习任务的研究中,关于年龄差距的描述存在差异,特别是在匹配和最大化方面。多项研究表明,学龄儿童的匹配率与成年人相当,并且比同龄的成年人更多地进行了最大化。另一些人发现,成年人比年轻人更善于优化奖励。也许以前的研究对整个实验环节的行为进行了平均,因此难以辨别发展差异。虽然使用更常见的概率学习任务的研究与前面描述的研究不同,但它们尚未检测到持续的行为变化。

结论

通过使用一种分析方法,该方法允许对概率训练过程中的行为进行连续测量,我们可以开始理解是否需要获取更多关于受影响区域行为随时间推移的基本概率结构的知识。此外,通过招募不同年龄段的参与者,我们可以评估生活经验的影响,并观察人们的概率思维能力是否会随着年龄的增长而发展。每位参与者都进行了一项挑战,其中他们被提供了多个选择,每个选择都会以不同的数量增加他们获胜的机会。在整个试验中,我们跟踪了参与者的决策并分析了任何可识别的趋势。关于人们是否会在单个实验过程中改变他们的行为,以及如果改变,会发展哪些趋势,这一点尚不清楚,因为过去的研究通常对试验块中的参与者行为进行了平均。我们预测早期行为将与机会匹配相符。然而,根据概率学习理论,如果在实验过程中记录了特定的行为,那么行为将逐渐与最大化相符。

更新于: 2022年12月15日

672 次查看

开启你的 职业生涯

通过完成课程获得认证

立即开始
广告