机器学习算法的不同组成部分是什么?
为了理解机器学习算法的各个组成部分,我们首先要了解 Mitchell 教授给出的机器学习定义:
“如果一个计算机程序在执行任务 T 时,其性能 P 随着经验 E 的积累而提高,那么我们就说该程序从经验 E 中学习了。”
从上述定义可以看出,任何机器学习算法的主要组成部分都是任务 (T)、性能 (P) 和经验 (E)。
基于这三个组成部分,让我们简化机器学习的定义:
机器学习是人工智能 (AI) 的一个子集,也是计算机科学的一个领域,它包含学习算法,这些算法随着时间的推移,通过经验 E 来提高执行某些任务 T 的性能 (P)。
任务 (T) - 任务 (T) 应该从两个方面进行定义:一个是问题视角,另一个是机器学习视角。从问题的角度来看,它可以定义为需要解决的现实世界问题。例如,问题可以是找到最佳的营销策略或预测房价。而从机器学习的角度来看,任务 T 基于系统应该遵循的工作流程来操作样本数据点。例如,分类、回归、异常检测、聚类、转录等都可以归类为基于机器学习的任务。
经验 (E) - 通俗地讲,经验是指一个人通过做某事或观察别人做某事而获得的知识。而在基于机器学习的任务中,经验是指从样本数据点中获得的知识。一旦机器学习算法获得数据点,它就会迭代运行并从内在模式中学习。监督学习、无监督学习、半监督学习和强化学习是学习和获取经验的一些方法。
性能 (P) - 你如何判断你的机器学习模型(应该执行任务 T 并在一段时间内从样本数据点中获取经验 E)的表现好坏?这就是第三个组成部分性能 (P) 出现的原因。它是一个定量指标,用于衡量机器学习模型在利用经验 (E) 执行任务 (T) 方面的表现好坏。一些用于衡量机器学习模型性能的性能指标包括准确率得分、F1 分数、精确率、混淆矩阵、召回率和灵敏度。
广告