什么是广义线性模型?


广义线性模型定义了线性回归可用于对分类响应变量建模的理论依据。在广义线性模型中,响应变量 y 的方差是 y 的平均值的函数,这与线性回归不同,在线性回归中,y 的方差是常数。

广义线性模型 (GLM) 是传统线性模型的扩展。该算法通过最大化对数似然函数将广义线性模型拟合到数据中。弹性网络惩罚可用于参数正则化。模型拟合计算是并行的,非常快,并且对于具有固定数量的具有非零系数的预测变量的模型完全扩展。

广义线性模型有两种类型,例如逻辑回归和泊松回归。逻辑回归将各种事件出现的概率建模为一组预测变量的线性函数。计数数据通常表现出泊松分布,并且通常使用泊松回归进行建模。

对数线性模型精确地表示离散多维概率分布。它们可以用来计算与数据立方体单元相关的概率值。例如,假设给定属性城市、项目、年份和销售额的数据。在对数线性方法中,所有属性都应该是分类的,因此连续值属性(如销售额)应该离散化。

该方法可用于计算给定属性的 4D 基本立方体中每个单元的概率,这取决于城市和项目、城市和年份、城市和销售额的 2D 立方体,以及项目、年份和销售额的 3D 立方体。在这种方法中,可以使用迭代方法从低阶立方体生成高阶数据立方体。

该方法可以很好地扩展到多个维度。除了预测之外,对数线性模型还有利于数据压缩(因为较低阶的立方体通常比基本立方体占用更少的空间)和数据平滑(因为较低阶立方体中的单元格计算比基本立方体中的单元格计算受抽样变化的影响较小)。

决策树归纳可以适合于预测连续(有序)值,而不是类标签。有两种类型的预测树:回归树和模型树。回归树被提议作为 CART 学习系统的一部分。

每个回归树叶存储一个连续值预测,它是到达该叶的训练元组的预测属性的平均值。相反,在模型树中,每个叶节点影响一个回归模型,以及预测属性的多元线性方程。当数据不能很好地由简单的线性模型定义时,回归树和模型树往往比线性回归更有效。

更新于: 2022-02-16

932 次浏览

开启你的 职业生涯

通过完成课程获得认证

开始学习
广告
© . All rights reserved.