回归分析在心理学中的应用
假设您是一名销售经理,负责预测下一季度的业绩。您清楚地知道,可能影响业绩的因素有很多,可能数十个,甚至更多,例如温度、供应商的促销活动或关于更大、更具创新性设计的传言。公司内部的个人可能对哪些因素对销售产生了最大的影响有所了解。
回归分析的含义
利用回归模型中的图形方程,您可以从数据中推断信息。例如,如果您的体重在过去几年中稳步增加,那么计算器可以估计如果您的体重增长趋势保持不变,您在 10 年后的体重会增加多少。此外,它还提供了一些指标来帮助您评估模型的精确度。创建频率分布和运行线性回归是入门课程中两个最基本统计程序。但是,在研究中可能会出现更复杂的过程,例如多元回归。
回归是一种用于金融和投资领域的技巧,它检查一组自变量的单一线性函数之间的关系。线性回归是这种方法中最流行的一种,也称为简单回归或偏最小二乘法。线性回归使用最佳拟合线来确定两个变量之间是否存在线性关系。因此,直线用于直观地表示回归分析,其中梯度表示两个变量之间的关系。线性内插的 Como 是当另一个参数为零时一个统计量的值。虽然存在非线性回归器,但它们更为复杂。虽然回归分析对于揭示信息点之间的相关性很有用,但它在建立因果关系方面用处不大。它在商业、金融和经济领域有很多应用。财务顾问使用它来帮助他们计算投资的公平市场价值,并分析股票价格与从事这些商品和服务的公司股票之间的相关性。
回归分析的历史
勒让德和高斯分别于 1803 年和 1808 年发表了最小二乘法的版本,标志着现代回归分析领域的开始。勒让德和高斯都使用这种技术来解决仅使用天文信息作为输入来计算行星轨道的挑战。高斯-马尔可夫定理包含在高斯 1820 年的出版物中,并使用最小二乘法理论进行了很好的解释。弗朗西斯·高尔顿在 18 世纪写关于生物学条件时创造了“回归”一词。具有高个祖先的人的相对身高往往会回归到平均水平。高尔顿最初只将回归应用于这种生物系统,但 Udny 和卡尔将其发现推广了。尤尔和皮尔逊的研究假设响应和预测变量之间存在高斯线性组合。费舍尔在 1920 年和 1923 年的著作中对这一假设提出了质疑。概率密度不需要是高斯的,但费舍尔假设它是,因为因变量的条件概率是。有了这个假设,费舍尔更符合高斯 1820 年的准备工作。20 世纪 40 年代和 50 年代的金融专家使用电动机械桌面“算盘”进行回归。在 1960 年之前,等待长达 22 个小时才能确定一次停滞的结果是很常见的。
回归分析的基本要素
自变量和因变量
自变量是因变量的潜在影响因素。例如:“我感兴趣的是员工幸福感如何影响产品销售。”在这种情况下,工作满意度是解释变量,而销售额是响应变量。进行回归分析的第一步是隔离变量。
相关性和因果关系
永远不要假设相关性意味着因果关系是统计检验关系的金科玉律。也就是说,一对变量以相同的方式变化并不意味着一个变量导致了另一个变量。如果两个或多个因素相关,则它们的改变路径可能相关。两个变量之间存在强相关性表明它们的改变之间存在反向关系。当两个因素负相关时,一个增加而另一个减少。可以通过计算相关系数(通常表示为 r)来衡量相关性的强度。相关系数是一个介于 -1 和 1 之间的数字。当一个因素导致另一个因素时,我们说存在因果关系。只有包含两个实验组的实验室测试才能确定不同参数之间的因果关系。回归分析可以阐明多重共线性,但它不能建立因果关系。在运行回归模型或分析变量之间的关联时,很容易陷入将一个变量归因于另一个变量的因果关系陷阱,特别是如果希望是这样的情况。
回归分析的类型
主要类型包括:
简单回归分析
可以使用单个变量广义线性模型来计算研究变量之间的关系。
多元回归分析
相反,多元回归分析的目标是在其变量和两个或多个外生变量之间建立联系。
结论
总之,回归是一种用于信息处理的技术,用于发现变量之间的关系。它可以证明相关性的强度并评估其统计显著性结果。除了在参数估计中的用处之外,外推法还可以用于根据历史数据进行预测。回归过程是一种很好的统计技术,可以在整个公司中使用,以了解某些变量对因变量的影响程度。回归模型可以在无限的上下文中使用,以提供有见地的、实用的商业见解。