回归分析

2024-05-18 16:48

1. 回归分析


回归分析

2. 什么是回归分析?

科普中国·科学百科:回归分析

3. 回归的回归分析的应用

相关分析研究的是现象之间是否相关、相关的方向和密切程度,一般不区别自变量或因变量。而回归分析则要分析现象之间相关的具体形式,确定其因果关系,并用数学模型来表现其具体关系。比如说,从相关分析中我们可以得知“质量”和“用户满意度”变量密切相关,但是这两个变量之间到底是哪个变量受哪个变量的影响,影响程度如何,则需要通过回归分析方法来确定。一般来说,回归分析是通过规定因变量和自变量来确定变量之间的因果关系,建立回归模型,并根据实测数据来求解模型的各个参数,然后评价回归模型是否能够很好的拟合实测数据;如果能够很好的拟合,则可以根据自变量作进一步预测。例如,如果要研究质量和用户满意度之间的因果关系,从实践意义上讲,产品质量会影响用户的满意情况,因此设用户满意度为因变量,记为Y;质量为自变量,记为X。根据图8-3的散点图,可以建立下面的线性关系:Y=A+BX+§式中:A和B为待定参数,A为回归直线的截距;B为回归直线的斜率,表示X变化一个单位时,Y的平均变化情况;§为依赖于用户满意度的随机误差项。在SPSS软件里可以很容易地实现线性回归,回归方程如下:y=0.857+0.836x回归直线在y轴上的截距为0.857、斜率0.836,即质量每提高一分,用户满意度平均上升0.836分;或者说质量每提高1分对用户满意度的贡献是0.836分。上面所示的例子是简单的一个自变量的线性回归问题,在数据分析的时候,也可以将此推广到多个自变量的多元回归,具体的回归过程和意义请参考相关的统计学书籍。此外,在SPSS的结果输出里,还可以汇报R2,F检验值和T检验值。R2又称为方程的确定性系数(coefficient of determination),表示方程中变量X对Y的解释程度。R2取值在0到1之间,越接近1,表明方程中X对Y的解释能力越强。通常将R2乘以100%来表示回归方程解释Y变化的百分比。F检验是通过方差分析表输出的,通过显著性水平(significant level)检验回归方程的线性关系是否显著。一般来说,显著性水平在0.05以下,均有意义。当F检验通过时,意味着方程中至少有一个回归系数是显著的,但是并不一定所有的回归系数都是显著的,这样就需要通过T检验来验证回归系数的显著性。同样地,T检验可以通过显著性水平或查表来确定。在上面所示的例子中,各参数的意义如表8-2所示。表8-2 线性回归方程检验  指标  值  显著性水平  意义R  0.89    “质量”解释了89%的“用户满意度”的变化程度  F  276.82  0.001  回归方程的线性关系显著  T  16.64  0.001  回归方程的系数显著

回归的回归分析的应用

4. 关于回归分析的几个问题

1、0均值假设 同方差假设 随机扰动与解释变量不相关 无自相关假设 正态性假设
数据预处理 理论模型设定 模型参数估计 模型的检验 
伪回归是指变量间本来不存在相依关系,但回归结果却得出存在相依关系的错误结论。
造成“伪回归”的根本原因在于时序序列变量的非平稳性
2、拟合优度是样本回归线对样本观测数据拟合的优劣程度 
拟合优度的度量建立在对总变差分解的基础上
3、在回归方程中,解释变量可以用来解释被解释变量的依据是通过各种检验的参数估计值
4、在原假设为参数显著为零成立的条件下,变量参数估计的|t值|与|t临界值|比较,若|t值|<|t临界值|,则参数显著为零,或者用t值的伴随概率P-值与显著水平比较,P-值<α,拒绝原假设,参数对应的解释变量对被解释变量的影响显著。

5. 关于回归分析的几个问题

1. 直线回归方程的求法 (1)回归方程的概念: 直线回归方程的一般形式是�0�6(音y hat)=a+bx,其中x为自变量,一般为资料中能精确测定和控制的量,Y为应变量,指在x规定范围内随机变化的量。a为截距,是回归直线与纵轴的交点,b为斜率,意为x每改变一个单位时,�0�6的变化量。 (2)直线回归方程的求法 确定直线回归方程利用的是最小二乘法原理,基本步骤为: 1)先求 b,基本公式为b=lxy/lxx=SSxy/SSxx ,其中lxy为X,Y的离均差积和,lxx为X的离均差平方和; 2)再求a,根据回归方程 a等于Y的均值减去x均值与b乘积的差值。 (3)回归方程的图示: 根据回归方程,在坐标轴上任意取相距较远的两点,连接上述两点就可得到回归方程的图示。应注意的是,连出的回归直线不应超过x的实测值范围. 2. 回归关系的检验 回归关系的检验又称回归方程的检验,其目的是检验求得的回归方程在总体中是否成立,即是否样本代表的总体也有直线回归关系。方法有以下两种: (1)方差分析 其基本思想是将总变异分解为SS回归和SS剩余,然后利用F检验来判断回归方程是否成立。 (2)t检验 其基本思想是利用样本回归系数b与总体均数回归系数�0�8进行比较来判断回归方程是否成立,实际应用中因为回归系数b的检验过程较为复杂,而相关系数r的检验过程简单并与之等价,故一般用相关系数r的检验来代替回归系数b的检验。 3. 直线回归方程的应用 (1)描述两变量之间的依存关系; 利用直线回归方程即可定量描述两个变量间依存的数量关系 (2)利用回归方程进行预测; 把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计,即可得到个体Y值的容许区间。 (3)利用回归方程进行统计控制 规定Y值的变化,通过控制x的范围来实现统计控制的目标。如已经得到了空气中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度。 4. 应用直线回归的注意事项 (1)做回归分析要有实际意义; (2)回归分析前,最好先作出散点图; (3)回归直线不要外延。

关于回归分析的几个问题

6. 什么是回归分析

回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
 
回归分析是应用极其广泛的数据分析方法之一。它基于观测数据建立变量间适当的依赖关系,以分析数据内在规律,并可用于预报、控制等问题。

7. 回归分析的定义

回归分析是应用极其广泛的数据分析方法之一。它基于观测数据建立变量间适当的依赖关系,以分析数据内在规律,并可用于预报、控制等问题。方差齐性线性关系效应累加变量无测量误差变量服从多元正态分布观察独立模型完整(没有包含不该进入的变量、也没有漏掉应该进入的变量)误差项独立且服从(0,1)正态分布。现实数据常常不能完全符合上述假定。因此,统计学家研究出许多的回归模型来解决线性回归模型假定过程的约束。研究一个或多个随机变量Y1 ,Y2 ,…,Yi与另一些变量X1、X2,…,Xk之间的关系的统计方法,又称多重回归分析。通常称Y1,Y2,…,Yi为因变量,X1、X2,…,Xk为自变量。回归分析是一类数学模型,特别当因变量和自变量为线性关系时,它是一种特殊的线性模型。最简单的情形是一个自变量和一个因变量,且它们大体上有线性关系,这叫一元线性回归,即模型为Y=a+bX+ε,这里X是自变量,Y是因变量,ε是随机误差,通常假定随机误差的均值为0,方差为σ^2(σ^2大于0)σ^2与X的值无关。若进一步假定随机误差遵从正态分布,就叫做正态线性模型。一般的情形,它有k个自变量和一个因变量,因变量的值可以分解为两部分:一部分是由于自变量的影响,即表示为自变量的函数,其中函数形式已知,但含一些未知参数;另一部分是由于其他未被考虑的因素和随机性的影响,即随机误差。当函数形式为未知参数的线性函数时,称线性回归分析模型;当函数形式为未知参数的非线性函数时,称为非线性回归分析模型。当自变量的个数大于1时称为多元回归,当因变量个数大于1时称为多重回归。回归分析的主要内容为:①从一组数据出发,确定某些变量之间的定量关系式,即建立数学模型并估计其中的未知参数。估计参数的常用方法是最小二乘法。②对这些关系式的可信程度进行检验。③在许多自变量共同影响着一个因变量的关系中,判断哪个(或哪些)自变量的影响是显著的,哪些自变量的影响是不显著的,将影响显著的自变量入模型中,而剔除影响不显著的变量,通常用逐步回归、向前回归和向后回归等方法。④利用所求的关系式对某一生产过程进行预测或控制。回归分析的应用是非常广泛的,统计软件包使各种回归方法计算十分方便。在回归分析中,把变量分为两类。一类是因变量,它们通常是实际问题中所关心的一类指标,通常用Y表示;而影响因变量取值的的另一类变量称为自变量,用X来表示。回归分析研究的主要问题是:(1)确定Y与X间的定量关系表达式,这种表达式称为回归方程;(2)对求得的回归方程的可信度进行检验;(3)判断自变量X对因变量Y有无影响;(4)利用所求得的回归方程进行预测和控制。

回归分析的定义

8. 什么是回归分析

所谓回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的依赖关系。回归分析与相关分析的联系是什么:回归分析和相关分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。
最新文章
热门文章
推荐阅读