多重共线性解决方法是什么?

2024-05-09 20:51

1. 多重共线性解决方法是什么?

多重共线性解决方法:
1、保留重要解释变量,去掉次要或可替代解释变量:自变量之间存在共线性,说明自变量所提供的信息是重叠的,可以删除不重要的自变量减少重复信息。
但从模型中删去自变量时应该注意:从实际经济分析确定为相对不重要并从偏相关系数检验证实为共线性原因的那些变量中删除。如果删除不当,会产生模型设定误差,造成参数估计严重有偏的后果。
2、改变解释变量的形式:改变解释变量的形式是解决多重共线性的一种简易方法,例如对于横截面数据采用相对数变量,对于时间序列数据采用增量型变量。
3、差分法
4、逐步回归分析:逐步回归(Stepwise Regression)是一种常用的消除多重共线性、选取“最优”回归方程的方法。
其做法是将逐个引入自变量,引入的条件是该自变量经F检验是显著的,每引入一个自变量后,对已选入的变量进行逐个检验,如果原来引入的变量由于后面变量的引入而变得不再显著,那么就将其剔除。
引入一个变量或从回归方程中剔除一个变量,为逐步回归的一步,每一步都要进行F 检验,以确保每次引入新变量之前回归方程中只包含显著的变量。这个过程反复进行,直到既没有不显著的自变量选入回归方程,也没有显著自变量从回归方程中剔除为止。
5、主成份分析:主成分分析作为多元统计分析的一种常用方法在处理多变量问题时具有其一定的优越性,其降维的优势是明显的,主成分回归方法对于一般的多重共线性问题还是适用的,尤其是对共线性较强的变量之间。
6、偏最小二乘回归
7、岭回归:岭回归估计是通过最小二乘法的改进允许回归系数的有偏估计量存在而补救多重共线性的方法,采用它可以通过允许小的误差而换取高于无偏估计量的精度, 因此它接近真实值的可能性较大。灵活运用岭回归法, 可以对分析各变量之间的作用和关系带来独特而有效的帮助。
8、增加样本容量:多重共线性问题的实质是样本信息的不充分而导致模型参数的不能精确估计,因此追加样本信息是解决该问题的一条有效途径。但是,由于资料收集及调查的困难,要追加样本信息在实践中有时并不容易。

扩展资料:
注意事项:在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,Xk中的任何一个都不能是其他解释变量的线性组合。
如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。
一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。
参考资料:百度百科-多重共线性
                 CSDN-多重共线性问题的几种解决方法

多重共线性解决方法是什么?

2. 多重共线性的解决方法

(1)排除引起共线性的变量找出引起多重共线性的解释变量,将它排除出去,以逐步回归法得到最广泛的应用。(2)差分法时间序列数据、线性模型:将原模型变换为差分模型。(3)减小参数估计量的方差:岭回归法(Ridge Regression)。

3. 多重共线性解决方法是什么

1、排除引起共线性的变量:
找出引起多重共线性的解释变量,将它排除出去,以逐步回归法得到最广泛的应用。
2、差分法:
时间序列数据、线性模型:将原模型变换为差分模型。
3、减小参数估计量的方差:
岭回归法(Ridge Regression)。
4、简单相关系数检验法。

扩展资料:
相关影响

(1)完全共线性下参数估计量不存在
(2)近似共线性下OLS估计量非有效
(3)参数估计量经济含义不合理
(4)变量的显著性检验失去意义,可能将重要的解释变量排除在模型之外
(5)模型的预测功能失效。变大的方差容易使区间预测的“区间”变大,使预测失去意义。
需要注意:即使出现较高程度的多重共线性,OLS估计量仍具有线性性等良好的统计性质。但是OLS法在统计推断上无法给出真正有用的信息。

多重共线性解决方法是什么

4. 多重共线性

所谓多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。
完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。
2.多重共线性产生的原因
主要有3各方面:
(1)经济变量相关的共同趋势
(2)滞后变量的引入
(3)样本资料的限制

5. 多重共线性的影响

(1)完全共线性下参数估计量不存在(2)近似共线性下OLS估计量非有效多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Variance Inflation Factor, VIF)如果方差膨胀因子值越大,说明共线性越强。相反 因为,容许度是方差膨胀因子的倒数,所以,容许度越小,共线性越强。可以这样记忆:容许度代表容许,也就是许可,如果,值越小,代表在数值上越不容许,就是越小,越不要。而共线性是一个负面指标,在分析中都是不希望它出现,将共线性和容许度联系在一起,容许度越小,越不要,实际情况越不好,共线性这个“坏蛋”越强。进一步,方差膨胀因子因为是容许度倒数,所以反过来。总之就是找容易记忆的方法。(3)参数估计量经济含义不合理(4)变量的显著性检验失去意义,可能将重要的解释变量排除在模型之外(5)模型的预测功能失效。变大的方差容易使区间预测的“区间”变大,使预测失去意义。需要注意:即使出现较高程度的多重共线性,OLS估计量仍具有线性性等良好的统计性质。但是OLS法在统计推断上无法给出真正有用的信息。

多重共线性的影响

6. 多重共线性的概念

所谓多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。

7. 多重共线性的判断共线性的方法

如图,是对德国人口老龄化情况的分析,其中y是老龄化情况,线性回归的x1、x2、x3分别为人均国内生产总值、出生率、每个医生平均负担人口数。判断方法1:特征值,存在维度为3和4的值约等于0,说明存在比较严重的共线性。判断方法2:条件索引列第3第4列大于10,可以说明存在比较严重的共线性。判断方法3:比例方差内存在接近1的数(0.99),可以说明存在较严重的共线性。

多重共线性的判断共线性的方法

8. 多重共线性的介绍

多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。

最新文章
热门文章
推荐阅读