因子分析怎么做

2024-05-08 20:52

1. 因子分析怎么做

问题一:用SPSS已经做出了因子分析,那么具体的分析结果应该怎么看呢?  KMO检验统计量在0.7以上,说明变量之间的偏相关性较强,适合做因子分析,球形检验p小于0.001,说明变量之间存在相关性。第二格表格为共同性,表示各变量中所含原始信息能被提取的共同因子所表示的程度,根据你的数据,你提取的公因子是两个,第三个表格是指提取的俩个主成分能解福差异的比列,第四个表格是主成分表达式,第五表格是因子得分公式。 
  
   问题二:因子分析到底有什么用处?  问题:大家觉得因子分析到底有什幺用处呢?把原来很多个影响因素归纳成几个影响因子,如果不继续做回归或者聚类的话,光做因子分析有价值吗?答复:因子分析是将多个实测变量转换为少数几个综合指标(或称潜变量),它反映一种降维的思想。通过降维将相关性高的变量聚在一起,从而减少需要分析的变量的数量,而减少问题分析的复杂性。在你对问题系统结构不了解时候,因子分析可以根据数据内在逻辑性,把它归并成几个公因子,每个公因子分别代表空间的一个维度,如果经过正交或斜 交旋转的话,各个维度之间可以认为是不相关的,这些公因子能够相对完整地刻画对象的体系维度,最起码累计方差贡献率大于85%的话,就基本能够保证重要信 息不丢失了。一句话,你如果对研究对象到底应该分为几个维度不清楚的话,用因子分析可以通过数据内在逻辑告诉你。但如果你对研究对象体系比较清楚的话,那你直接确定维度,通过AHP计算出权重,就能够把系统表述清楚了。但这里面有巨大问题,单纯通过数据内 在逻辑来判断维度,常常是错误的,而主观判断其实更加科学,并非象统计学宣称的,数据说话才有发言权。真正有发言权的,是你对问题的经验认识程度。人们为 了避免被人嘲笑主观判断的失误,而越来越选择了统计分析,实际上,他们并不清楚,单纯用统计分析来做判断,才是最愚蠢的。只有主客观结合起来,才是相对科 学的,两者矛盾的时候,应该深入研究矛盾的根源,搞不清楚的话,我认为指标体系评价法要远比统计分析准确的多。而变量之所以能分布在不同的因子内,则是由 于其方差波动性大小和变量之间的相关性决定的,波动性越大,越排在前面的公因子中,各个公因子之间的变量是不相关的,而每个公因子之间的变量是相关的。因 子分析认为那些数据波动大的变量对对象影响作用更大,它们排在公因子的前列,这样单纯从数据逻辑来判断的准则你认为对吗?我想,如果管理和社会科学都这幺 认为的话,那错误将大大增加了。上面想法是我这两年做课题的体会,没有在任何一本书上看过相关说法,也许说的不对,这是我个人看法。如果让我选择的话,我 宁愿用指标体系评价法,体系几个维度事先就清楚,最多先用因子分析算算,看看数据波动性如何,到底能确定几个维度,只起辅助作用。研究者就是专家,指标体 系的维度由主观来做判断,这主要来自经验判断,而不是由数据判断,我认为其实更科学。当然,如果你对问题一无所知,那指标体系评价法用AHP来做的话,错 误很可能更多。我以前就强烈批判过AHP。说到底,没有一种评价方法是好的,说明问题就好。问题:那能对LISREL进行类似于因子分析的探索性因素分析了解吗?能给点评价么?3x答复:下面是探索性分析的原理:传统上所谈的因素分析)factor *** ysis)指的是探索性因素分析)exploratory factor *** ysis),它的目的是在承认有测量误差的情形下,尝试用少数的因素)factors)以解释许多变项间的相关关系。随着统计理论及电脑计算上的进展,目前因素分析的方法可分成探索性因素分析)exploratory factor *** ysis,EFA)及验证性因素分析)confirmatory factor *** ysis,CFA),这两类分析之间的差别在于研究者对研究变项间因素结构的了解程度不同。如果研究者对资料内所含的因素性质,结构及个数不是很 清楚,则可使用探索性因素分析试图找出能解释资料变项间相关关系的少数几个重要因素。若研究者从过去文献中的理论及自己的研究经验,而对资料间因素之数 目,结构有一定程度的了解及假设,则可使用验证性因素分析来验证该假设是否能解......>> 
  
   问题三:进行因子分析的前提条件是各变量之间应该怎么做  本来想给你截图的,可是传不上来,我就简单说一下哈。 
  首先你得进行一次预计算,选择菜单里分析――降维――因子分析,跳出主面板,把想分析的变量选到变量框里,然后点确定。这时候输出窗口里会只有一个或两个图表。其中有一个图表是主成分的方差贡献。这个图表里你要找到两个相邻的列(应该是第三列和第四列),其中前一个列指的是单个因子对方差的贡献率,后一个是因子累计贡献率。也就是说前一个列里边数值相加等于100,后一个列里边数值递增,最后一个等于100。假如前一个列里是60,30,10,那么后一列里就是60,90,100.两个列之间有一个和的关系。找到这两个列以后,你要找使得累计贡献率达到百分之八十的那个数。这个表的第一列是1,2,3,等等,它代表第几个因子,比如3指的那行就包括第三个因子的方差贡献率,累积到第三个因子的方差贡献率这两个数据。你要找到累计到达百分之八十的那个因子是第几个因子,然后就按提取几个因子进行计算。 
  通过预计算知道了提取几个因子之后,就开始正式计算。再次打开因子分析的主面板,在最右边一共有五个选项,分别是描述,抽取,旋转,得分,选项。这五个在预计算里边没有用,但是现在要用了。点继续。 
  点击描述,在对话框里选上初始变量分析,kmo统计量及bartlett球形检验这两个选项,(注意,kmo和bartlett是一个选项,选项名就是很长)这一步是用来判断变量是否适于进行因子分析的。 
  点击抽取,对话框里最上边的方法就选主成分,分析里选上相关性矩阵,输出选上未旋转的因子解和碎石图两个选项,抽取里选择因子的固定数目,在要提取的因子后边填上你预计算里算出的因子数目。点继续。 
  旋转里边选最大方差法,输出旋转解。继续。 
  得分里边选保存为变量,方法为回归,显示因子得分系数矩阵也要打上勾。继续。 
  确定。 
  然后就可以分析结果了。 
  先看kmo和bartlett的结果,kmo统计量越接近1,变量相关性越强,因子分析效果越好。通常0.7以上为一般,0.5以下不能接受,就是不适合做因子分析。bartlett检验从检验相关矩阵出发,如果p值,就是sig,比较小的话,一般认为小于0.05,当然越小越好,就适于因子分析。 
  如果这两个检验都合格的话,才可以去写因子模型。 
  为了便于描述,假设我们有两个因子f1,f2, 
  旋转变换后的因子载荷矩阵会告诉你每个变量用因子表示的系数。比如变量x1=系数1*f1+系数2*f2,变量2以此类推。 
  因子得分系数矩阵会告诉你每个因子里各变量占得权重,比如f1=系数1*x1+系数2*x2+。。。 
  根据这个我们就能算出因子得分了。 
  因为之前选择了将因子保存为新变量,所以spss会直接保存两个因子得分为两个新变量, 
  然后我们不是有一个公式吗 
  总得分=因子1的方差贡献率*因子1的得分+因子2的方差贡献率*因子2的得分+... 
  根据这个公式计算一下就可以了。 
  用spss或者Excel都可以。 
  希望能对你有帮助哦。 
  ppv课,大数据培训专家,最专业的大数据培训平台。为你提供最好的spss学习教程哦。 
  
   问题四:excel2003如何做因子分析  都不知道你所说的因子是指的那个因子,数据管理因子还是什么的,提问清楚些。别人也比较容易理解! 
  
   问题五:怎样用SPSS做因子分析  在表因子变量解释贡献率(Total Variance Explained)中,看各个主因子的方差贡献率(Initial Eigenvalues栏下的% of Variance),例如图中三个主因子对应的权重为52.132、21.017、11.405,测将三个权重进行归一化处理,52.132/(52.132+21.017+11.405)、21.017/(52.132+21.017+11.405)、11.405/(52.132+21.017+11.405),所得三个数即为主因子权重 
  
   问题六:怎样用spss做因子分析?  SPSS→分析→数据缩减→因子分析→选择自变量和因变量→描述里面选择KMO检验和球型检验;海转选择最大方差旋转法→确定→结果 
  
   问题七:如何利用因子分析的排名进行分析  你通过因子分析 中一个选项 保存因子得分,之后会在原数据最后保存生成3列因子得分,假设为a1 a2 a3 代表3个因子然后根据因子分析得出三个因子的特征根值,分别计算粗3个因子的权重,分别为各自的特征根值/三个因子特征根值之和. 然后综合因子得分=a1*对应权重+a2*对应权重+a3*对应权重之后就根据综合因子得分进行大小排名 就这样出来了 
  
   问题八:因子分析法需要哪些数据,用什么软件做  因子分析是用因子概括变量信息,所以首先自变量是什么?三年数据当然是一起录入,通过三年的变化来反映因变量的变化。

因子分析怎么做

2. 因子分析怎么做?

问题一:用SPSS已经做出了因子分析,那么具体的分析结果应该怎么看呢?  KMO检验统计量在0.7以上,说明变量之间的偏相关性较强,适合做因子分析,球形检验p小于0.001,说明变量之间存在相关性。第二格表格为共同性,表示各变量中所含原始信息能被提取的共同因子所表示的程度,根据你的数据,你提取的公因子是两个,第三个表格是指提取的俩个主成分能解福差异的比列,第四个表格是主成分表达式,第五表格是因子得分公式。 
  
   问题二:因子分析到底有什么用处?  问题:大家觉得因子分析到底有什幺用处呢?把原来很多个影响因素归纳成几个影响因子,如果不继续做回归或者聚类的话,光做因子分析有价值吗?答复:因子分析是将多个实测变量转换为少数几个综合指标(或称潜变量),它反映一种降维的思想。通过降维将相关性高的变量聚在一起,从而减少需要分析的变量的数量,而减少问题分析的复杂性。在你对问题系统结构不了解时候,因子分析可以根据数据内在逻辑性,把它归并成几个公因子,每个公因子分别代表空间的一个维度,如果经过正交或斜 交旋转的话,各个维度之间可以认为是不相关的,这些公因子能够相对完整地刻画对象的体系维度,最起码累计方差贡献率大于85%的话,就基本能够保证重要信 息不丢失了。一句话,你如果对研究对象到底应该分为几个维度不清楚的话,用因子分析可以通过数据内在逻辑告诉你。但如果你对研究对象体系比较清楚的话,那你直接确定维度,通过AHP计算出权重,就能够把系统表述清楚了。但这里面有巨大问题,单纯通过数据内 在逻辑来判断维度,常常是错误的,而主观判断其实更加科学,并非象统计学宣称的,数据说话才有发言权。真正有发言权的,是你对问题的经验认识程度。人们为 了避免被人嘲笑主观判断的失误,而越来越选择了统计分析,实际上,他们并不清楚,单纯用统计分析来做判断,才是最愚蠢的。只有主客观结合起来,才是相对科 学的,两者矛盾的时候,应该深入研究矛盾的根源,搞不清楚的话,我认为指标体系评价法要远比统计分析准确的多。而变量之所以能分布在不同的因子内,则是由 于其方差波动性大小和变量之间的相关性决定的,波动性越大,越排在前面的公因子中,各个公因子之间的变量是不相关的,而每个公因子之间的变量是相关的。因 子分析认为那些数据波动大的变量对对象影响作用更大,它们排在公因子的前列,这样单纯从数据逻辑来判断的准则你认为对吗?我想,如果管理和社会科学都这幺 认为的话,那错误将大大增加了。上面想法是我这两年做课题的体会,没有在任何一本书上看过相关说法,也许说的不对,这是我个人看法。如果让我选择的话,我 宁愿用指标体系评价法,体系几个维度事先就清楚,最多先用因子分析算算,看看数据波动性如何,到底能确定几个维度,只起辅助作用。研究者就是专家,指标体 系的维度由主观来做判断,这主要来自经验判断,而不是由数据判断,我认为其实更科学。当然,如果你对问题一无所知,那指标体系评价法用AHP来做的话,错 误很可能更多。我以前就强烈批判过AHP。说到底,没有一种评价方法是好的,说明问题就好。问题:那能对LISREL进行类似于因子分析的探索性因素分析了解吗?能给点评价么?3x答复:下面是探索性分析的原理:传统上所谈的因素分析)factor *** ysis)指的是探索性因素分析)exploratory factor *** ysis),它的目的是在承认有测量误差的情形下,尝试用少数的因素)factors)以解释许多变项间的相关关系。随着统计理论及电脑计算上的进展,目前因素分析的方法可分成探索性因素分析)exploratory factor *** ysis,EFA)及验证性因素分析)confirmatory factor *** ysis,CFA),这两类分析之间的差别在于研究者对研究变项间因素结构的了解程度不同。如果研究者对资料内所含的因素性质,结构及个数不是很 清楚,则可使用探索性因素分析试图找出能解释资料变项间相关关系的少数几个重要因素。若研究者从过去文献中的理论及自己的研究经验,而对资料间因素之数 目,结构有一定程度的了解及假设,则可使用验证性因素分析来验证该假设是否能解......>> 
  
   问题三:进行因子分析的前提条件是各变量之间应该怎么做  本来想给你截图的,可是传不上来,我就简单说一下哈。 
  首先你得进行一次预计算,选择菜单里分析――降维――因子分析,跳出主面板,把想分析的变量选到变量框里,然后点确定。这时候输出窗口里会只有一个或两个图表。其中有一个图表是主成分的方差贡献。这个图表里你要找到两个相邻的列(应该是第三列和第四列),其中前一个列指的是单个因子对方差的贡献率,后一个是因子累计贡献率。也就是说前一个列里边数值相加等于100,后一个列里边数值递增,最后一个等于100。假如前一个列里是60,30,10,那么后一列里就是60,90,100.两个列之间有一个和的关系。找到这两个列以后,你要找使得累计贡献率达到百分之八十的那个数。这个表的第一列是1,2,3,等等,它代表第几个因子,比如3指的那行就包括第三个因子的方差贡献率,累积到第三个因子的方差贡献率这两个数据。你要找到累计到达百分之八十的那个因子是第几个因子,然后就按提取几个因子进行计算。 
  通过预计算知道了提取几个因子之后,就开始正式计算。再次打开因子分析的主面板,在最右边一共有五个选项,分别是描述,抽取,旋转,得分,选项。这五个在预计算里边没有用,但是现在要用了。点继续。 
  点击描述,在对话框里选上初始变量分析,kmo统计量及bartlett球形检验这两个选项,(注意,kmo和bartlett是一个选项,选项名就是很长)这一步是用来判断变量是否适于进行因子分析的。 
  点击抽取,对话框里最上边的方法就选主成分,分析里选上相关性矩阵,输出选上未旋转的因子解和碎石图两个选项,抽取里选择因子的固定数目,在要提取的因子后边填上你预计算里算出的因子数目。点继续。 
  旋转里边选最大方差法,输出旋转解。继续。 
  得分里边选保存为变量,方法为回归,显示因子得分系数矩阵也要打上勾。继续。 
  确定。 
  然后就可以分析结果了。 
  先看kmo和bartlett的结果,kmo统计量越接近1,变量相关性越强,因子分析效果越好。通常0.7以上为一般,0.5以下不能接受,就是不适合做因子分析。bartlett检验从检验相关矩阵出发,如果p值,就是sig,比较小的话,一般认为小于0.05,当然越小越好,就适于因子分析。 
  如果这两个检验都合格的话,才可以去写因子模型。 
  为了便于描述,假设我们有两个因子f1,f2, 
  旋转变换后的因子载荷矩阵会告诉你每个变量用因子表示的系数。比如变量x1=系数1*f1+系数2*f2,变量2以此类推。 
  因子得分系数矩阵会告诉你每个因子里各变量占得权重,比如f1=系数1*x1+系数2*x2+。。。 
  根据这个我们就能算出因子得分了。 
  因为之前选择了将因子保存为新变量,所以spss会直接保存两个因子得分为两个新变量, 
  然后我们不是有一个公式吗 
  总得分=因子1的方差贡献率*因子1的得分+因子2的方差贡献率*因子2的得分+... 
  根据这个公式计算一下就可以了。 
  用spss或者Excel都可以。 
  希望能对你有帮助哦。 
  ppv课,大数据培训专家,最专业的大数据培训平台。为你提供最好的spss学习教程哦。 
  
   问题四:excel2003如何做因子分析  都不知道你所说的因子是指的那个因子,数据管理因子还是什么的,提问清楚些。别人也比较容易理解! 
  
   问题五:怎样用SPSS做因子分析  在表因子变量解释贡献率(Total Variance Explained)中,看各个主因子的方差贡献率(Initial Eigenvalues栏下的% of Variance),例如图中三个主因子对应的权重为52.132、21.017、11.405,测将三个权重进行归一化处理,52.132/(52.132+21.017+11.405)、21.017/(52.132+21.017+11.405)、11.405/(52.132+21.017+11.405),所得三个数即为主因子权重 
  
   问题六:怎样用spss做因子分析?  SPSS→分析→数据缩减→因子分析→选择自变量和因变量→描述里面选择KMO检验和球型检验;海转选择最大方差旋转法→确定→结果 
  
   问题七:如何利用因子分析的排名进行分析  你通过因子分析 中一个选项 保存因子得分,之后会在原数据最后保存生成3列因子得分,假设为a1 a2 a3 代表3个因子然后根据因子分析得出三个因子的特征根值,分别计算粗3个因子的权重,分别为各自的特征根值/三个因子特征根值之和. 然后综合因子得分=a1*对应权重+a2*对应权重+a3*对应权重之后就根据综合因子得分进行大小排名 就这样出来了 
  
   问题八:因子分析法需要哪些数据,用什么软件做  因子分析是用因子概括变量信息,所以首先自变量是什么?三年数据当然是一起录入,通过三年的变化来反映因变量的变化。

3. 因子分析

  数据简化 
    因子分析的用途 
    数学模型 
                                                                                                                                                                                                            用矩阵的方式表达 
                                            因子分析模型的性质 
    因子载荷矩阵中的统计特征 
                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            旋转因子的目的 
                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    回归方法 
                                                                                                                                                                                                            主成分分析与因子分析    主成分分析与因子分析有所不同,主成分分析仅仅是变量变换。
   主成分和公共因子的位置不同。因子分析也有因子载荷( factor loading)的概念,代表了因子和原先变量的相关系数。但是在因子分析公式中的因子载荷位置和主成分分析不同。   在数学模型上,因子分析和主成分分析也有不少区别。而且因子分析的计算也复杂得多。根据因子分析模型的特点,它还多一道程序:因子旋转( factor rotation);这个步骤可以使结果更好。   旋转后的公共因子一般没有主成分那么综合,公共因子往往可以找到实际意义,而主成分常找不到实际的含义。   可以看出,因子分析和主成分分析都依赖于原始变量,也只能反映原始变量的信息。所以原始变量的选择很重要。在得到分析的结果时,并不一定会都得到如我们例子那样清楚的结果。这与问题的性质,选取的原始变量以及数据的质量等都有关系。如果原始变量本质上独立,就很难把很多独立变量用少数综合的变量概括,降维就可能失败。数据越相关,降维效果就越好。可用如下方法进行变量间的相关性检验:

因子分析

4. 因子分析

探究某地区影响消费者消费水平的因子。
  
 共回收有效问卷1147份,数据量较为庞大。
  
 执行analyze/dimension reduction/factor;
  
 并选择KMO与巴特利球形检验;碎石图及相关的描述性统计,得到下列各图的结果。
                                          
 结果表明,KMO=0.61>0.6,显著性P=0.000<0.05,因此,因子模型的适应性良好,可用来做因子分析;
                                          
 实际上这里对整体数据的特征提取不是非常好,公因子方差系数一般低于0.8,证明信息量损失还是比较大的。不过大于0.7的数据还是可以用的。
                                          
 可以看到,总共分为7类,如果保证尽可能的信息损失,至少三个主成分因子的方差累积和应该为85%,就比较良好,目前看来只有62.12%,不过作为案例分析,是可以的。
  
 再来看一下上述提取过程的碎石图:
                                          
 接下来是关于成分提取的分析,主要提取了三个主成分,这里我们主要看转置后的主成分分析,如下图:
                                          
 上图说明:我们可以将家庭收入、学历归为一类;婚姻状况和年龄归为一类;城市和性别分为一类。其中职业未显示相应的数值,是因为其因子成分值小于0.5,这时候最好的处理方式是将其单独归为一类主成分因子。
  
 接下来,我们可以再看一下新得到的数据
                                          
 序号为1的这个被调研对象的家庭收入、学历一般,但是婚姻状况和年龄还可以,所在的城市和人口性别比例也挺不错。
  
 以上就是因子分析的内容,若是看到的朋友觉得有什么疑问或者不正确的地方,欢迎批评指正,这是在熊一炎老师的帮助下进行的简单的分析。

5. 因子分析

在分析处理多变量问题时,变量间往往相关极为密切,使得观测数据所反映的信息有重叠。为了从多个变量中选择与铝土矿成矿密切相关的指标,本书对铝土矿各相关成矿要素进行因子分析,以达到简化变量的目的。
(1)A组数据
表11.3中前3个主成分的累计方差贡献率为81.940%,虽然没有达到85%,但第四个主成分的特征根小于1。因此,按照主成分的选择要求,选择3个主成分比较合适。
表11.3 主成分的方差贡献率和累计方差贡献率


表11.4 旋转后的因子载荷矩阵


从因子载荷矩阵(表11.4)和因子载荷图(图11.1)看,第一个主成分主要解释了矿层均厚、w(Al2O3)、w(SiO2)和铝硅比值等4个变量,这个主成分反映了对铝土矿有利的沉积-成矿环境,即沉积盆地持续稳定的沉积-成矿环境,使矿层不断加厚,Al2O3不断富集,SiO2不断贫化,A/S不断增加;第二个主成分主要解释了w(Fe2O3)和w(TiO2)这2个变量,可能反映了铝土矿成矿物质来源和表生作用对铝土矿成矿的影响;而第三个主成分只解释了矿系厚度一个变量,这个可能主要与含矿岩系沉积在灰岩风化面之上有关,反映了地形起伏对铝土矿成矿作用的影响。

图11.1 正交旋转因子载荷图

(2)B组数据
表11.5中前3个主成分的累计方差贡献率为77.450%,虽然没有达到85%,但第四个主成分的特征根小于1。因此,按照主成分的选择要求,选择3个主成分比较合适。
从因子载荷矩阵(表11.6)和因子载荷图(图11.2)看,第一个主成分主要解释了w(SiO2)和铝硅比值两个变量,含有部分矿层均厚和w(Al2O3),这个主成分反映了对铝土矿有利的沉积-成矿环境,随着SiO2不断贫化,铝硅比值不断增加,矿层均厚和w(Al2O3)则说明沉积盆地持续稳定的沉积-成矿环境,使矿层不断加厚,Al2O3不断富集;第二个主成分主要解释了w(Al2O3)、w(Fe2O3)和w(TiO2)这3个变量,可能反映了铝土矿成矿物质来源和表生作用对铝土矿成矿的影响,同时说明Al的富集伴随着Fe的流失;而第三个主成分解释了矿层均厚和w(TS)两个变量,含有部分w(Al2O3)、w(Fe2O3)和w(TiO2),这个可能主要反映了表生作用对各组分的普遍影响。
表11.5 主成分的方差贡献率和累计方差贡献率


表11.6 旋转后的因子载荷矩阵



图11.2 正交旋转因子载荷图

从因子分析的结果看,可以选择w(Al2O3)、铝硅比值和矿层厚度这三个连续变量进行定位预测。

因子分析

6. 因子分析的介绍

因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。

7. 因子分析法的介绍

因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子,以较少的几个因子反映原资料的大部分信息。运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力。运用这种研究技术,我们还可以为市场细分做前期分析。

因子分析法的介绍

8. 因子分析法的分析步骤

因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。(i)因子分析常常有以下四个基本步骤:⑴确认待分析的原变量是否适合作因子分析。⑵构造因子变量。⑶利用旋转方法使因子变量更具有可解释性。⑷计算因子变量得分。(ii)因子分析的计算过程:⑴将原始数据标准化,以消除变量间在数量级和量纲上的不同。⑵求标准化数据的相关矩阵;⑶求相关矩阵的特征值和特征向量;⑷计算方差贡献率与累积方差贡献率;⑸确定因子:设F1,F2,…, Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标;⑹因子旋转:若所得的m个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义。⑺用原指标的线性组合来求各因子得分:采用回归估计法,Bartlett估计法或Thomson估计法计算因子得分。⑻综合得分以各因子的方差贡献率为权,由各因子的线性组合得到综合评价指标函数。F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm )此处wi为旋转前或旋转后因子的方差贡献率。⑼得分排序:利用综合得分可以得到得分名次。在采用多元统计分析技术进行数据处理、建立宏观或微观系统模型时,需要研究以下几个方面的问题:· 简化系统结构,探讨系统内核。可采用主成分分析、因子分析、对应分析等方法,在众多因素中找出各个变量最佳的子集合,从子集合所包含的信息描述多变量的系统结果及各个因子对系统的影响。“从树木看森林”,抓住主要矛盾,把握主要矛盾的主要方面,舍弃次要因素,以简化系统的结构,认识系统的内核。· 构造预测模型,进行预报控制。在自然和社会科学领域的科研与生产中,探索多变量系统运动的客观规律及其与外部环境的关系,进行预测预报,以实现对系统的最优控制,是应用多元统计分析技术的主要目的。在多元分析中,用于预报控制的模型有两大类。一类是预测预报模型,通常采用多元线性回归或逐步回归分析、判别分析、双重筛选逐步回归分析等建模技术。另一类是描述性模型,通常采用聚类分析的建模技术。· 进行数值分类,构造分类模式。在多变量系统的分析中,往往需要将系统性质相似的事物或现象归为一类。以便找出它们之间的联系和内在规律性。过去许多研究多是按单因素进行定性处理,以致处理结果反映不出系统的总的特征。进行数值分类,构造分类模式一般采用聚类分析和判别分析技术。如何选择适当的方法来解决实际问题,需要对问题进行综合考虑。对一个问题可以综合运用多种统计方法进行分析。例如一个预报模型的建立,可先根据有关生物学、生态学原理,确定理论模型和试验设计;根据试验结果,收集试验资料;对资料进行初步提炼;然后应用统计分析方法(如相关分析、逐步回归分析、主成分分析等)研究各个变量之间的相关性,选择最佳的变量子集合;在此基础上构造预报模型,最后对模型进行诊断和优化处理,并应用于生产实际。