主成分分析和因子分析实验报告

主成分分析实验报告

一、实验数据

20##年,在国内外形势错综复杂的情况下,我国经济实现了平稳较快发展。全年国内生产总值568845亿元,比上年增长7.7%。其中第三产业增加值262204亿元,增长8.3%,其在国内生产总值中的占比达到了46.1%,首次超过第二产业。经济的快速发展也带来了就业的持续增加,年末全国就业人员76977万人,其中城镇就业人员38240万人,全年城镇新增就业1310万人。随着我国城镇化进程的不断加快,加之农业用地量的不断衰减,工业不断的转型升级,使得劳动力就业压力的缓解需要更多的依靠服务业的发展。

(一)指标选择

根据指标选择的可行性、针对性、科学性等原则,选择13个指标来衡量服务业的发展水平,指标体系如表1所示:

表1                         服务业发展水平指标体系

(二)指标数据

本次实验采用的数据是我国31个省(市、自治区)20##年的数据,原数据均来自《2013中国统计年鉴》以及20##年各省(市、自治区)统计年鉴,不能直接获得的指标数据是通过对相关原始数据的换算求得。原始数据如表2所示:

表2                   20##年各地区服务业发展水平统计数据表

表2(续)

二、实验步骤

本次实验是在SPSS中实现主成分分析,具体步骤如下:

(一)数据标准化,单击主菜单“Analyze”(分析)展开下拉菜单,在下拉菜单中寻找“Descriptive Statistics”,在小菜单中寻找“Descriptives”(描述),展开Descriptives对话框,将左面的矩形框中的变量X1、X2、…、X13,通过单击向右的箭头按钮,调入到右面的“Variables”(变量)框中。选中Save standardized values as variables(对变量进行标准化)复选框,点击OK按

(二)单击主菜单“Analyze”(分析)展开下拉菜单,在下拉菜单中寻找“Data Reduction”弹出小菜单,在小菜单中寻找“Factor”(因子),展开“Factor Analysis”(因子分析)主对话框。

(三)选择分析变量。将左面的矩形框中参与分析的标准化后的变量ZX1、ZX2、…、ZX13,通过单击向右的箭头按钮,调入到右面的“Variables”(变量)框中。

(四)因子分析过程选项,主对话框选择项中共有5个功能按钮:

1.单击【Descriptives】(描述统计量)按钮,展开“Descriptives”对话框,在Statistics中选中Univariate descriptive(单变量描述统计量)和Initial solution(初始因子分析结果),在Correlation Matrix中选择coefficients(相关系数矩阵)、Significance levels(显著性P值),KMO and Bartlett’s test of sphericity,点击Continue按钮。

2.在主对话框中,单击【Extraction】(因子提取)按钮,展开“Extraction”对话框,在Method中选择Principal components(主成分法),其他均为系统默认,点击Continue按钮。

3.在主对话框中,单击【Scores】(因子得分)按钮,展开“Scores”对话框,选中Save as variables(将因子得分作为新变量保存在数据文件中)复选框,单击Continue按钮。

(五)在主对话框中,单击【OK】按钮执行运算。

三、实验结果

(一)利用SPSS进行因子分析

输出结果表3至表4所示。

表3中Total列为各因子对应的特征根,本实验中共提取4各公因子;% of Variance列为各因子的方差贡献率;Cumulative %列为各因子累积方差贡献率,由表中可以看出,前四个因子已经可以解释88.341%的方差。

(二)利用因子分析结果进行主成分分析

1.将表4中因子载荷阵中的数据输入SPSS数据编辑窗口,分别命名为a1、a2、a3和a4。

2.为了计算第一个特征向量,点击菜单项中的Transform-Compute,调出Compute variable对话框,在对话框中输入等式:

z1=a1/SQRT(6.312)

点击OK按钮,即可在数据编辑窗口中得到以z1为变量名的第一特征向量。

然后以同样的方式,分别在对话框中输入等式:

z2=a2/SQRT(2.851)

z3=a3/SQRT(1.289)

z4=a4/SQRT(1.032)

得到以z2、z3、z4为变量名的第二、三、四特征向量。这样,可得到如表6所示的特征向量矩阵。

表5                              特征向量矩阵

根据表5可以得到主成分的表达式:

Y=0.220X+0.043X+0.308X+0.318X+0.388X+0.337X+0.369X+0.275X +0.365X+0.052X+0.075X+0.361X+0.074X

Y=0.453X+0.564X-0.193X-0.138X-0.034X-0.099X+0.001X-0.124X +0.062X-0.231X-0.121X+0.046X+0.566X

Y=0.080X+0.038X+0.047X-0.234X-0.151X+0.218X-0.005X+0.361X -0.159X-0.367X+0.745X-0.140X+0.004X

Y=0.187X-0.042X-0.025X-0.376X-0.045X-0.153X+0.276X-0.116X +0.073X+0.756X+0.340X-0.032X+0.112X

再以特征根为权,对4个主成分进行加权综合,得出各地区的综合得分,具体数据见表6。

综合得分的计算公式是

Y=Y+Y+Y+Y

根据上式可以计算出各地区的综合得分,并可据此排序。

表6                         各地区主成分得分及排序

从表6可以看出,上海市的综合评价排在第一,原始数据也反映出其存在明显的规模优势,另外从第一个主成分看,上海市也排在第一位,同样存在效益优势;而排在最后三位的分别是西藏、甘肃、青海。

因子分析实验报告

本次实验采用的是20##年反映我国31个省(直辖市、自治区)服务业发展水平的14个指标(数据见主成分分析报告表2)。14个指标分别为:服务业增加值(X1)、服务业就业人数(X2)、服务业产值比重(X3)、服务业就业比重(X4)、人均服务产品占有量(X5)、服务密度(X6)、服务综合生产率(X7)、服务业贡献率(X8)、人均GDP(X9)、服务业增长速度(X10)、工业化水平(X11)、城市化水平(X12)、服务业全社会固定资产投资(X13).这些指标之间有很强的相关性,如果利用所有14个指标对31个省(直辖市、自治区)进行服务业发展水平分析,难免会出现信息的重叠,而利用因子分析可以解决这个问题。

一、实验步骤

本次实验是在SPSS中实现主成分分析,具体步骤如下:

(一)定义变量及标签 。

(二)输入数据,建立数据文件。

(三)数据标准化,单击主菜单“Analyze”(分析)展开下拉菜单,在下拉菜单中寻找“Descriptive Statistics”,在小菜单中寻找“Descriptives”(描述),展开Descriptives对话框,将左面的矩形框中的变量X1、X2、…、X13,通过单击向右的箭头按钮,调入到右面的“Variables”(变量)框中。选中Save standardized values as variables(对变量进行标准化)复选框,点击OK按钮。

(四)单击主菜单“Analyze”(分析)展开下拉菜单,在下拉菜单中寻找“Data Reduction”弹出小菜单,在小菜单中寻找“Factor”(因子),展开“Factor Analysis”(因子分析)主对话框。

(五)选择分析变量。将左面的矩形框中参与分析的标准化后的变量ZX1、ZX2、…、ZX13,通过单击向右的箭头按钮,调入到右面的“Variables”(变量)框中。

(六)因子分析过程选项,主对话框选择项中共有5个功能按钮:

1.单击【Descriptives】(描述统计量)按钮,展开“Descriptives”对话框,在Statistics中选中Univariate descriptive(单变量描述统计量)和Initial solution(初始因子分析结果),在Correlation Matrix中选择coefficients(相关系数矩阵)、Significance levels(显著性P值),点击Continue按钮。

2.在主对话框中,单击【Extraction】(因子提取)按钮,展开“Extraction”对话框,在Method中选择Principal components(主成分法),其他均为系统默认,点击Continue按钮。

3.在主对话框中,单击【Rotation】(旋转)按钮,展开“Rotation”对话框,在Method(旋转方法)栏中选择Varimax(最大方差旋转项);在Display栏中选择要求的输出项,这里选择Rotated solution(输出旋转后的结果);在Maximum Iterations for Convergence(参数框中指定旋转收敛的最大迭代次数),这里选择系统默认值为25,点击Continue按钮。

4.在主对话框中,单击【Scores】(因子得分)按钮,展开“Scores”对话框,选中Save as variables(将因子得分作为新变量保存在数据文件中)复选框,在Method(方法)框中,选择计算因子得分的方法,这里选用Regression(回归法);选中Display factor score coefficient matrix(输出因子得分系数矩阵)复选框,单击Continue按钮。

5.在主对话框中单击【Options】输出的选择按钮,展开Options对话框,在Missing Value(缺失值)栏中,选择Exclude cases Listwise(有缺失值的观测量一律剔除),在Coefficent display format(选择因子载荷系数的输出方式)中选择Sorted by size(按绝对值大小排列),单击Continue按钮。

(七)在主对话框中,单击【OK】按钮执行运算。

二、实验结果

(一)实验结果输出

输出结果如表1至表7所示:

(二)实验结果解释

    1.表1中的KMO值为0.821,说明适合进行因子分析。

2.Communalities(给出变量共同度)。变量共同度反映了每个变量对所提取的所有公共因子的依赖程度,它描述了全部公共因子对变量的总方差所作的贡献。提取的因子个数不同,变量共同度也不同。从表2可以看出,各变量的共同度均较高,说明全部公共因子对变量的总方差所作的贡献较大,特殊因子的贡献较小。

3.Correlation Matrix(相关系数矩阵),从表3可以看出,变量间的相关系数大部分都大于0.3,说明各变量间大多是直接相关的,适合做因子分析。

4.Total Variance Explained(给出各公因子方差贡献表),从表4可以看出,Total列为各因子对应的特征值,本实验中共有4个因子对应的特征值大于1,因此应提取相应的4个公因子;% of Variance列为各因子的方差贡献率;Cumulative %列为各因子的累积方差贡献率,本实验中前四个因子已经可以解释88.341%的方差。Rotation Sums of Squared Loadings给出提取出的公因子经过旋转后的方差贡献情况。

5.Component Matrix(给出旋转前的因子载荷阵),根据表5可以写出每个原始变量的因子表达式:

X=0.553F+0.765F+0.0911F+0.190F

X=0.108F+0.952F+0.043F-0.043F

X=0.775F-0.326F+0.053F-0.025F

从表5还可以看出,每个因子在不同原始变量上的载荷没有明显的差别,为了便于对因子进行命名,需要对因子载荷阵进行旋转。

6. Rotated Component Matrix(旋转后因子载荷阵),从表6可以看出,经过旋转后的载荷系数已经明显地两级分化了。第一个公共因子在指标X3、X4、X5、X6、X7、X8、X9、X12上有较大的载荷,说明这8个指标有较强的相关性,可以归为一类,这8个指标属于服务业发展质量指标;第二个公共因子在指标在X1、X2、X13上有较大的载荷,同样可以归为一类,这三个指标属于服务业发展规模指标;同理,X11可以归为一类,这一指标属于服务业发展环境指标;X10可以归为一类,这一指标属于服务业发展潜力指标。

7. Component Score Coefficient Matrix(给出因子得分系数矩阵),根据表7中的因子得分系数和原始变量的标准化值可以计算每个观测值得各因子的得分数,并可以据此对观测量进行进一步的分析。本实验中旋转后的因子得分表达式可以写成:

F=-0.003X-0.037X+0.138X+0.226X+0.175X+0.145X+0.093X+0.103X +0.136X-0.055X-0.093X+0.153X-0.049X

F=0.315X+0.316X-0.086X-0.134X-0.001X-0.049X+0.085X-0.055X +0.074X+0.007X+0.033X+0.045X+0.349X

F=0.104X-0.033X+0.064X-0.292X-0.111X+0.148X+0.117X+0.273X -0.085X+0.003X+0.732X-0.106X-0.003X

F=0.094X-0.111X-0.007X-0.220X+0.031X-0.189X+0.257X-0.208X +0.127X+0.821X+0.049X+0.029X+0.038X

8.由于在Scores子对话框中选择了Save as variables复选框,因此,因子得分已经作为新的变量保存在数据文件中,变量名分别为fac1_1,fac2_1,fac3_1,fac4_1,将各因子整理得到表8,这里以特征根为权重,计算综合得分:

 F=F+F+F+F

表8                     各地区的4个因子得分表

 

第二篇:20xx实验报告-主成分分析

黑龙江八一农垦大学

多元统计分析实验报告

实验项目      主成分分析       

      信息与计算科学专业 

             20##         

                        

                       

黑龙江八一农垦大学文理学院数学实验室

学生实验守则

1、参加实验的学生必须按时到实验室上实验课,按指定的席位操作,不得迟到早退。迟到10分钟,禁止实验。

2、遵守实验室的一切规章制度,不喧哗,不吸烟,保持室内安静、整洁。

3、学生实验前要认真预习实验内容,接受指导教师的提问和检查。

4、严格遵守操作规程。

5、应认真记录原始数据,填写实验报告,及时送交实验报告。

6、不准动用与本实验无关的仪器设备和室内的其它设施。

7、实验中发生事故时,要保持镇静,并立即采取抢救措施,及时向指导教师报告。

8、损坏实验设备应主动向指导教师报告,由指导教师根据情况进行处理,需要赔偿的应写出书面报告,填写赔偿单。

9、实验结束,将实验结果交实验教师检查,合格后,经指导教师同意后,方可离开实验室。

10、实验完毕后,应按时写出实验报告,及时交指导教师审阅,不交者,该实验无成绩。


相关推荐