多元统计分析实验报告

《应用多元统计分析》

课 程 实 验 报 告

一、引言

数据说明

1999年财政部、国家经贸委、人事部和国家计委联合发布了《国有资本金绩效平价规则》。其中,竞争性工商业指标体系包括下面八大基本指标:净资产收益率、总资产报酬率、资产负债率、总资产周转率、流动资产周转率、已获利息倍数、销售增长率和资本累计率。所以我们借助这一指标体系对我国上市公司的运营情况进行分析,数据来自35家上市公司20##年年报数据,这35家上市公司分别来自电力、煤气及水的生产和供应业,房地产业,信息技术业。

二、数据分析

1.散点图分析

散点图可以很直观的看出两个变量之间的关系,所以为了大致了解这8个指标体系之间存在的关系,可以对35家公司的8个指标体系的数据做散点图,如图1所示。

图1  8个指标体系间的散点图

      

从图1中可以明显的看出净资产收益率与总资产收益率之间有近似的线性关系,而且也是显而易见,净资产收益率增加了则总资产收益率必然会增加。而其他的变量之间则基本看不出来有什么关系。

2.箱线图分析

箱线图是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有对称性,分布的分散程度等信息。还可以直观明了地识别出数据中的异常值。对数据做箱线图,如图2所示。

图2  8个指标体系的箱线图

从图中我们可以看到总资产周转率和流动资产周转率两个指标的箱线图由于过小而无法看清楚,是因为这两个指标的取值过小而引起的,我们可以将这两个取值相对较小的指标单独做一次箱线图,如图3所示。

图3 总资产周转率和流动资产周转率箱线图

从图2、图3我们就可以看出:

净资产收益率的数据还算比较集中,但是分布不是很均匀,还有1个温和的异常值;

总资产收益率的数据相对比较集中,有2个温和的异常值;

资产负债率的数据分布不是太集中,而且数据分布的也不均匀,可以看到中位数偏小,但没有异常值;

总资产周转率的数据不是很集中,分布也不均匀,有2个温和的异常值和1个极端异常值;

流动资产周转率的数据不是很集中,分布也不均匀,有2个温和的异常值;

已获利息倍数的数据分布不均匀,中位数偏小,有2个温和异常值;

销售增长率的数据分布相对来说比较均匀,且没有异常值;

资本积累率的数据分布很不均匀,中位数偏小,有2个温和的异常值和1个极端异常值。

3.正态性检验

       用SPSS对这8个指标进行正态性检验,得到数据表1。

表1 正态性检验

我们可以看到表中给出了两种检验方法的数据,一种是Kolmogorov Smirnov检验方法,另一种是Shapiro-Wilk检验方法。SPSS规定:当样本量时,结果以Shapiro-Wilk检验为准,当样本量时,结果以Kolmogorov Smirnov检验为准,因为这里的样本量,所以结果以Shapiro-Wilk检验为准。

的条件下,总资产周转率、流动资产周转率、已获利息倍数、资本累计率这4个指标的p值(Sig值)小于。也就是我们可以以的把握说净资产收益率、总资产报酬率、资产报酬率、销售增长率这4个指标的数据服从正态分布,而总资产周转率、流动资产周转率、已获利息倍数、资本累计率这4个指标的数据不服从正态分布。

我们也可以从指标数据的直方图中很直观的看出来是否服从正态分布,在这就以销售增长率、资本积累率这两个指标的直方图为例看一看,如图4、图5所示。

从图中我们可以看到销售增长率的直方图呈中间多、两头少,跟正态分布的曲线很接近,可以认为近似服从正态分布;而资本累计率的直方图我们可以看到跟正态分布的曲线完全没联系,就可以认为不服从正态分布。

图4 销售增长率的直方图

图5 资本积累率的直方图

4.描述性统计量

4.1均值向量

       通过均值向量可以了解到每个指标的平均取值情况,进一步了解这些企业的平均发展状况。在这我们了计算了信息技术行业当中的每个指标的平均值,如表2所示。

表2 信息技术行业的均值向量

       我们从表中的数据可以看到,信息技术行业中一共有9家公司,其每个指标的均值分别为:净资产收益率:13.3898%、总资产报酬率:8.7911%、资产负债率:46.89%、总资产周转率:89.11%、流动资产周转率:117.56%、已获利息倍数:8.4744、销售增长率:44.2956%、资本累计率:24.5311%;

其中流动资产周转率平均达到了117.56%,说明信息技术行业中的企业流动资产的周转速度是相当快的,而销售增长率也达到了44.2956%,说明信息技术行业中的企业的整体经营状况都很好,而且市场占有能力也很强。

4.2协差阵

       协方差用于衡量两个变量的总体误差,如果说两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值;如果两个变量的变化趋势相反,即其中一个变量大于自身的期望值,另外一个却小于自身的期望值,则这两个变量之间的协方差就是负值;若两个变量是相互独立的,则协方差就是0。

       表3中就计算了8个变量,每两个变量之间的的协方差,组成一个矩阵,称为协方差阵,简称协差阵。

表3 协差阵

       从表3 的数据中我们可以看到,协差阵就是一个对角矩阵,因为A、B的协方差和B、A的协方差显然是相等的。我们可以看到有3组指标之间的协方差是负的,分别是资产负债率和已获利息倍数、资产负债率和销售增长率、总资产周转率和已获利息倍数这3组指标之间的协方差,可以初步说明这3组指标变量之间的变化趋势是相反的。这也复合经济意义,负债率提高了,则获得的利息、销售额必然会减少。

4.3相关系数矩阵

相关系数是衡量两个变量之间相关程度的指标,样本相关系数用表示,其取值范围是值越大,说明变量之间的线性相关程度越高;值越小,说明变量之间的线性相关程度越低。其中:

 时称为正相关;时称为完全正相关;

 时称为负相关;时称为完全负相关;

完全正相关或负相关时,此两个变量间的散点图呈一条直线。一般来说,可以将相关程度分为以下几个等级:

时,认为高度相关;时,认为中度相关;

时,认为低度相关;时,认为相关程度极弱。

现将各指标之间的相关系数计算得到一个相关系数矩阵,如表4所示:

表4 相关系数矩阵

       从表4的数据我们可以看到,相关系数矩阵也是一个对角阵。其中有3组指标的相关系数为负值,说明这3组指标之间成负相关性,分别是资产负债率和已获利息倍数、资产负债率和销售增长率、总资产周转率和已获利息倍数这3组指标,这与协差阵里协方差为负值的3组指标是一样的,这就再一次确认了这3组指标之间的变化趋势的相反的。这一点可以从图1的散点图中得到证实。

为表示方便,现将净资本收益率、总资产报酬率、资产负债率、总资产周转率、流动资产周转率、已获利息倍数、销售增长率和资本累计率这8个指标分别表示为:,将各个指标间的相关程度进行分类:

5.各行业的均值向量、协差阵进行比较

       由于不同行业的企业规模、盈利等方面往往都不一样,现在就来看看不同行业的企业的8项指标的均值是否有差异。用SPSS求解得到表5。

表5 各行业均值向量的检验

从表中数据,我们可以看到对不同行业均值向量的检验的 Hotellings Trace的p值(Sig值)为远小于0.05,说明这3个行业中8项指标之间有显著的差异,我们可以求出这3个行业的各项指标的均值来得到证实,如表6所示:

表6 各行业各指标平均值

从表6的数据我们可以看到,各行业各指标的均值是有较大的差异,其中房地产行业的各项指标中除资产负债率外,其余指标均偏低。

       对各行业各指标数据的协差阵是否有显著差异进行检验,得到表7:

表7 各行业各指标协差阵的检验

       从表中的数据,我们看到p值(Sig值)远小于0.05,所以说这3个行业之间的各项指标的协差阵是有显著差异的。

三、结束语

      

本文主要利用SPSS和多元统计的方法,对上市的35家公司,涉及电力、煤气及水的生产和供应业,房地产业,信息技术业这3个行业,的运营情况进行了分析。主要是从净资产收益率、总资产报酬率、资产负债率、总资产周转率、流动资产周转率、已获利息倍数、销售增长率和资本累计率这8个指标进行了分析。通过分析我们得到:

1.      净资产收益率、总资产报酬率、资产报酬率、销售增长率这4个指标的数据服从正态分布;

2.      总资产周转率、流动资产周转率、已获利息倍数、资本累计率这4个指标的数据不服从正态分布;

3.      总资产周转率与流动资产周转率、净资产收益率与总资产报酬率之间存在着高度的线性关系;

4.      3个行业在8个指标方面的均值、协差阵都有显著的差异。其中房地产行业在除了在资产负债率这一指标均值最高外,其余7个指标在3个行业中都是最低的,而且和其他2个行业的差距较大。

存在的缺点:

没有处理异常值。在箱线图中我们看到:资本积累率、总资产周转率这两个指标各存在1个极端异常值,但是在后面的具体分析没有考虑到这一点,因为这两个极端异常值有可能会影响分析的结果。

没有对3个行业指标进行系统的分析,只是对数据做了简单的一些检验。

 

第二篇:20xx实验报告-聚类分析

黑龙江八一农垦大学

多元统计分析实验报告

实验项目       聚类分析       

     信息计算科学专业  

            2011       

                  

              

黑龙江八一农垦大学文理学院数学实验室

学生实验守则

1、参加实验的学生必须按时到实验室上实验课,按指定的席位操作,不得迟到早退。迟到10分钟,禁止实验。

2、遵守实验室的一切规章制度,不喧哗,不吸烟,保持室内安静、整洁。

3、学生实验前要认真预习实验内容,接受指导教师的提问和检查。

4、严格遵守操作规程。

5、应认真记录原始数据,填写实验报告,及时送交实验报告。

6、不准动用与本实验无关的仪器设备和室内的其它设施。

7、实验中发生事故时,要保持镇静,并立即采取抢救措施,及时向指导教师报告。

8、损坏实验设备应主动向指导教师报告,由指导教师根据情况进行处理,需要赔偿的应写出书面报告,填写赔偿单。

9、实验结束,将实验结果交实验教师检查,合格后,经指导教师同意后,方可离开实验室。

10、实验完毕后,应按时写出实验报告,及时交指导教师审阅,不交者,该实验无成绩。


相关推荐