统计实验报告

统计实验报告

课程名称:        统计实验          

实验名称:        参数估计          

分组组长               

    专业班级:     

实验日期:    

 

 

第二篇:统计学上机实验

   

-----------------------MATLAB软件的简单熟悉-------------------------

一、实验目的

熟悉在MATLAB中数据的录入、保存和调用方法;

熟悉matlab中关于矩阵运算和函数运算的各种命令。

二、实验内容

1矩阵和数组的输入

>> A=[1 2 3;4 5 6];

>> linspace(0,1,9);

>> c=1:2:7;

2 矩阵的运算

>> a=[1 11 3 ;4 12 6 ]

>> A+a  

ans =

     2    13     6

     8    17    12

>> B=A-a

B =

     0    -9     0

     0    -7     0

>> A=[2 5 -3;3 6 -2;2 4 -3]

>> b=[3 1 4]'

>> X=A\b

X =

     1

    -1

    -2

3 矩阵的裁剪与拼接

从一个矩阵中取出若干行(列)构成新的矩阵称为裁剪,MATLAB中“:”是非常重要的裁剪工具,如

>> A(3,:)   (A的第三行)

>> A(:,2)    (A的第二列)

将几个矩阵接在一起,称为拼接,左右拼接行数要相同,上下拼接列数要相同,如

>> E=[A,b]

E =

     2     5    -3     3

     3     6    -2     1

     2     4    -3     4

>> F=[b;X]

4变量与函数

>> x=linspace(0,2*pi,30);

>> y=sin(x);

>> plot(x,y)

向量函数

>> a=[5     2     1    4     3]

>> b=min(a),c=sum(a),e=sort(a)

矩阵函数

>> w=zeros(2,3)

>> u=ones(3)

>> v=eye(3,4)

>> x=rand(1,3)

矩阵计算函数: >> a=[1 11 3 ;4 12 6 ;7 2 9]

>> d=det(a),r=rank(a),t=trace(a),e=eig(a)

5命令和环境窗口

在线帮助可以用命令   help  主题名 

例如:>> help sum

显示在当前工作区中的所有变量名:>> whos

清除当前工作区中的所有变量:>> clear

把变量储存在文件中:>> save 文件名

调出文件中的变量:>> load 文件名

   

------------------------------统计数据的描述性分析------------------------------

一、实验目的

熟悉在matlab中实现数据的统计描述方法,掌握基本统计命令:样本均值、样本中位数、样本标准差、样本方差、概率密度函数pdf、概率分布函数df、随机数生成rnd。

二、实验内容

1 、频数表和直方图

>> data=[93 88 75 76 75 86 66 90 78 65 67 86 81 53 94 82 76 79 54 63 58 69 85 96 76 85 92]

>> hist(data,5)       %得到数据的直方图%

>> [N,X]=hist(data,5)         %返回数组data的频数表。N返回k个小区间的频数,X返回k个小区间的中点%

N =

3     5     6     7     6

X =

57.3000   65.9000   74.5000   83.1000   91.7000

2基本统计量

作为研究杨树形状的一部分,测定20株杨树树叶,每个叶片测定了四个变量,下表第一列为叶片长度,第二列为叶片2/3处宽,第三列为叶片1/3处宽,第四列为叶片1/2处宽,计算数据的平均数、标准差、方差、极差及偏度和峰度。

x=

108    95   118   110

90    95   117   110

130    95   140   125

114    85   113   108

113    87   121   110

120    90   122   114

87    67    97    88

94    66    88    86

115    84   118   106

90    75   103    96

117    60    84    76

134    73   104    92

150    73   110    96

140    64    95    87

126    75    96    90

118    43    59    52

136    55    89    75

145    63     9    84

161    64   112    94

155    60   100    83

>> mean(x)       %返回x每列数据的均值%

ans =

122.1500   73.4500   99.7500   94.1000

>> median(x)      %返回x每列数据的中位数%

ans =

     119.0000   73.0000  103.5000   93.0000

>> std(x)          %返回x每列数据的标准差%

ans =

     21.9552   14.7165   27.5602   16.7266

>> var(x)          %返回x每列数据的方差%

ans =

     482.0289  216.5763  759.5658  279.7789

>> range(x)        %返回x每列数据的极差%

ans =

     74    52   131    73

>> skewness(x)     %返回x每列数据的偏度%

ans =

0.0064   -0.0529   -1.8406   -0.4302

>> kurtosis(x)      %返回x每列数据的峰度%

ans =

   2.1043    2.1965    7.1180    3.3503

3几个重要的概率分布

norm(正态分布)exp(指数分布)poiss(泊松分布)beta(B分布)

weib(威布尔) ,   chi2(卡方分布)t  (T分布 f  (F分布)

对每一种分布都提供了5类函数,其函数命令的字符是:

pdf(概率密度), cdf概率分布), inv逆概率分布),

 stat均值和方差), rnd(随机数生成)

当需要一种分布的某一类函数时,将以上所列的分布命令字符和函数命令的字符接起来,并输入自变量和参数就行了

1) 计算正态分布概率密度函数:

下面为N(0,1),N(0,4)命令:

x=-6:0.01:6;   

 y=normpdf(x);

 z=normpdf(x,0,2);

 plot(x,y,x,z)

下面为F(10,50)和F(10,5)命令

 

x=0:0.01:3;

y=fpdf(x,10,50);

z=fpdf(x,10,5);

plot(x,y,x,z)

gtext('F(10,50)')

gtext('F(10,5)')

下面为F(10,50)和F(10,5)命令

x=0:0.01:20;

 y=chi2pdf(x,5);

 z=chi2pdf(x,10);

plot(x,y,x,z)

gtext('chi2(5)')

gtext('chi2(10)')

2)计算正态分布的累积分布函数

求服从标准正态分布的样本值落在区间[-2,2]上的概率

>> normcdf(2)-normcdf(-2)

ans =

    0.9545

3)计算正态分布的逆累积分布函数

>> x=norminv(0.5,0,1)     %标准正态分布累积分布概率为0.5对应的点%

x =

     0

>>  x=norminv([0.025 0.975],0,1)   %包含95%的标准正态分布值的区间%

x =

   -1.9600    1.9600

4)二项分布均值和方差

>>  [m,v]=binostat(500,0.01)       % 试验500次,每次事件发生概率0.01,返回二项分布的均值m和方差v %

m =

     5

v =

    4.9500

5)生成服从正态分布的随机数

R=normrnd(70,25,1,30)

ans =

59.1859  28.3604  73.1333  77.1919   41.3382  99.7729  99.7291  69.0592

78.1823  74.3660  65.3323  88.1448  55.2921  124.5796  66.5901  72.8483

96.6692 71.4820  67.6088   49.1913  77.3603   36.5955   87.8581  110.5891

52.7056  91.4499 101.3500 30.1568   33.9759   84.2787

%生成均值u=70,方差v=25,30行1列的正态随机数组%

 

4、了解EXCEL的假设检验功能

EXCEL:工具 → 数据分析 → 描述统计

5、用EXCEL根据下列数据做出轮廓图,雷达图

折线图                                  雷达图

6、用MATLAB做出调和曲线图

7、做二元正态分布密度函数立体图

   

-------------------------------------------------------------

一、           实验目的

熟悉在 MATLAB中主成分分析命令,并会运用主成分分析方法解决问题。

二、  实验内容

题目:对全国30个省市自治区经济发展基本情况的八项指标作主成分分析 *数据见书上P163页*

1、由MATLAB提供的主成分分析函数

函数:princomp(X)

功能:主成分分析

语法:

[COEFF, SCORE] = princomp(X)

[COEFF, SCORE,latent] = princomp(X)

[COEFF, SCORE,latent,tsquare] = princomp(X)

    2、按主成分分析的计算步骤分步完成

三、实验步骤:

五、实验过程原始记录:

1、由MATLAB提供的主成分分析函数

i)、对原始数据进行标准化

>>A=[1394.89 2502 519.01 8144 373.9 117.3 112.6 843.43

    920.11 2720 345.46 6501 342.8 115.2 110.6 582.51

    2849.52 1258 704.87 4839 2033.3 115.2 115.8 1234.85

    1092.48 1250 290.9 4721 717.3 116.9 115.6 697.25

    832.88 1387 250.23 4134 781.7 117.5 116.8 419.39

    2793.37 2397 387.99 4911 1371.1 116.1 114 1840.55

    1129.2 1872 320.45 4430 497.4 115.2 114.2 762.47

    2014.53 2334 435.73 4145 824.8 116.1 114.3 1280.37

    2462.57 5343 996.48 9279 207.4 118.7 113 1642.95

    5155.25 1926 1434.95 5943 1025.5 115.8 114.3 2026.64

    3524.79 2249 1006.39 6619 754.4 116.6 113.5 916.59

    2003.58 1254 474 4609 908.3 114.8 112.7 824.14

    2160.52 2320 553.97 5857 609.3 115.2 114.4 433.67

    1205.11 1182 282.84 4211 411.7 116.9 115.9 571.84

    5002.34 1527 1229.55 5145 1196.6 117.6 114.2 2207.69

    3002.74 1034 670.35 4344 1574.4 116.5 114.9 1367.92

    2391.42 1527 571.68 4685 849 120 116.6 1220.72

    2195.7 1408 422.61 4797 1011.8 119 115.5 843.83

    5381.72 2699 1639.83 8250 656.5 114 111.6 1396.35

    1606.15 1314 382.59 5105 556 118.4 116.4 554.97

    364.17 1814 198.35 5340 232.1 113.5 111.3 64.33

    3534 1261 822.54 4645 902.3 118.5 117 1431.81

    630.07 942 150.84 4475 301.1 121.4 117.2 324.72

    1206.68 1261 224 5149 310.4 121.3 118.1 716.65

    55.98 1110 17.87 7382 4.2 117.3 114.9 5.57

    1000.03 1208 300.27 4396 500.9 119 117 600.98

    553.35 1007 114.81 5493 507 119.8 116.5 468.79

    165.31 1445 47.76 5753 61.6 118 116.3 105.8

    169.75 1355 61.98 5079 121.8 117.1 115.3 114.4

834.57 1469 376.95 5348 339 119.7 116.7 428.76];

>>M=mean(A)                            %%求A矩阵的均值向量%%

>>I=[111 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 11 1]       %%生成一个30维的向量%%

>>X1=I’*M  

>>X2=A-X1                              %%将原始数据中心化%%

>>S1=std(A)                           %%求原始数据的标准差向量S1%%

>>s2=[1.4748 0 0 0 0 0 0 0

   0 0.8616 0 0 0 0 0 0

   0 0 0.4051 0 0 0 0 0

   0 0 0 1.3102 0 0 0 0

   0 0 0 0 0.4599 0 0 0

   0 0 0 0 0 0.0020 0 0

   0 0 0 0 0 0 0.0019 0

   0 0 0 0 0 0 0 0.5855]        %%生成由标准差构成的对角阵%%

>>x=x2*inv(s2)                       %%得到原始数据的标准化数据X%%

ii)、调用主成分分析函数princomp

>>[COEFF,SCORE,latent,tsquare]=princomp(x)

2、按主成分分析的计算步骤分步完成

i)、对原始数据进行标准化(同上)

ii)、建立相关系数矩阵R

>>R=corrcoef(x)

iii)、求相关系数矩阵R的特征值和特征向量

>>[p,r]=eig( R )

iv)求出各主成分及其贡献率

>>percent=100*r/sum(r)

>>xx=[x1,x2,x3,x4,x5,x6,x7,x8]

>>prin=p’*xx

相关推荐