数据挖掘课程设计

试验设计及数据挖掘技术课程设计

一、均匀设计试验方案的构造(10/每小项,共20分)

已知一试验有四个因素,他们的试验范围及因素水平见表1:

                          表1、因素水平表

1、请给出12拟水平的因素水平表

2、请给出12拟水平的试验方案

二、回归分析建模(15分/每小项,共30分)

表2、试验方案及结果

表2为一个试验的试验方案及结果,请对表2的数据进行数据中心化的回归分析建模并对所得的回归方程进行F显著性检验,要求如下:

1、用一次项加交叉项的模型建模,如有不显著项须手动剔除之(请保留6个变量项),请拷贝手动剔除后的参数及方程,最后对方程及其系数进行F显著性检验。

一次模型加上交叉项模型:

Y=A0+A1*X1+A2*X2+A3*X3+A4*X4+A5*X5+A6*X1*X2+A7*X1*X3+A8*X1*X4+A9*X1*X5+A10*X2*X3+A11*X2*X4+A12*X2*X5+A13*X3*X4+A14*X3*X5+A15*X4*X5

参数:

N=16,  M=10,   B1=5,    T2=1

> 回归分析结果:

I=1 B=3.89295774647887      F=39453.829110832

I=2 B=-9.50704225352109E-02    F=376.478873266637

I=3 B=5.02394366197183      F=65708.1591596774

I=4 B=-6.60140845070422     F=113449.605172517

I=5 B=2.83239436619718      F=83540.5277055669

I=8 B=-.754866310160428     F=56931.8445755423

I=10      B=-3.87700534759358E-02    F=2400.11415542456

I=12      B=9.54545454545455E-02     F=3904.68750028214

剔除F2

剔除后保留的6个变量项:

回归分析结果:

I=1 B=3.82584921292461      F=42.4793566222967

I=3 B=5.16561723280862      F=87.1202672010196

I=4 B=-6.45973487986744     F=136.239845488711

I=5 B=2.79884009942005      F=90.9365341824574

I=8 B=-.682283105022831     F=64.3454168594943

I=12      B=.143607305936073      F=16.2893368976606

BO=557.203196347032        F=73.3441801574753       R=.996608742535172      S=9.95102629716467   FO=1.54

J    Y           Y*                       Y-Y*                     A/%                     

1    527     520.371958854929         6.62804114507082         1.25769281690148        

2    453    459.688956732606         -6.68895673260624        -1.47659089020005       

3    481    484.602297102518         -3.60229710251843        -.748918316531899       

4    462     452.668565786338         9.33143421366236         2.01979095533817        

5    614     619.295396337196         -5.29539633719594        -.862442400194778       

6    557    563.339306859151         -6.33930685915118        -1.13811613270219       

7    682     676.098557501334         5.90144249866648         .865314149364587        

8    562  561.575785089262       .424214910737533         7.54830802024079E-02    

9    556      557.76766427196          -1.76766427196003        -.317925228769789       

10   538    536.591511464705         1.40848853529451         .261800842991544        

> 回归方程:

Y*=557.203196347032+(3.82584921292461)*(X1-25)+(5.16561723280862)*(X3-30)+(-6.45973487986744)*(X4-45)+(2.79884009942005)*(X5-140)+(-.682283105022831)*(X3-30)*(X4-45)+(.143607305936073)*(X1- 25)*(X5- 140)

II、对方程各项进行F检验

f1= 1, f2= M-2=10-2=8

F12=16.289>F1,8(0.01)= 11.3 ∴方程各项通过α=0.01的F检验。

III、对整个方程(或者总方程)进行F检验

f1=N*-1=6, f2=M-N*=10-6=4

  F= 73.34 >F6,4(0.01)= 15.2,∴总的方程通过α=0.01的F检验。

3、二次全模型(一次项,二次项加上交叉项)建模,如有不显著须手动剔除之(请保留6个变量项),请拷贝手动剔除后的参数及方程,最后对方程其系数进行F显著性检验。

二次全模型(一次项,二次项加上交叉项)建模:

Y=A0+A1*X1+A2*X2+A3*X3+A4*X4+A5*X5+A6*X1^2+A7*X2^2+A8*X3^2+A9*X4^2+A10*X5^2+A11*X1*X2+A12*X1*X3+A13*X1*X4+A14*X1*X5+A15*X2*X3+A16*X2*X4+A17*X2*X5+A18*X3*X4+A19*X3*X5+A20*X4*X5

参数:

N=21,  M=10,   B1=5,    T2=2

剔除后保留的6个变量项:

> 回归分析结果:

I=1 B=3.82584921292461      F=86.7697973506949

I=3 B=5.16561723280862      F=177.954859283416

I=4 B=-6.45973487986744     F=278.288202179139

I=5 B=2.79884009942005      F=185.750097699096

I=10      B=-.131901408450704     F=36.4010641102972

I=13      B=-1.20464788732394     F=151.811777236324

BO=581.62676056338     F=150.336666495772       R=.99834120225772 S=6.96261766428546       FO=1.54

J    Y           Y*                    Y-Y*                     A/%                     

1    527    520.756420878211         6.24357912178937         1.18473987130728        

2    453    459.164871582436         -6.16487158243575        -1.3608988040697        

3    481    482.907622203811         -1.90762220381117        -.396595052767395       

4    462    456.721623860812         5.27837613918803         1.14250565783291        

5    614    617.076636288318         -3.07663628831824        -.501080828716326       

6    557    561.120546810273         -4.12054681027348        -.739775010821092       

7    682    680.151615575808         1.8483844241922          .271024109119092        

8    562    559.881110190555         2.11888980944468         .377026656484819        

9    556     557.24357912179          -1.24357912178971        -.223665309674408       

10   538     536.975973487987         1.02402651201317         .190339500374194        

> 回归方程:

Y*=581.62676056338+(3.82584921292461)*(X1-25)+(5.16561723280862)*(X3-30)+(-6.45973487986744)*(X4-45)+(2.79884009942005)*(X5-140)+(-.131901408450704)*(X5-140)^2+(-1.20464788732394)*(X3- 30)*(X4- 45)

II、对方程各项进行F检验

f1= 1, f2= M-2=10-2=8

F10=36.40>F1,8(0.01)= 11.3 ∴方程各项通过α=0.01的F检验。

III、对整个方程(或者总方程)进行F检验

f1=N*-1= 6, f2=M-N*=10-6=4

  F= 41.05093 >F6,4(0.01)= 15.2,∴总的方程通过α=0.01的F检验。

三、优化计算寻优(10分/每小项,其20分)

  一个试验的试验范围及所得的数学模型(回归方程)如下:

Y = 90.7893-4.6267E-02*(X1- 30)-0.8373*(X2- 3)+ 5.2768E-05*(X3- 800)^2

-5.2094E-03*(X2- 3)*(X3- 800)      

X1:20~40;X2:2.0~4.0;X3:700~900,实验得到的最大值为Y= 90.2

1、用网格优化法寻优求Y的最大值,给出相应的程序及优化结果

程序:

10 INPUT"ZM="; ZM

20 INPUT"G=";G

30 S1=(40-20)/G:S2=(4-2)/G:S3=(900-700)/G

40 FOR X1= 20 TO 40 + S1/2  STEP S1

50 FOR X2= 2TO 4 + S2/2  STEP S2

60 FOR X3= 700 TO 900 + S3/2  STEP S3

70 Y1= 90.7893-4.6267E-02*(X1- 30)-0.8373*(X2- 3)+ 5.2768E-05*(X3- 800)^2

80 Y2=( -5.2094E-03)*(X2- 3)*(X3- 800)  

90 Y=Y1+Y2

100  IF Y< ZM THEN 140

110  IF Y>ZM THEN ZM =Y

120  PRINT TAB(1) "X1=";X1;TAB(16)"X2=";X2;TAB(31)"X3=";X3;

130  PRINT TAB(46) "Y=";ZM

140  NEXT  X3,X2, X1

150  END

结果:

RUN

ZM=? 90.2

G=? 20

X1= 20         X2= 2          X3= 700        Y= 92.09601

X1= 20         X2= 2          X3= 810        Y= 92.14664

X1= 20         X2= 2          X3= 820        Y= 92.21457

X1= 20         X2= 2          X3= 830        Y= 92.29304

X1= 20         X2= 2          X3= 840        Y= 92.38208

X1= 20         X2= 2          X3= 850        Y= 92.48166

X1= 20         X2= 2          X3= 860        Y= 92.5918

X1= 20         X2= 2          X3= 870        Y= 92.71249

X1= 20         X2= 2          X3= 880        Y= 92.84374

X1= 20         X2= 2          X3= 890        Y= 92.98554

X1= 20         X2= 2          X3= 900        Y= 93.13789

2、用蒙特卡罗优化法寻优求Y的最大值,给出相应的程序及优化结果

程序:

10 INPUT"ZM="; ZM       

20 INPUT"N=";N           

30 G=20*N

35 S1=(40-20)/N:S2=(4-2)/N:S3=(900-700)/N

40 FOR I =1 TO G

50 A1=INT(N*RND(1))    

60 A2=INT(N*RND(1))    

70 A3=INT(N*RND(1))

90  X1= 20+ A1*S1       

100 X2= 2 + A2*S2                     

110 X3= 700 + A3*S3       

120 Y1= 90.7893-4.6267E-02*(X1- 30)-0.8373*(X2- 3)+ 5.2768E-05*(X3- 800)^2

130 Y2=( -5.2094E-03)*(X2- 3)*(X3- 800)

140 Y=Y1+Y2

150 IF Y< ZM THEN 190

160 IF Y>ZM THEN ZM =Y

170 PRINT TAB(1)"X1=";X1;TAB(16)"X2=";X2;TAB(31)"X3=";X3;

180 PRINT TAB(46)"Y=";ZM

190 NEXT I

200  PRINT TAB(1)"S1=";S1;TAB(16)"S2=";S2;TAB(32)"S3=";S3

210 END

  结果:

 RUN

ZM=? 90.2

N=? 2000

X1= 22.42      X2= 3.303      X3= 873.7      Y= 91.05659

X1= 29.8       X2= 2.909      X3= 721.4      Y= 91.16348

X1= 39.42      X2= 2.641      X3= 891.2      Y= 91.26351

X1= 28.51      X2= 2.11       X3= 853.6      Y= 92.00355

X1= 29.73      X2= 2.334      X3= 898        Y= 92.20621

X1= 21.98      X2= 2.214      X3= 879.5      Y= 92.47751

X1= 21.75      X2= 2.177      X3= 884.9      Y= 92.60446

X1= 22.48      X2= 2.103      X3= 888.6      Y= 92.71652

X1= 23.5       X2= 2.052      X3= 890        Y= 92.75568

X1= 22.59      X2= 2.06       X3= 892.6      Y= 92.82512

X1= 21.96      X2= 2.08       X3= 899.4      Y= 92.92936

X1= 23.26      X2= 2.03       X3= 899.1      Y= 92.93231

X1= 20         X2= 2.026      X3= 895.4      Y= 93.0318

X1= 20.47      X2= 2.033      X3= 898.5      Y= 93.04806

X1= 20.16      X2= 2.037      X3= 899.5      Y= 93.07246

S1= .01        S2= .001        S3= .1

四、配方均匀设计(7.5分/每小项,其15分)

1、一个饲料的配方由四种主要的成分组成,根据试验条件的允许和精度的要求,需要选择UM14(144)表来安排试验,请用相应的软件生成该配方试验方案表。

3750   DATA   1,2,3,4,5,6,7,8,9,10,11,12,13,14

3760   DATA   4,8,12,1,5,9,13,2,6,10,14,3,7,11

3770   DATA   7,14,6,13,5,12,4,11,3,10,2,9,1,8

结果:

RUN

N,S? 14,4

G1=1 RESTRICTED MUD ? G1=? 0

            MU 14 ( 14 ^ 4 )

------------------------------------------------------------------

 NO.    X1             X2             X3             X4

------------------------------------------------------------------

  1    .6706831       .1646584       8.820988E-02   7.644855E-02

  2    .5250429       .1273241       1.241547E-02   .3352175

  3    .4368761       5.274952E-02   .3098702       .2005042

  4    .3700395       .5109092       1.275551E-02   .1062959

  5    .3149933       .2966445       .2635316       .1248307

  6    .2676059       .1617172       .1019066       .4687704

  7    .2256658       4.265714E-02   .5487578       .1829193

  8    .1878347       .5463218       6.646088E-02   .1993826

  9    .1532336       .3160275       .4359642       9.477481E-02

  10   .1212504       .1548758       .2326738       .4912001

  11   9.143972E-02   1.637173E-02   .7965969       9.559164E-02

  12   6.346667E-02   .5407758       .1554762       .2402814

  13   3.707165E-02   .3068033       .6326921       2.343304E-02

  14   1.204932E-02   .1323603       .3972384       .458352

------------------------------------------------------------------

2、一配方有三个成分,这三个成分的范围如下:

      0.6≤X1≤0.86,0.10≤X2≤0.25,0.05≤X3≤0.16,X1 + X2 + X3 = 1

  根据试验的要求,请26水平的均匀设计表去生成相应的试验方案表。

RUN

N,S? 26,3

G1=1 RESTRICTED MUD ? G1=? 1

            MU 14 ( 14 ^ 3 )

---------------------------------------------------

 NO.    X1             X2             X3

---------------------------------------------------

  1    .8037859       .1313416       6.487258E-02

  2    .777964        .1294663       9.256974E-02

  3    .7661197       .1807729       5.310744E-02

  4    .754847        .1217908       .1233623

  5    .7440704       .1757308       8.019886E-02

  6    .7337295       .1093048       .1569657

  7    .7237755       .1658301       .1103945

  8    .7141679       .2258609       5.997118E-02

  9    .704873        .151711        .143416

  10   .6958619       .2140814       9.005668E-02

  11   .6785969       .1984997       .1229034

  12   .6622131       .1794701       .1583168

  13   .6543123       .249294        9.639369E-02

  14   .6390291       .2291667       .1318042

---------------------------------------------------

五、用方程绘图(7.5分/每小项,其15分)(图形要求打印出来)

已知有一试验的试验范围为:X1:1.0-4.0,X3:1.0-3.5,得到的方程及最佳参数如下

Y= 0.078 + 0.226*X3 - 0.168*X3^ 2 + 0.136*X1*X3

X1= 4 ; X3= 2.2903 时有最优值 Y= 0.9603

1、绘出反映Y与X3关系的曲线图

Y= 0.078 + 0.77*X3 - 0.168*X3^ 2

2、绘出Y分别为0.96,0.94,0.92,0.90, 0.88时的X1,X3交互作用的Y值等高线图

X1=(Y-0.078-0.226*X3+0.168*X3^2)/( 0.136*X3)

Y=0.96,0.94,0.92,0.90, 0.88

Y-0.078=0.882,0.862,0.842,0.822,0.802

相关推荐