试验设计及数据挖掘技术课程设计
一、均匀设计试验方案的构造(10/每小项,共20分)
已知一试验有四个因素,他们的试验范围及因素水平见表1:
表1、因素水平表
1、请给出12拟水平的因素水平表
2、请给出12拟水平的试验方案
二、回归分析建模(15分/每小项,共30分)
表2、试验方案及结果
表2为一个试验的试验方案及结果,请对表2的数据进行数据中心化的回归分析建模并对所得的回归方程进行F显著性检验,要求如下:
1、用一次项加交叉项的模型建模,如有不显著项须手动剔除之(请保留6个变量项),请拷贝手动剔除后的参数及方程,最后对方程及其系数进行F显著性检验。
一次模型加上交叉项模型:
Y=A0+A1*X1+A2*X2+A3*X3+A4*X4+A5*X5+A6*X1*X2+A7*X1*X3+A8*X1*X4+A9*X1*X5+A10*X2*X3+A11*X2*X4+A12*X2*X5+A13*X3*X4+A14*X3*X5+A15*X4*X5
参数:
N=16, M=10, B1=5, T2=1
> 回归分析结果:
I=1 B=3.89295774647887 F=39453.829110832
I=2 B=-9.50704225352109E-02 F=376.478873266637
I=3 B=5.02394366197183 F=65708.1591596774
I=4 B=-6.60140845070422 F=113449.605172517
I=5 B=2.83239436619718 F=83540.5277055669
I=8 B=-.754866310160428 F=56931.8445755423
I=10 B=-3.87700534759358E-02 F=2400.11415542456
I=12 B=9.54545454545455E-02 F=3904.68750028214
剔除F2
剔除后保留的6个变量项:
回归分析结果:
I=1 B=3.82584921292461 F=42.4793566222967
I=3 B=5.16561723280862 F=87.1202672010196
I=4 B=-6.45973487986744 F=136.239845488711
I=5 B=2.79884009942005 F=90.9365341824574
I=8 B=-.682283105022831 F=64.3454168594943
I=12 B=.143607305936073 F=16.2893368976606
BO=557.203196347032 F=73.3441801574753 R=.996608742535172 S=9.95102629716467 FO=1.54
J Y Y* Y-Y* A/%
1 527 520.371958854929 6.62804114507082 1.25769281690148
2 453 459.688956732606 -6.68895673260624 -1.47659089020005
3 481 484.602297102518 -3.60229710251843 -.748918316531899
4 462 452.668565786338 9.33143421366236 2.01979095533817
5 614 619.295396337196 -5.29539633719594 -.862442400194778
6 557 563.339306859151 -6.33930685915118 -1.13811613270219
7 682 676.098557501334 5.90144249866648 .865314149364587
8 562 561.575785089262 .424214910737533 7.54830802024079E-02
9 556 557.76766427196 -1.76766427196003 -.317925228769789
10 538 536.591511464705 1.40848853529451 .261800842991544
> 回归方程:
Y*=557.203196347032+(3.82584921292461)*(X1-25)+(5.16561723280862)*(X3-30)+(-6.45973487986744)*(X4-45)+(2.79884009942005)*(X5-140)+(-.682283105022831)*(X3-30)*(X4-45)+(.143607305936073)*(X1- 25)*(X5- 140)
II、对方程各项进行F检验
f1= 1, f2= M-2=10-2=8
F12=16.289>F1,8(0.01)= 11.3 ∴方程各项通过α=0.01的F检验。
III、对整个方程(或者总方程)进行F检验
f1=N*-1=6, f2=M-N*=10-6=4
F= 73.34 >F6,4(0.01)= 15.2,∴总的方程通过α=0.01的F检验。
3、二次全模型(一次项,二次项加上交叉项)建模,如有不显著须手动剔除之(请保留6个变量项),请拷贝手动剔除后的参数及方程,最后对方程其系数进行F显著性检验。
二次全模型(一次项,二次项加上交叉项)建模:
Y=A0+A1*X1+A2*X2+A3*X3+A4*X4+A5*X5+A6*X1^2+A7*X2^2+A8*X3^2+A9*X4^2+A10*X5^2+A11*X1*X2+A12*X1*X3+A13*X1*X4+A14*X1*X5+A15*X2*X3+A16*X2*X4+A17*X2*X5+A18*X3*X4+A19*X3*X5+A20*X4*X5
参数:
N=21, M=10, B1=5, T2=2
剔除后保留的6个变量项:
> 回归分析结果:
I=1 B=3.82584921292461 F=86.7697973506949
I=3 B=5.16561723280862 F=177.954859283416
I=4 B=-6.45973487986744 F=278.288202179139
I=5 B=2.79884009942005 F=185.750097699096
I=10 B=-.131901408450704 F=36.4010641102972
I=13 B=-1.20464788732394 F=151.811777236324
BO=581.62676056338 F=150.336666495772 R=.99834120225772 S=6.96261766428546 FO=1.54
J Y Y* Y-Y* A/%
1 527 520.756420878211 6.24357912178937 1.18473987130728
2 453 459.164871582436 -6.16487158243575 -1.3608988040697
3 481 482.907622203811 -1.90762220381117 -.396595052767395
4 462 456.721623860812 5.27837613918803 1.14250565783291
5 614 617.076636288318 -3.07663628831824 -.501080828716326
6 557 561.120546810273 -4.12054681027348 -.739775010821092
7 682 680.151615575808 1.8483844241922 .271024109119092
8 562 559.881110190555 2.11888980944468 .377026656484819
9 556 557.24357912179 -1.24357912178971 -.223665309674408
10 538 536.975973487987 1.02402651201317 .190339500374194
> 回归方程:
Y*=581.62676056338+(3.82584921292461)*(X1-25)+(5.16561723280862)*(X3-30)+(-6.45973487986744)*(X4-45)+(2.79884009942005)*(X5-140)+(-.131901408450704)*(X5-140)^2+(-1.20464788732394)*(X3- 30)*(X4- 45)
II、对方程各项进行F检验
f1= 1, f2= M-2=10-2=8
F10=36.40>F1,8(0.01)= 11.3 ∴方程各项通过α=0.01的F检验。
III、对整个方程(或者总方程)进行F检验
f1=N*-1= 6, f2=M-N*=10-6=4
F= 41.05093 >F6,4(0.01)= 15.2,∴总的方程通过α=0.01的F检验。
三、优化计算寻优(10分/每小项,其20分)
一个试验的试验范围及所得的数学模型(回归方程)如下:
Y = 90.7893-4.6267E-02*(X1- 30)-0.8373*(X2- 3)+ 5.2768E-05*(X3- 800)^2
-5.2094E-03*(X2- 3)*(X3- 800)
X1:20~40;X2:2.0~4.0;X3:700~900,实验得到的最大值为Y= 90.2
1、用网格优化法寻优求Y的最大值,给出相应的程序及优化结果
程序:
10 INPUT"ZM="; ZM
20 INPUT"G=";G
30 S1=(40-20)/G:S2=(4-2)/G:S3=(900-700)/G
40 FOR X1= 20 TO 40 + S1/2 STEP S1
50 FOR X2= 2TO 4 + S2/2 STEP S2
60 FOR X3= 700 TO 900 + S3/2 STEP S3
70 Y1= 90.7893-4.6267E-02*(X1- 30)-0.8373*(X2- 3)+ 5.2768E-05*(X3- 800)^2
80 Y2=( -5.2094E-03)*(X2- 3)*(X3- 800)
90 Y=Y1+Y2
100 IF Y< ZM THEN 140
110 IF Y>ZM THEN ZM =Y
120 PRINT TAB(1) "X1=";X1;TAB(16)"X2=";X2;TAB(31)"X3=";X3;
130 PRINT TAB(46) "Y=";ZM
140 NEXT X3,X2, X1
150 END
结果:
RUN
ZM=? 90.2
G=? 20
X1= 20 X2= 2 X3= 700 Y= 92.09601
X1= 20 X2= 2 X3= 810 Y= 92.14664
X1= 20 X2= 2 X3= 820 Y= 92.21457
X1= 20 X2= 2 X3= 830 Y= 92.29304
X1= 20 X2= 2 X3= 840 Y= 92.38208
X1= 20 X2= 2 X3= 850 Y= 92.48166
X1= 20 X2= 2 X3= 860 Y= 92.5918
X1= 20 X2= 2 X3= 870 Y= 92.71249
X1= 20 X2= 2 X3= 880 Y= 92.84374
X1= 20 X2= 2 X3= 890 Y= 92.98554
X1= 20 X2= 2 X3= 900 Y= 93.13789
2、用蒙特卡罗优化法寻优求Y的最大值,给出相应的程序及优化结果
程序:
10 INPUT"ZM="; ZM
20 INPUT"N=";N
30 G=20*N
35 S1=(40-20)/N:S2=(4-2)/N:S3=(900-700)/N
40 FOR I =1 TO G
50 A1=INT(N*RND(1))
60 A2=INT(N*RND(1))
70 A3=INT(N*RND(1))
90 X1= 20+ A1*S1
100 X2= 2 + A2*S2
110 X3= 700 + A3*S3
120 Y1= 90.7893-4.6267E-02*(X1- 30)-0.8373*(X2- 3)+ 5.2768E-05*(X3- 800)^2
130 Y2=( -5.2094E-03)*(X2- 3)*(X3- 800)
140 Y=Y1+Y2
150 IF Y< ZM THEN 190
160 IF Y>ZM THEN ZM =Y
170 PRINT TAB(1)"X1=";X1;TAB(16)"X2=";X2;TAB(31)"X3=";X3;
180 PRINT TAB(46)"Y=";ZM
190 NEXT I
200 PRINT TAB(1)"S1=";S1;TAB(16)"S2=";S2;TAB(32)"S3=";S3
210 END
结果:
RUN
ZM=? 90.2
N=? 2000
X1= 22.42 X2= 3.303 X3= 873.7 Y= 91.05659
X1= 29.8 X2= 2.909 X3= 721.4 Y= 91.16348
X1= 39.42 X2= 2.641 X3= 891.2 Y= 91.26351
X1= 28.51 X2= 2.11 X3= 853.6 Y= 92.00355
X1= 29.73 X2= 2.334 X3= 898 Y= 92.20621
X1= 21.98 X2= 2.214 X3= 879.5 Y= 92.47751
X1= 21.75 X2= 2.177 X3= 884.9 Y= 92.60446
X1= 22.48 X2= 2.103 X3= 888.6 Y= 92.71652
X1= 23.5 X2= 2.052 X3= 890 Y= 92.75568
X1= 22.59 X2= 2.06 X3= 892.6 Y= 92.82512
X1= 21.96 X2= 2.08 X3= 899.4 Y= 92.92936
X1= 23.26 X2= 2.03 X3= 899.1 Y= 92.93231
X1= 20 X2= 2.026 X3= 895.4 Y= 93.0318
X1= 20.47 X2= 2.033 X3= 898.5 Y= 93.04806
X1= 20.16 X2= 2.037 X3= 899.5 Y= 93.07246
S1= .01 S2= .001 S3= .1
四、配方均匀设计(7.5分/每小项,其15分)
1、一个饲料的配方由四种主要的成分组成,根据试验条件的允许和精度的要求,需要选择UM14(144)表来安排试验,请用相应的软件生成该配方试验方案表。
3750 DATA 1,2,3,4,5,6,7,8,9,10,11,12,13,14
3760 DATA 4,8,12,1,5,9,13,2,6,10,14,3,7,11
3770 DATA 7,14,6,13,5,12,4,11,3,10,2,9,1,8
结果:
RUN
N,S? 14,4
G1=1 RESTRICTED MUD ? G1=? 0
MU 14 ( 14 ^ 4 )
------------------------------------------------------------------
NO. X1 X2 X3 X4
------------------------------------------------------------------
1 .6706831 .1646584 8.820988E-02 7.644855E-02
2 .5250429 .1273241 1.241547E-02 .3352175
3 .4368761 5.274952E-02 .3098702 .2005042
4 .3700395 .5109092 1.275551E-02 .1062959
5 .3149933 .2966445 .2635316 .1248307
6 .2676059 .1617172 .1019066 .4687704
7 .2256658 4.265714E-02 .5487578 .1829193
8 .1878347 .5463218 6.646088E-02 .1993826
9 .1532336 .3160275 .4359642 9.477481E-02
10 .1212504 .1548758 .2326738 .4912001
11 9.143972E-02 1.637173E-02 .7965969 9.559164E-02
12 6.346667E-02 .5407758 .1554762 .2402814
13 3.707165E-02 .3068033 .6326921 2.343304E-02
14 1.204932E-02 .1323603 .3972384 .458352
------------------------------------------------------------------
2、一配方有三个成分,这三个成分的范围如下:
0.6≤X1≤0.86,0.10≤X2≤0.25,0.05≤X3≤0.16,X1 + X2 + X3 = 1
根据试验的要求,请26水平的均匀设计表去生成相应的试验方案表。
RUN
N,S? 26,3
G1=1 RESTRICTED MUD ? G1=? 1
MU 14 ( 14 ^ 3 )
---------------------------------------------------
NO. X1 X2 X3
---------------------------------------------------
1 .8037859 .1313416 6.487258E-02
2 .777964 .1294663 9.256974E-02
3 .7661197 .1807729 5.310744E-02
4 .754847 .1217908 .1233623
5 .7440704 .1757308 8.019886E-02
6 .7337295 .1093048 .1569657
7 .7237755 .1658301 .1103945
8 .7141679 .2258609 5.997118E-02
9 .704873 .151711 .143416
10 .6958619 .2140814 9.005668E-02
11 .6785969 .1984997 .1229034
12 .6622131 .1794701 .1583168
13 .6543123 .249294 9.639369E-02
14 .6390291 .2291667 .1318042
---------------------------------------------------
五、用方程绘图(7.5分/每小项,其15分)(图形要求打印出来)
已知有一试验的试验范围为:X1:1.0-4.0,X3:1.0-3.5,得到的方程及最佳参数如下
Y= 0.078 + 0.226*X3 - 0.168*X3^ 2 + 0.136*X1*X3
X1= 4 ; X3= 2.2903 时有最优值 Y= 0.9603
1、绘出反映Y与X3关系的曲线图
Y= 0.078 + 0.77*X3 - 0.168*X3^ 2
2、绘出Y分别为0.96,0.94,0.92,0.90, 0.88时的X1,X3交互作用的Y值等高线图
X1=(Y-0.078-0.226*X3+0.168*X3^2)/( 0.136*X3)
Y=0.96,0.94,0.92,0.90, 0.88
Y-0.078=0.882,0.862,0.842,0.822,0.802
ID3算法的改进摘要本文基于ID3算法的原有思路再把属性的重要性程度值纳入了属性选择的度量标准中以期获得更适合实际应用的分类划分结…
目录第1章数据挖掘基本理论211数据挖掘的产生212数据挖掘的概念313数据挖掘的步骤3第2章系统分析421系统用户分析422系统…
数据挖掘课程设计报告题目姓名班级学号关联规则挖掘系统xxxxxx计算机0901xxxxxxxxxxx20xx年6月19日1一设计目…
数据挖掘聚类问题PlantsDataSet实验报告1数据源描述11数据特征本实验用到的是关于植物信息的数据集其中包含了每一种植物种…
江西理工大学应用科学学院数据仓库与数据挖掘课程设计报告题目某超市数据集的OLAP分析及数据挖掘系别班级姓名二一二年六月目录一建立数…
目录第1章数据挖掘基本理论211数据挖掘的产生212数据挖掘的概念313数据挖掘的步骤3第2章系统分析421系统用户分析422系统…
ID3算法的改进摘要本文基于ID3算法的原有思路再把属性的重要性程度值纳入了属性选择的度量标准中以期获得更适合实际应用的分类划分结…
本科课程设计及实验期末成绩评估系统的数据仓库和数据挖掘设计课程名称数据挖掘课程编号08060116学生姓名cwl学号20xx052…
数据挖掘课程设计报告题目姓名班级学号关联规则挖掘系统xxxxxx计算机0901xxxxxxxxxxx20xx年6月19日1一设计目…
一设计目的1更深的了解关联规则挖掘的原理和算法2能将数据挖掘知识与计算机编程相结合编写出合理的程序3深入了解Apriori算法二设…
数据挖掘实验报告一实验名称有线电视服务销售CampR树二实验目的1学习和了解数据挖掘的基础知识学会使用SPSSClementine…