620 likes | 741 Views
Uniform Design and its Application. 均勻設計及其應用. 中国数学会均匀设计分会. 1. 前言. 沐浴在改革开发的阳光下,神州大地生机盎然,新生事物层出不穷。在科教兴国建设四化的过程中,人们熟悉的那些传统的试验设计方法,已不能充分满足快节奏高效率的要求。新时期呼唤新思维¸新方法。 中国科学家巧妙的将“ 数论方法 ”和“ 统计试验设计 ”相结合,发明了一种全新的试验设计方法,这就是均匀设计法。 均匀设计法诞生於1978年。由中国著名数学家 方开泰 教授和 王元 院士合作共同发明。. 2. 3. 华罗庚. 王元. 4.
E N D
Uniform Design and its Application 均勻設計及其應用 中国数学会均匀设计分会 1
前言 沐浴在改革开发的阳光下,神州大地生机盎然,新生事物层出不穷。在科教兴国建设四化的过程中,人们熟悉的那些传统的试验设计方法,已不能充分满足快节奏高效率的要求。新时期呼唤新思维¸新方法。 中国科学家巧妙的将“数论方法”和“统计试验设计”相结合,发明了一种全新的试验设计方法,这就是均匀设计法。 均匀设计法诞生於1978年。由中国著名数学家方开泰教授和王元院士合作共同发明。 2
3 华罗庚 王元
均匀设计是一种试验设计方法。它可以用较少的试验次数,安排多因素、多水平的析因试 验,是在均匀性的度量下最好的析因试验设计方法。均匀设计也是仿真试验设计和稳健设计的重要方法。 5
Introductionto Uniform Design and its Application 均勻設計及其應用 入門(PPT) 策划:方开泰 执笔:王柱 6
- 1 - 均匀设计方法 使用方法 7
我们通过制药工业中的一个实例, 来看均匀设计表的使用方法。 例1.1:阿魏酸的制备 阿魏酸是某些药品的主要成分,在制备过程中,我们想增加其产量。 这就是说以阿魏酸的产量作为目标 Y。 8
经过分析研究,挑选出因素和试验区域,为 原料配比:1.0---3.4 吡啶总量:10----28 反应时间:0.5---3.5 确定了每个因素相应的水平数为7。如何安排试验呢? 全面交叉试验要N=73=343次,太多了。 建议使用均匀设计。 有现成的均匀设计表,提供使用。参见: “方开泰,均匀设计与均匀设计表,科学出版社(1994).” 之附表 1 也可以浏览如下网页 网络地址:http://www.math.hkbu.edu.hk/UniformDesing 9
第1步:将试验因素的水平列成下表: 表 1.1.1: 10
第2步:选择相应的均匀设计表. 每个均匀设计表有一个记号,它有如下的含义: 因素的最大数 均匀设计 Un(qs) 试验次数 水平数 11
12 例如: 表 1.1.3: 表 1.1.2:
13 每个表还有一个使用表,将建议我们如何选择适当的列。其中‘偏差’为均匀性的度量值,数值小的设计表示均匀性好。例如U7 (74)的使用表为, 表1.1.2: 表 1.1.4:
第3步:应用选择的UD-表, 做出试验安排。 表 1.1.5: 1. 将x1, x2和x3放入列1,2和3. x1 x2 x3 2.用x1的7个水平替代第一列的1到 7. 1.0 1.4 1.8 2.2 2.6 3.0 3.4 13 1.5 19 3.0 25 1.0 10 2.5 16 0.5 22 2.0 28 3.5 3. 对第二列,第三列做同样 的替代. 4. 完成该设计对应的试验,得到7个结果,将其放入最后一列. 14
第 4步:用回归模型匹配数据 首先,考虑线性回归模型: 使用回归分析中变量筛选的方法,比如‘向后法’,得到推荐的模型为: 这个结果与人们的经验不符。 15
然后,我们尝试用二次回归模型来匹配这些数据:然后,我们尝试用二次回归模型来匹配这些数据: 使用‘向前’的变量选择法,我们发现适宜的模型: 表 1.1.6: 方差分析(ANOVA)表 16
17 模型 中的三项,在 5%的水平下都是显著的。 图1.1.1: 状态是正常的,所以模型(1.1.4)是可接受的。
18 图 1.1.2a 匹配图 图 1.1.2b 正态Q-Q 图 图 1.1.2c偏回归图
19 第5步:优化 -- 寻找最佳的因素水平组合 表1.1.5的设计是73=343个全面试验的部分实施,其中最好的试验点是值为Y= 48.2%的 #7。它不一定是全局最好的。人们想找到满足下式的x1*和x3* : 这里求取max的区域为:
20 图 1.1.3 等值线图 (x1*,x3*) x1x3的回归系数是正的,x3的回归系数也是正的, x1* = 3.4. 在x3* = 2.7575达到最大值。 在x1* = 3.4和x3* = 2.7575处估计响应的最大值是51.85% 。它比7个试验点的最好值48.2%还大。
讨论: 因素x2没有给响应Y予显著的贡献,我们可以选 x2为 其中点 x2 = 19 ml. 求出的x1* = 3.4 在边界上, 我们需要扩大 x1的试验上限。 在x1 = 3.4和x3 = 2.7575的邻域,追加一些试验是必要的。 在第5步,一些优化算法是很有用的。 21
22 混合型水平的均匀设计 试验中各因素若有不同水平数,比如,其水平数分别为q1,…,qk。 这时应使用相应的均匀设计表。见 “方开泰,均匀设计与均匀设计表,科学出版(1994).” 之附表2
23 每个混合水平表有一个记号,含义为: 定量因素 的最大数 均匀设计 Un(q1 × … × qk ) 各定量因素 之水平数 试验次数
24 下表是一个混合水平均匀设计表: 它的试验数n为 12。可以安排水平数为6、4、3的因素各一个。
U12(624) 它的试验数n为 12。可以安排二个6水平因素和一个4水平因素的设计。 此表也是混合水平均匀设计表。 25
- 2 - 混合因素试验 使用方法 26
考虑4个因素: 平均施肥量X,分为12个水平(70,74,78,82,86,90,94,98,102,106,110,114)。 种子播种前浸种时间T,分为6个水平(1,2,3,4,5,6)。 土壤类型B,分4种B1,B2,B3,B4。 种子品种A,分3个A1,A2,A3。 对某农作物产量的影响, 前两个为定量因素,后两个为定性因素。 27 例2 .1:在农业试验中 如何安排试验,引出了下面的内容。
28 混合型因素混合型水平的均匀设计 一般情况下试验中既有定量型连续变化因素,又有定性型状态变化因素。 假设有k个定量因素X1,…,Xk; 这k个因素可化为k个连续变量, 其水平数分别为q1,…,qk。 又有t个定性因素G1,…,Gt, 这t个定性因素分别有d1,…,dt个状态。 人们使用“拟水平法”,或用优化方法计算,求出相应的均匀设计表。
29 这种混合因素混合水平表有如下的记号和含义: 定性因素 的最大数 定量因素 的最大数 均匀设计 Un(q1× … × qk × d1 × …× dt ) 各定性因素 之水平数 各定量因素 之水平数 试验次数
U12(12×6×4×32 ×22) 例: 1 2 3 4 5 6 7 1 1 1 1 2 3 1 2 2 2 2 2 3 2 2 1 3 3 3 3 2 1 1 2 4 4 4 4 3 1 2 1 5 5 5 1 1 2 2 2 6 6 6 2 3 2 1 1 7 7 1 3 1 1 1 1 8 8 2 4 3 3 2 1 9 9 3 1 1 3 2 2 10 10 4 2 2 2 1 2 11 11 5 3 1 1 1 1 12 12 6 4 2 3 2 2 12次试验。 可以安排2个 水平数为12和 6的定量因素, 以及总数为5 的一个水平 为4、两个水 平为3和两个 水平为2的定 性因素的设计。 30
U12(12×6×4×3 ) 表2.1.1 我们选均匀设计表2.1.1安排此试验 第一列安排平均施肥量X,分为12个水平 第二列安排种子播种前浸种时间T,分为6个水平 第三列安排土壤类型B,分4种B1,B2,B3,B4。 第四列安排种子品种A,分3个A1,A2,A3。 31
为了进行分析,我们引进5个‘伪变量’。它们的记号和取值如下:为了进行分析,我们引进5个‘伪变量’。它们的记号和取值如下: B因素的 A因素的 它们和 X、T 一起进行回归分析。 回归方程如下: 33
34 + =
不显著。需进一步考虑高阶回归项。 若我们考虑除主效应外,再多考虑一个2次效应和一个交互效应。这时回归方程化为 35 解得 回归系数的最小二乘估计及其R和F值为:
= + 36
解得 37 回归系数的最小二乘估计及其R和F值为: 非常显著
方程为: 其中 1.含变量x 的两项与其它是分离的(即可加的),最大值点在 x=100.127 。 2.含变量z41z42的两项与其它是分离的,最大值点在 z41=0 z42=0,即品种3为好。 3.含变量 T z31z32 z33 的四项与其它是分离的,最大值点可能在 z31=1 z32=0 z33=0 类型为1,T=6 或z31=0 z32=1 z33=0 类型为2,T=6 比较后知道为后者。 38
所以得到最佳状态组合为 施肥量X=100.127, 浸种时间T=6, 土壤类型B取2, 种子品种A取3, 此时最大值估计为 39
40 一、表的选择,因素及水平的安排 下面综述应注意的事项: • 若试验中有k个定量因素和t个定性因素时,我们从混合型均匀设计表中选出带有s=k+t列的Un(q1×…×qk×d1×…×dt)表。 • 这里要求n≥k+d+1,其中d=(d1+…+dt -t). 为了给误差留下自由度,其中的n最好不取等号。 • 表中前k列对应k个连续变量, 表中后t列可安排定性因素。 安排n个试验,得到n个结果y1,y2,…,yn。
为了分析,首先要将定性因素之状态,依照伪变量法, 将第i个因素分别化成(di-1)个相对独立的n维伪变量Zi1,Zi2,…,Zi(di-1)。 • 将这总共d=(d1+…dt-t)个伪变量与相应的k个连续变量X1,…,Xk一起进行建模分析。 • 为了保证主效应不蜕化,要对混合型均匀设计表进行挑选。 41
二、试验结果的回归建模分析 首先考察它们的一阶回归模型: 如果不理想,则 再考虑一些交互效应,和一些连续变量的高次效应。显然最多可考虑的附加效应数为m个,这里m≤n-(k+d-2) 42
43 • 值得指出的是,由于Zij *Zij=Zij ,因此无需考虑伪变量的高阶效应,只考虑连续变量的高次效应即可. • 又因为Zij1*Zij2=0,j1≠j2时,因此也无需考虑同一状态因素内的伪变量间的交互效应。 • 只有i1≠i2时,才有可能使Zi1j1*Zi2j2≠0,即不同状态因素间的交互效应可能要考虑.。 • 此外,不要忘记考虑连续变量与伪变量的交互效应。 • 至于 三个以上的状态因素间 的交互效应项Zi1j1*Zi2j2*Zi3j3≠0的可能性就更少了。
- 3 - 混料配方试验 使用方法 44
混料配方均匀设计 许多产品都是混合多种成分在一起形成的。 色素 咖啡粉 钙 香料 乳酸 发酵粉 蔬菜汁 盐 椰子汁 糖 水 面粉 咖啡面包 45 怎样确定各种成分的比例呢? 混料试验 经验 试验
有s个因素: X1, , Xs满足 Xi 0, i = 1, , s和X1 + + Xs= 1. 试验区域为单纯形 Ts = {(x1, , xs): xi 0, i = 1, , s , x1 + + xs = 1.} 人们提出了许多混料设计方法,如 单纯形格子点设计 (Scheffe, 1958) . 单纯形重心设计(Scheffe, 1963) . 轴设计(Cornell, 1975) 46
47 例如, 成分数s = 3 单纯形格子点设计 单纯形重心设计 d 轴设计 这些设计的全面评价请参考: Cornell, J. A. (1990). Experiments with Mixtures: Designs, Models and the Analysis of Mixture Data. Wiley, New York.
48 上述设计的弱点: 许多点在Ts的边界上; 给用户设计的选择不多。 混料均匀设计 混料均匀设计是要寻找在Ts上均匀散布的试验点。 问题:怎样设计这些试验点呢? 变换方法
49 变换方法 给定s-1维单位立方体Cs-1上的均匀设计,且用 {Ck = (ck1, ,ck,s-1), k = 1, ,n} 表示。则进行下列必要的变换: (3.1.1) {xk = (xk1, ,xks), k = 1, ,n} 是Ts.上的均匀设计。
50 例3.1构造T3上带有11 个(配方)试验点的均匀设计。 假设我们选用U11(112) 和相关的Ck, k = 1, ,11: 变换公式 (4.1) 现在成为: (3.1.2)