600 likes | 799 Views
Uniform Design and its Application. 第十一章 均勻设计及其应用. 注:资料来源于中国数学会均匀设计分会. 前 言. 沐浴在改革开发的阳光下,神州大地生机盎然,新生事物层出不穷。在科教兴国建设社会主义的过程中,人们所熟悉的那些传统的试验设计方法(如对比试验设计、全面试验设计、正交试验设计等),已不能充分满足快节奏高效率的要求。新时期呼唤新思维,新方法。 中国科学家巧妙的将“ 数论方法 ”和“ 统计试验设计 ”相结合,发明了一种全新的试验设计方法,这就是 均匀设计法 。
E N D
Uniform Design and its Application 第十一章 均勻设计及其应用 注:资料来源于中国数学会均匀设计分会
前 言 沐浴在改革开发的阳光下,神州大地生机盎然,新生事物层出不穷。在科教兴国建设社会主义的过程中,人们所熟悉的那些传统的试验设计方法(如对比试验设计、全面试验设计、正交试验设计等),已不能充分满足快节奏高效率的要求。新时期呼唤新思维,新方法。 中国科学家巧妙的将“数论方法”和“统计试验设计”相结合,发明了一种全新的试验设计方法,这就是均匀设计法。 均匀设计法诞生于1978年。由中国著名数学家方开泰教授和王元院士合作共同发明。
正交设计可使试验点“均匀分散、整齐可比”,为保证“整齐可比性”,使试验设计的均匀性受到了一定限制,使试验点的代表性还不够强,试验次数不能充分地少。正交设计可使试验点“均匀分散、整齐可比”,为保证“整齐可比性”,使试验设计的均匀性受到了一定限制,使试验点的代表性还不够强,试验次数不能充分地少。 均匀设计是另一种部分实施的试验设计方法。它可以用较少的试验次数,安排多因素、多水平的析因试 验,是在均匀性的度量下最好的析因试验设计方法。它可以使试验点在试验范围内充分地均匀分散,不仅可大大减少试验点,而且仍能得到反映试验体系主要特征的试验结果。
下面通过制药工业中的一个实例来说明均匀试验设计方法。下面通过制药工业中的一个实例来说明均匀试验设计方法。 例1.1:阿魏酸的制备 阿魏酸是某些药品的主要成分,在制备过程中,我们想提高阿魏酸产量。 根据试验目的,确定以阿魏酸产量作为试验指标Y。
经过资料查阅,分析研究,选出影响阿魏酸产量的试验因素,确定试验因素水平为:经过资料查阅,分析研究,选出影响阿魏酸产量的试验因素,确定试验因素水平为: 原料配比:1.0---3.4 吡啶总量:10----28 反应时间:0.5---3.5 确定每个因素相应的水平数为7。 如何安排试验? 全面交叉试验要N=73=343次,太多了。 建议使用均匀设计。查阅均匀设计表。 “方开泰,均匀设计与均匀设计表,科学出版社(1994)” 之附表 1 也可以浏览如下网页: 网络地址:http://www.math.hkbu.edu.hk/UniformDesing
第1步:列出试验因素水平表 表 1.1.1 试验因素水平表
第2步:选择相应的均匀设计表 均匀设计表格式见下,其含义为: 因素数 均匀设计 Un(qs) 试验总次数 因素水平数
例如: 表 1.1.3: 表 1.1.2:
每个均匀设计表都有一个使用表,它将建议我们如何选择适当的列安排试验因素,进行试验设计,这样可以减少“试验偏差”。其中‘偏差’为均匀性的度量值,数值小的设计表示均匀性好。例如U7 (74)的使用表为: 表1.1.2: 表 1.1.4:
第3步:应用选择的UD-表安排试验,设计试验方案第3步:应用选择的UD-表安排试验,设计试验方案 表 1.1.5: 试验方案 1. 将x1, x2和x3放入均匀设计表的1,2和3列; x1 x2 x3 2.用x1的7个水平(值)替代第一列的1到 7; 1.0 1.4 1.8 2.2 2.6 3.0 3.4 13 1.5 19 3.0 25 1.0 10 2.5 16 0.5 22 2.0 28 3.5 3. 对第二列,第三列做同样 的替代; 4. 按设计的方案进行试验,得到7个结果,将其放入最后一列。
第 4步:用回归模型匹配数据 首先,考虑线性回归模型: 使用回归分析中变量筛选的方法,比如‘向后法’,得到推荐的模型为: 这个结果与人们的经验不符。
然后,我们尝试用二次回归模型来匹配这些数据:然后,我们尝试用二次回归模型来匹配这些数据: 使用‘向前’的变量选择法,我们发现适宜的模型: 表 1.1.6: 方差分析(ANOVA)表 14
模型 中的三项,在 5%的水平下都是显著的。 图1.1.1: 状态是正常的,所以模型(1.1.4)是可接受的。
16 图 1.1.2a 匹配图 图 1.1.2b 正态Q-Q 图 图 1.1.2c偏回归图
第5步:优化 -- 寻找最佳的因素水平组合 表1.1.5的设计是73=343个全面试验的部分实施,其中最好的试验点是值为Y= 48.2%的 #7。它不一定是全局最好的。人们想找到满足下式的x1*和x3*: 这里求取max的区域为:
18 图 1.1.3 等值线图 (x1*,x3*) x1x3的回归系数是正的,x3的回归系数也是正的, x1* = 3.4。 在x3* = 2.7575达到最大值。 在x1* = 3.4和x3* = 2.7575处估计响应的最大值是51.85% 。它比7个试验点的最好值48.2%还大。
讨论: 因素x2没有给响应Y予显著的贡献,我们可以选x2为 其中点 x2 = 19 ml. 求出的x1* = 3.4 在边界上, 我们需要扩大x1的试验上限。 在x1 = 3.4和x3 = 2.7575的邻域,追加一些试验是必要的。 在第5步,一些优化算法是很有用的。
混合型水平的均匀设计 试验中各因素若有不同水平数,比如,其水平数分别为q1,…,qk。 这时应使用相应的混合均匀设计表。见 “方开泰,均匀设计与均匀设计表,科学出版(1994).” 之附表2
每个混合水平表有一个记号,含义为: 定量因素 的最大数 均匀设计 Un(q1 × … × qk ) 各定量因素 之水平数 试验次数
下表是一个混合水平均匀设计表: 此均匀设计表试验总数n为 12,用它可以安排水平数为6、4、3的因素各一个。
U12(624) 它的试验数n为 12。可以安排二个6水平因素和一个4水平因素的设计。 此表也是混合水平均匀设计表。 23
考虑4个因素: 平均施肥量X,分为12个水平 (70,74,78,82,86,90,94,98,102,106,110,114); 种子播种前浸种时间T,分为6个水平(1,2,3,4,5,6); 土壤类型B,分4种B1,B2,B3,B4; 种子品种A,分3个A1,A2,A3; 对某农作物产量的影响。可以看出前两个为定量因素,后两个为定性因素。 例2 .1:在农业试验中 如何进行试验安排?
混合型因素混合型水平的均匀设计 一般情况下试验中既有定量型连续变化因素,又有定性型状态变化因素。 假设有k个定量因素X1,…,Xk; 这k个因素可化为k个连续变量, 其水平数分别为q1,…,qk。 又有t个定性因素G1,…,Gt, 这t个定性因素分别有d1,…,dt个状态。 可以使用“拟水平法”,或用优化方法计算,求出相应的均匀设计表。
混合因素混合水平表有如下的记号和含义: 定性因素 的最大数 定量因素 的最大数 均匀设计 Un(q1× … × qk × d1 × …× dt ) 各定性因素 之水平数 各定量因素 之水平数 试验次数
U12(12×6×4×32 ×22) 例: 1 2 3 4 5 6 7 1 1 1 1 2 3 1 2 2 2 2 2 3 2 2 1 3 3 3 3 2 1 1 2 4 4 4 4 3 1 2 1 5 5 5 1 1 2 2 2 6 6 6 2 3 2 1 1 7 7 1 3 1 1 1 1 8 8 2 4 3 3 2 1 9 9 3 1 1 3 2 2 10 10 4 2 2 2 1 2 11 11 5 3 1 1 1 1 12 12 6 4 2 3 2 2 12次试验。 可以安排2个 水平数为12、 6的定量因素, 以及总数为5 的一个水平 为4、两个水 平为3和两个 水平为2的定 性因素的设计。
U12(12×6×4×3 ) 表2.1.1 选混合均匀设计表2.1.1安排此试验 第1列安排平均施肥量X,分为12个水平; 第2列安排种子播种前浸种时间T,分为6个水平; 第3列安排土壤类型B,分4种B1,B2,B3,B4; 第4列安排种子品种A,分3个A1,A2,A3。
为了进行分析,我们引进5个‘伪变量’。它们的记号和取值如下:为了进行分析,我们引进5个‘伪变量’。它们的记号和取值如下: B因素的 A因素的 它们和 X、T 一起进行回归分析。 回归方程如下:
+ =
不显著。需进一步考虑高阶回归项。 若我们考虑除主效应外,再多考虑一个2次效应和一个交互效应。这时回归方程化为 解得 回归系数的最小二乘估计及其R和F值为:
= +
解得 回归系数的最小二乘估计及其R和F值为: 非常显著
方程为: 其中 1.含变量x 的两项与其它是分离的(即可加的),最大值点在 x=100.127 。 2.含变量z41z42的两项与其它是分离的,最大值点在 z41=0 z42=0,即品种3为好。 3.含变量 T z31z32 z33 的四项与其它是分离的,最大值点可能在 z31=1 z32=0 z33=0 类型为1,T=6 或z31=0 z32=1 z33=0 类型为2,T=6 比较后知道为后者。
所以得到最佳状态组合为 施肥量X=100.127, 浸种时间T=6, 土壤类型B取2, 种子品种A取3, 此时最大值估计为
一、表的选择,因素及水平的安排 下面综述应注意的事项: • 若试验中有k个定量因素和t个定性因素时,我们从混合型均匀设计表中选出带有s=k+t列的Un(q1×…×qk×d1×…×dt)表。 • 这里要求n≥k+d+1,其中d=(d1+…+dt -t). 为了给误差留下自由度,其中的n最好不取等号。 • 表中前k列对应k个连续变量, 表中后t列可安排定性因素。 安排n个试验,得到n个结果y1,y2,…,yn。
为了分析,首先要将定性因素之状态,依照伪变量法,将第i个因素分别化成(di-1)个相对独立的n维伪变量Zi1,Zi2,…,Zi(di-1)。为了分析,首先要将定性因素之状态,依照伪变量法,将第i个因素分别化成(di-1)个相对独立的n维伪变量Zi1,Zi2,…,Zi(di-1)。 • 将这总共d=(d1+…dt-t)个伪变量与相应的k个连续变量X1,…,Xk一起进行建模分析。 • 为了保证主效应不蜕化,要对混合型均匀设计表进行挑选。
二、试验结果的回归建模分析 首先考察它们的一阶回归模型: 如果不理想,则 再考虑一些交互效应,和一些连续变量的高次效应。显然最多可考虑的附加效应数为m个,这里m≤n-(k+d-2)
值得指出的是,由于Zij *Zij=Zij ,因此无需考虑伪变量的高阶效应,只考虑连续变量的高次效应即可. • 又因为Zij1*Zij2=0,j1≠j2时,因此也无需考虑同一状态因素内的伪变量间的交互效应。 • 只有i1≠i2时,才有可能使Zi1j1*Zi2j2≠0,即不同状态因素间的交互效应可能要考虑.。 • 此外,不要忘记考虑连续变量与伪变量的交互效应。 • 至于 三个以上的状态因素间 的交互效应项Zi1j1*Zi2j2*Zi3j3≠0的可能性就更少了。
混料配方均匀设计 许多产品都是混合多种成分在一起形成的。 色素 咖啡粉 钙 香料 乳酸 发酵粉 蔬菜汁 盐 椰子汁 糖 水 面粉 咖啡面包 43 怎样确定各种成分的比例呢? 混料试验 经验 试验
有s个因素: X1, , Xs满足 Xi 0, i = 1, , s和X1 + + Xs= 1. 试验区域为单纯形 Ts = {(x1, , xs): xi 0, i = 1, , s , x1 + + xs = 1.} 人们提出了许多混料设计方法,如 单纯形格子点设计 (Scheffe, 1958) . 单纯形重心设计(Scheffe, 1963) . 轴设计(Cornell, 1975)
45 例如, 成分数s = 3 单纯形格子点设计 单纯形重心设计 d 轴设计 这些设计的全面评价请参考: Cornell, J. A. (1990). Experiments with Mixtures: Designs, Models and the Analysis of Mixture Data. Wiley, New York.
46 上述设计的弱点: 许多点在Ts的边界上; 给用户设计的选择不多。 混料均匀设计 混料均匀设计是要寻找在Ts上均匀散布的试验点。 问题:怎样设计这些试验点呢? 变换方法
47 变换方法 给定s-1维单位立方体Cs-1上的均匀设计,且用 {Ck = (ck1, ,ck,s-1), k = 1, ,n} 表示。则进行下列必要的变换: (3.1.1) {xk = (xk1, ,xks), k = 1, ,n} 是Ts.上的均匀设计。
48 例3.1构造T3上带有11 个(配方)试验点的均匀设计。 假设我们选用U11(112) 和相关的Ck, k = 1, ,11: 变换公式 (4.1) 现在成为: (3.1.2)
用这个变换公式, 正方形[0,1]2上的均匀设计Ck = (ck1, ck2), k = 1, ,11 导出T3上的均匀设计Xk = (xk1, xk2, xk3), k = 1, ,11 如下: 49
区域T3是一个边长为 的等边三角形,用 V2表示。 50 x3 1 T3 T3 d1 x1 x2 d2 x3 d3 1 1 x1 x2 因此,V2上任何点 (z1, z2) 都对应一个T3上的点(x1, x2, x3),如果我们像这样在V2上建立一个新坐标系统的话。 可以证明:V2上的任何点 (z1, z2) 到V2的三条边之距离 d1, d2和d3,满足d1+d2+d3 = 1.