E N D
从烹调咖啡、女士品茶谈起 王庚 南京财经大学统计系
20 世纪20年代后期的一个夏日午后,一群风度翩翩的学者偕漂亮的夫人及女友,正在英国剑桥的户外餐桌旁,悠闲地品茶论道。席间,一位美丽的女士说道:午茶的调制顺序对味道有很大影响,把茶加进牛奶里和把牛奶加进茶里,喝起来风味完全不同。出于对女性的尊重,那些学者们面带绅士的微笑,内心却不以为然,甚至是藐视,依据他们的科学头脑分析,茶和牛奶两种物质混合后的化学成份不会因为调制顺序不同而不同,怎么会喝起来不一样呢?在他们看来,这个命题的假定前提是不论调制顺序如何,牛奶和茶的比例是固定的或是基本不变的。美丽女士提出的问题有点类似朝四暮三和朝三暮四的关系。正当众学者对美丽女士的说法嗤之以鼻时,有个身材瘦小的、嘴上留着灰白胡子的绅士挺身而出,抓住了这个问题。
此人便是在统计发展史上地位显赫、大名鼎鼎的费雪(Ronald Aylmer Fisher,1890- 1962),伦敦人氏,英国统计学家。费雪显得非常兴奋,好像发现了大元宝。“让我们来检验这个命题。”说着,在众学者的帮助下,他开始进行实验。他们设计并调制出不同的茶,拿来怀子,有些先放茶水再加牛奶,有些先放牛奶再加茶水,然后按照既定的顺序一杯一杯拿给美丽女士品尝分辨,但她并不知道每杯茶的调法。费雪端给她第一杯茶,她尝了一口,然后说出这杯茶是先放茶水后加的牛奶,还是先放牛奶后加的茶水。费雪记录下她的说法, 再送上第二杯,……。
1857 年,奥地利统计学家孟德尔(Gregor Johann Mendel,1822-1884)不知为什么突然对豌豆情有独钟,非要把豌豆及遗传规律弄明白不可。他在教堂的后花园内一块不到2400 平方英尺的畦田上,对豌豆和与豌豆有关的属类进行了实验,一干就是八年。 孟德尔成功的诀窍之一就是在整个实验过程中,自始至终都运用着可贵的统计思想。孟德尔靠自己敏锐的直觉,无意中按照现代推断统计的初步原则,粗糙地进行了实验设计。也就是说,要设计一种较少规模的实验,既要保持植物天然杂交的程序,具有一定的代表性,又要尽量简化不必要的过程和减少偶然的随机干扰,便于观察研究。费雪在1936 年指出:孟德尔是在总结前人实验的基础上,已经从理论上预料到会出现什么样的数据,然后才去安排实验的,因而只需要不多的数据就得出完美的结果。但是孟德尔只是公布了能够证明结论的数据,而不是全部实验数据。1940 年,费雪检验了孟德尔公布的数据,发现这些数据完美得像真的,根本没有展现应有的随机程度。
在孟德尔之后,统计实验有了很大的发展,以剑桥学派首要人物贝特森(William Bateson,1861-1926)教授为首的遗传实验学派主张在实验中贯彻样本统计推断思想,以园田小样本实验为基本方法。他们认为没有一定实验设计在事先指导,就是把数据收集得再多,也难说是很充分的,说不定还可能是没有价值的。如果事先有了精心的实验设计,就不需要大样本,其结果也能够接近理论预测水平。可见,贝特森学派的统计实验已接近现代推断统计。 费雪凭天赋和勤奋,创立和完善了实验设计理论和方法。自1919 年起,费雪在卢桑姆斯坦德农业实验站工作了14 年,在实验活动中,他不断收集肥料、雨量、遗传、土质、细菌、收获量等资料。与孟德尔修道院的后花园的条件相比,实验的环境更不易控制。引起实验结果差异的因素主要有两个:一是在田间实验中,土质、光照等客观条件不同;二是实验方法不同。由于这两个因素往往同时起作用,因此,如何从总差异中分解出这两个因素各自的影响,以及如何测定它们,是费雪所面临的问题。经过多年的努力,自1923年费雪陆续发表了关于在农业实验中控制误差的论文,首次提出了方差分析、随机区组、拉丁方等控制、分解和测定实验误差的方法。这样,费雪的主要实验设计方法在20 至40 年代完成。
1935 年,费雪完成了在科学实验理论和方法上具有划时代意义的一本书《实验设计》。 费雪的成就引起了广泛关注,首先是农业科学家了解到实验设计的伟大价值。 不久,费雪的方法成为农业科技上的主流学派,后来又被他的学生推广到其他科学领域。 至于剑桥午后品茶的那位女士,据说她能分辨出每一杯茶,全部答对,看来,这位女士不仅仅拥有美貌。
输出变量Y 味道 香味 价格 酸度 输入变量X 咖啡品牌 咖啡用量 水的温度 烹煮时间 过程 P 烹调咖啡的过程 以烹调咖啡为例 随着生活水平的提高,现代人越来越讲究生活的品味,不少人都喝起了咖啡。就咖啡店而言,如何烹调咖啡,使咖啡的品质获得客户的满意?获得高品质的咖啡并非一蹴而就,而需要经过多次试验不断摸索、总结而成。 我们以咖啡的品质,如味道、香味、价格和酸度为输出变量(因变量),以影响这些特性的因素,如咖啡的品牌、烹调的咖啡的用量、水的温度和烹煮时间为输入变量(自变量),列表如下:
下表给出了每个因子3个水平的详细情况。当然试验设计并不要求每个因子的水平都要相同,其中某个(些)因子的水平的个数可以是2、4或其它数值。
图 正交表的设计原理 图5.1.2 正交表的设计原理
如果我们根据各因子的全部水平组合进行试验(全因子试验设计),在4因子3水平时,就要做 34=81 次试验,试验次数非常多,当因子或水平数轻微增加时,试验次数呈指数或几何级数急剧增加,规模庞大的试验是很难进行的,无论从经济上,还是从时间上似乎都令人无法承受、无法应付。人们很自然地想到:能否既获得与全因子试验非常接近结果,又极大地减少试验次数?
20世纪初,统计试验设计出现以来,已有近百年的时间,学者研究出了很多试验设计方法。研究者主要是研究又快(实验次数少,节省时间)、又省(试验次数少,节省经费)、又准(试验次数少,但代表性很高)的试验设计方法。比如有:优选法、正交设计法、均匀设计法、人工神经网络等。在诸方法中,正交试验设计是流行最广、应用最多的方法之一。正交试验设计和我国统计学家方开泰先生提出的均匀试验设计都是部分因子试验设计,对解决多因素、多水平试验设计富有成效、简单实用、效率很高。正交试验设计就是从全部试验中根据正交原理(见附图)挑选出部分有代表性的“点”(试验配置方案)进行试验,这些代表点具有“均匀”和“整齐”的特点。这种方法急剧地减少了试验次数(又快、又省),但又保持了很高的代表性(又准)。
烹调咖啡是4因子3水平的试验,若用正交试验设计,则只需9次试验就可以,具体的试验配置安排见表5.2和表5.3,这比全因子试验设计所需的81次试验显著地减少了试验次数。正交表中烹调咖啡是4因子3水平的试验,若用正交试验设计,则只需9次试验就可以,具体的试验配置安排见表5.2和表5.3,这比全因子试验设计所需的81次试验显著地减少了试验次数。正交表中 (1)每一行代表一个试验(配置)安排,即试验条件; (2)每一列配置一个试验因子,1代表该因子的水平第1水平,2代表该因子的第2水平,以此类推; (3)每一列各有3个1,3个2,3个3; (4)每两列之间(1:1)、(1:2)、(1:3)、(2:1)、(2:2)、(2:3)、(3:1)、(3:2)、(3:3)各有1个,在统计意义上就是配置这两列的因子为正交的; (5)任意两列的交互影响出现在其他两列,1 2=3+4、 1 3=2+4、1 4=2+3。
根据配置好的试验条件进行试验,详细记录试验的输出变量(因变量)的数值;然后计算个因子的主效应和因子间的交互效应,画主效应图和交互效应图;利用方差分析(ANOVA)对正交表进行进一步的精密分析。根据配置好的试验条件进行试验,详细记录试验的输出变量(因变量)的数值;然后计算个因子的主效应和因子间的交互效应,画主效应图和交互效应图;利用方差分析(ANOVA)对正交表进行进一步的精密分析。 表5.1.4 烹调咖啡的试验结果
这时,试验号4的配制为最好;注:为示范需要,数据为虚构,这里综合评分=0.3味道+0.2香味+0.4价格+0.1酸度。这时,试验号4的配制为最好;注:为示范需要,数据为虚构,这里综合评分=0.3味道+0.2香味+0.4价格+0.1酸度。 最后,简单归纳一下试验设计的实施步骤。 1. 试验目的:说明试验的目的,确定质量的指标,挑选主要影响因素,确定各因素的水平数目和取值,大致决定试验规模;
2. 试验说明:根据因素和水平的个数,选用合适的正交表,安排试验方案,制定试验计划; 3. 试验进行和试验记录:根据试验方案和计划进行试验,记录试验数据; 4. 试验结果分析:计算分析因子的主效应和因子间的交互效应,辅以主效应图和交互效应图,对正交表进行方差分析,寻求最佳试验配置,等等; 5. 试验结果验证:重复上述试验分析的结果,以确认其再现性;做出决策。 本章主要是学习由专家、研究者研究开发的试验设计方法特别是正交实验设计方法,以便用于解决实际问题。
试验设计的效果 在质量管理中所遇到的,不论是设计新产品,还是改革旧工艺、提高产品质量、减低成本,大都需要做试验。 如何安排试验,有一个方法问题 不好的试验设计方法,即使做了大量的试验,也未必能达到预期的目的; 一个好的试验设计方法,既可以减少实验次数,缩短试验时间和避免盲目性,又能迅速得到有效的结果。 2008.10.1
试验设计的由来 试验设计是应用统计手法进行解决问题的方法,它在19世纪产生于英国. 最早是在农地进行试验。如“最佳肥料”的依据。 逐步应用到畜牧业。
试验设计(例) 一个烤漆工厂,针对喷漆后烤漆所使用的时间及温度各使用一元多次实验法进行实验,以了解哪一种条件下密着性(附着度)最好。 先决条件: 1、底材要一样; 2、油漆要一样; 3、溶剂要一样; 4、粘度要一样; 试验因素: 1、烘烤温度; 2、烘烤时间;
附着度-温度 附着度 温度 ℃ 结论:温度在130度及140度最理想 2008.10.1
附着度-时间 附着度 时间 分 结论:时间在40分到60分最理想 2008.10.1
试验设计(例) 在上例中,将时间及温度以外的各条件予以固定,并将温度及时间予二元二次法作实验。 将产品分为4组: 在四组不同的样品中,经试验后何者为最佳的作业条件,即可制订为作业标准的条件。
优选法 概念: 优选法是以较少的试验次数,迅速地找到生产和科学实验的最优方案的方法。 适用范围: 1、怎样选取合适的配方,合适的制作过程,使产品质量最好。 2、怎样在质量标准下,使产品成本最低,生产过程最快? 3、已有仪器怎样调试,使其性能最好? 4、在合成配方、操作条件等方面应用 2008.10.1
0.618法 X2 X1 × 0.618是单因素试验设计方法,又叫黄金分割法。这种方法是在试验范围内(a, b)内,首先安排两个试验点,再根据两点试验结果,留下好点,去掉不好点所在的一段范围,再在余下的范围内寻找好点,去掉不好的点,如此继续地作下去,直到找到最优点为止。 1 - W = W2 1-W W a b × ★ 0.382 0.618 2008.10.1
0.618法 X2 X1 × a b × ★ 0.382 0.618 X1 = a + 0.618(b-a) X2 = a + b – X1 第一点 = 小 + 0.618( 大- 小) 第二点 = 小 + 大 – 第一点(前一点) 第一点是经过试验后留下的好点;
0.618法(例) 铸铝件最佳浇铸温度的优选试验。某厂铸铝件壳体废品率高达55%,经分析认为铝水温度对此影响很大,现用0.618法优选。优选范围在690 ℃ ~ 740 ℃ 之间。 第一点 = 690 + 0.618(740- 690) = 721 第二点 = 690 + 740 – 721 = 709
0.618法(例) 709 721 690 740 × × 第一点合格率低 第三点 = 690 + 721 – 709 = 702 721 690 702 709 × × 第二点合格率低 第四点 = 690 + 709 – 702 = 697 690 697 702 709 × × 第三点合格率低 第五点 = 690 + 702 - 697 = 695 695 697 690 702 × ×
0.618法 0.618法要求试验结果目标函数f(x)是单峰函数,即在试验范围内只有一个最优点d,其效果f(d)最好,比d大或小的点都差,且距最优点d越远的试验效果越差。 这个要求在大多数实际问题中都能满足。 f(x) o x a d b
对分法 对分法也叫平分法,是单因素试验设计方法适用于试验范围(a, b)内,目标函数为单调(连续或间断)的情况下,求最优点的 方法。 使用条件: 每做一次试验,根据结果可以决定下次试验的方向。
对分法的作法 d × ( c + b ) d = —————— 2 每次选取因素所在试验范围(a, b)的中点处C做试验。 ( a + b ) 计算公式: C = —————— 2 a c b ★ × 每试验一次,试验范围缩小一半,重复做下去,直到找出满意的试验点为止。
对分法(例) 某毛纺厂为解决色染不匀问题,优选起染温度,采用对分法。具体如下。原工艺中的起染温度为40℃,升温后的最高温度达100 ℃,故试验范围先确定在40℃~ 100℃。
均分法 均分法是单因素试验设计方法。它是在试验范围(a, b)内,根据精度要求和实际情况,均匀地排开试验点,在每一个试验点上进行试验,并相互比较,以求的最优点的 方法。 作法: 如试验范围L = b – a,试验点间隔为N,则试验点n为: L b - a n = — + 1 = ———— + 1 N N 2008.10.1
均分法(例) 对采用新钢种的某零件进行磨削加工,砂轮转速范围为420转/分~720转/分,拟经过试验找出能使光洁度最佳的砂轮转速值。 N = 30 转/分 b - a 720 - 420 n = ———— + 1 = —————— +1 = 11 N 30 试验转速: 420,450,480,510,540,570,600,630,660,690,720 ★ 2008.10.1
均分法 使用条件: 这种方法的特点是对所试验的范围进行“普查”,常常应用于对目标函数的性质没有掌握或很少掌握的情况。即假设目标函数是任意的情况,其试验精度取决于试验点数目的多少。
双因素优选法 如有两个因素需要考虑,一个含量是1000克到2000克,另一个温度5000~6000℃。 6000℃ × 5500℃ ○ 5000℃ 1000克 1500克 2000克
对数法(例) 6 7 8 9 10 11 12 9 10 11 12 11 12 1 2 3 4 5 6 7 8 9 10 11 12 最佳
费希尔,R.A. Ronald Aylmer Fisher (1890~1962) 英国统计学家和遗传学家。1890年 2月17日生于伦敦,1962年7月29日卒于澳大利亚阿德莱德。1912年毕业于剑桥大学数学系,后随英国数理统计学家J.琼斯进修了一年统计力学。他担任过中学数学教师,1918年任罗坦斯泰德农业试验站统计试验室主任。1933年,因为在生物统计和遗传学研究方面成绩卓著而被聘为伦敦大学优生学教授。1943年任剑桥大学遗传学教授。1957年退休。1959年去澳大利亚,在联邦科学和工业研究组织的数学统计部作研究工作。