搜档网
当前位置:搜档网 › 均匀设计与均匀设计表--方开泰

均匀设计与均匀设计表--方开泰

均匀设计与均匀设计表--方开泰
均匀设计与均匀设计表--方开泰

目录

序言 (2)

前言 (4)

第一章试验设计和均匀设计 (5)

1.1试验设计 (5)

1.2试验的因素和水平 (7)

1.3因素的主效应和因素间的交互效应 (9)

1.4全面试验和多次单因素试验 (13)

1.5正交试验法(正交设计) (16)

1.6均匀设计 (18)

1.7均匀设计表的使用 (21)

第二章回归分析简介及其在均匀设计中的应用 (24)

2.1一元线性回归模型 (24)

2.2多元线性回归模型 (29)

2.3二次型回归模型与变量筛选 (31)

2.4应用实例 (32)

2.5寻求最优工艺条件 (35)

第三章均匀设计表的构造和运用 (36)

3.1 均匀设计表的构造 (36)

3.2 均匀性准则和使用表的产生 (39)

3.4 均匀设计和正交设计的比较 (46)

第四章配方均匀设计 (49)

4.1 配方试验设计 (49)

4.2 配方均匀设计 (51)

4.3 有约束的配方均匀设计 (53)

4.4 均匀设计在系统工程中的应用 (56)

序言

在科学实验与工农业生产中,经常要做实验。如何安排实验,使实验次数尽量少,而又能达到好的试验效果呢?这是经常会碰到的问题。解决这个问题有一门专门的学问,叫做“试验设计”。试验设计得好,会事半功倍,反之就会事倍功半了。60年代,华罗庚教授在我国倡导与普及的“优选法”,即国外的斐波那契方法,与我国的数理统计学者在工业部门中普及的“正交设计”法都是试验设计方法。这些方法经普及后,已为广大技术人员与科学工作者掌握,取得一系列成就,产生了巨大的社会效益和经济效益。随着科学技术工作的深入发展,上述两种方法就显得不够了。“优选法”是单变量的最优调试法,即假定我们处理的实际问题中只有一个因素起作用,这种情况几乎是没有的。所以在使用时,只能抓“主要矛盾”,即突出一个因素,而将其他因素固定,这样来安排实验。因此“优选法”还不是一个很精确的近似方法。“正交设计”的基础是拉丁方理论与群论,可以用来安排多因素的试验,而且试验次数对各因素的各水平的所有组合数来说是大大地减少了,但对于某些工业试验与昂贵的科学实验来说,试验仍嫌太多,而无法安排。

1978年,七机部由于导弹设计的要求,提出了一个五因素的试验,希望每个因素的水平数要多于10,而试验总数又不超过50,显然优选法和正交设计都不能用,方开泰教授在几年前,曾为近似计算一个多重积分问题找过我,我向他介绍了多重数值积分的方法并取得了好结果,这就使他想到是否可能用数论方法于试验设计的问题,于是我们经过几个月的共同研究,提出了一个新的试验设计,即所谓“均匀设计”,将这一方法用于导弹设计,取得了成效,我们的文章在80年代初发表后,15年来,均匀设计已在我国有较广泛的普及与使用,取得了一系列可喜的成绩。

均匀设计属于近30年发展起来的“伪蒙特卡罗方法”的范筹。将经典的确定的单变量问题的计算方法推广后用于多变量问题的计算时,计算量往往跟变量个数有关,即使电脑再进步很多,这种方法仍无法实际应用,乌拉母(S.Ulam)与冯诺依曼(J.von Neumann)在40年代提出蒙特卡罗方法,即统计模拟方法,这个方法的大意是将一个分析问题化为一个有同样解答的概率问题,然后用统计模拟的方法来处理后面这个问题,这样使一些困难的分析问题反而得到了解决,例如多重定积分的近似计算。蒙特卡罗方法的关键是找一组随机数作为统计模拟之用,所以这一方法的精度在于随机数的均匀性与独立性。

50年代末,有些数学家试图用确定性方法寻找空间中均匀散布的点集来代替蒙特卡罗方法中的随机数,已经找到的点集都是用数论方法找到的。按照外尔(H. Weyl)定义的测度来度量,它们的均匀性很好,但独立性差些,用这些点集来代替蒙特卡罗方法中的随机数,

往往会得到更精确的结果。这一方法称为伪蒙特卡罗方法或数论方法,数学家首先将这一方法成功地用于多重积分近似计算。从统计学的观点看,伪随机数就是一个均匀分布的样本。数值积分需要大样本,均匀设计则要找一些小样本。由于这个样本比正交设计所对应的样本要均匀,所以用它来安排实验会得到好的效果。当然在寻求小样本时,寻求大样本的方法是起了借鉴作用的。

均匀设计只是数论方法的一个应用,数论方法还有广泛应用的园地。例如多重插值公式的建立,某些积分与微分的近似求解,求函数整体极值,求某些多元分布的近似代表点,及用于统计推断的一些问题,如多元正态性检验及多元球性检验。

早在50年代末,外国刚开始研究为蒙特卡罗方法时,华罗庚就倡议并领导了这一方法在我国的研究,他的开拓性成果总结在我们的专著“数论在近似分析中的应用”(科学出版社,1978年;英文版:Springer-Verlag and Science Press,1981)中,这些工作是方开泰教授与我合作的工作重要的背景与参考材料之一。

我与方开泰教授合作了近20年,由于他既是一个数学家,又有长期在中国各工业部门普及应用数理统计的宝贵经验,所以他有很好的应用数学背景与洞察力。他能及时地提出有价值的研究问题及解决问题的可能途径,我们的合作既是愉快的,又是富于成效的,我们的成果总结在我们的专著”Number-Theroretic Methods in Statistics”(Chapman and Hall,1993,中文版在出版过程中)之中。

方开泰教授的这本书着重于应用及普及,但也包括了他的最新成果,书后的均匀设计表就是最近他用准确的偏差方法算出来的,比过去的结果有较大的改进,我相信本书的出版,对于在我国进一步普及与应用均匀设计将是很重要的,我愿借此机会预祝本书成功。

王元

1994年2月

前言

均匀设计是1978年王元教授和我共同提出的,10多年来,均匀设计在理论上有了不少新的发展,如各种均匀性度量的探讨,拉丁方均匀设计的提出将均匀设计用于配方设计而产生的配方均匀设计,特别地,最近我们又发现了一批奇数的均匀设计表,它们比原来的表均匀性有显著地改善,这些表和它们的均匀表都已收集在本书的附录中,由于实际的需要,利用拟水平的技术可以产生有混合水平的均匀设计表,本书也给出了不少这一类的设计表,并列出它们的均匀度,此外,本书给出了均匀设计和正交设计的比较。

本书是一本普及教材,目的是向广大科技工作者介绍均匀设计的原理,方法和应用,读者并不需要具备高深的数学和统计知识,中国数学会均匀设计学会已经研制了有关软件和教学录象带,方便使用者有效地使用均匀设计,特别是数据分析方面,该软件包含了丰富的内容,比本书的材料更为丰富,本书也可作为大学和研究生的教材和参考书。

本书共分四章,第一章介绍试验设计的重要性,正交设计和如何使用均匀设计来设计试验。第二章首先对回归分析作了简单的介绍,随后介绍均匀设计的数据分析,工艺条件的优化。第三章介绍均匀设计表的构造,使用表的构造,均匀度准则,以及正交设计和均匀设计的比较。第四章讨论配方设计,首先介绍文献中推荐的三种配方设计方法,然后给出配方均匀设计,有约束配方均匀设计,最后给出均匀设计在系统工程等方面的应用。

在编写这本讲义中,中国科学院院士王元教授给出了许多指导性意见,并为本书写了精彩的序言,没有华一王(华罗庚王元)当年开创性的工作,就不可能有均匀设计。

中国航天工业总公司三院张建舟高级工程师,东北制药总厂张承恩高级工程师,北京军事医学科学院张学中研究员给了我很多支持和帮助,中国科学院应用数学所我的学生李润泽和张金廷同志协助我整理和打印,在此表示衷心地感谢。

由于作者水平有限,加之本书是利用春节假期匆匆赶出来的,难免有错误或不恰当之处,欢迎读者批评指正。

方开泰

中国科学院应用数学研究所

香港浸会大学

1994年2月

第一章试验设计和均匀设计

1.1试验设计

在工农业生产和科学研究中,经常需要做试验,以求达到预期的目的。例如在工农业生产中希望通过试验达到高质、优产、低消耗,特别是新产品试验,未知的东西很多,要通过试验来摸索工艺条件或配方。如何做试验,其中大有学问。试验设计得好,会事半功倍,反之会事倍功半,甚至劳而无功。

本世纪30年代,由于农业试验的需要,费歇尔(R.A.Fisher)在试验设计和统计分析方面做出了一系列先驱工作,从此试验设计成为统计科学的一个分支。随后,F.Yates,R.C.

Bose,O.Kempthome,W.G.Cochran,D.R.Cox和G.E.P.Box对试验设计都作出了杰出的贡献,使该分支在理论上日趋完善,在应用上日趋广泛。60年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化,在方法解说方面深入浅出为试验设计的更广泛使用作出了众所周知的贡献。田口玄一的方法对我国试验设计的普及和广泛应用有巨大的影响,70年代我国许多统计学家深入工厂、科研单位,用通俗的方法介绍正交试验设计,帮助工程技术人员进行试验的安排和数据分析,获得了一大批优秀成果,出版了许多成果汇编,举办了不少成果展览会。

在广泛使用试验设计方法的洪流中,必然会出现一些新的问题,这些总是用原有的各种试验设计方法不能圆满地解决,特别是当试验的范围较大,试验因素需要考察较多等级(在试验设计中这些等级称之为水平)时,用正交试验及其它流行的试验方法要求做较多的试验,常使得试验者望而生畏。许多实际问题要求一种新的试验方法,它能有效地处理多水平的试验,于是王元和方开泰于1978年提出了均匀设计(见文献「1-3」),该设计考虑如何将设计点均匀地散布在试验范围内,使得能用较少的试验点获得最多的信息。10多年来,均匀设计在国内得到了广泛应

用,并获得不少好的成果。

试验设计在工业生产和工程设计中能发挥重要的作用,例如:1)提高产量;

2)减少质量的波动,提高产品质量水准;

3)大大缩短新产品试验周期;

4)降低成本;

5)延长产品寿命。

在自然科学中,有些规律开始尚未由人们所认识,通过试验设计可以获得其统计规律,在此基础上提出科学猜想,这些猜想促进了学科的发展,例如遗传学的许多发现都藉助于上述过程。

材料工业是工业中的栋梁,汽车拖拉机的制造离不开各种合金钢,钛合金的发明和发现使飞机制造工业产生飞跃。超导的研究和超导材料的配方息息相关。配方试验又称混料试验(Experiments with Mixtures),不仅出现于材料工业,而且在人们生活和其它工业中处处可见,例如在中药、饮料、混凝土的配方中。由于在配方中各种材料的总和必须为100%,其试验设计必须考虑到这个约束条件,由于这个原因正交试验设计等方法不能直接用于配方设计。针对配方设计的要求,Scheffé于1958年提出了单纯形格子点设计,随后于1963年他又提出了单纯形重心设计。Cornell[27]对配方试验设计的各种方法作了详尽的介绍和讨论。显然,均匀设计的思想也能用于配方试验,王元和方开泰[9]给出了配方均匀设计的设计方法和有关的讨论。本书第五章将系统介绍配方试验设计和配方均匀设计。

不论是均匀设计或配方均匀设计,其数据分析都要藉助于回归分析,要用到线性回归模型、二次回归模型、非线性模型,,以及各种选择回归变量的方法(如前进法、后退法、逐步回归、最优回归子集等)。有关回归分析的书籍成百上千,本书仅作梗概介绍。读者很容易找到各种参考书籍获得更详细的介绍。

试验设计的方法很多,本书重点介绍均匀设计,这并不意味其它方法不重要,每种方法都有其优点,也有其局限性,根据实际情况选取合适的方法是应用统计的重要内容。

1.2试验的因素和水平

在工业、农业、科学研究和军事科学的研究中,经常需要作各种试验,以研究各种因素之间的关系,找到最优的工艺条件或最好的配方。让我们先看一个例子:

例 1 在一个化工生产过程中,考虑影响得率(产量)的三个因素:温度(A),时间(B)和加碱量(C)。为了便于试验的安排,每个因素要根据以往的经验来选择一个试验范围,然后在试验范围内挑出几个有代表性的值来进行试验,这些值称做该因素的水平。在该例中,我们选择的试验范围如下:

温度:77.5℃~92.5℃

时间:75分~165分

加碱量:4.5%~7.5%

然后在上述范围内,每个因素各选三个水平,组成如下的因素水平表:

表1 因素水平表

选择因素和水平关系到一个试验能否成功的关键,下列的注意事项和建议对使用试验设计的人员可能是有益的。

1.在一个生产过程中,有关的因素通常是很多的,例如在例1的化工生产工艺中,有催化剂的品种,催化剂用量,加碱时的速度,

容器中的压力等。但根据这次试验目的,除了温度(A),时间(B),和加碱量(C)各取三个水平外,其余因素是固定的,或者讲,他们只取一个水平。为了方便,通常这些固定的因素在试验方案中并不称为因素,只有变化的因素才称为因素。

2.在一项试验中,如何从众多的有关因子中挑选出试验方案中的因素?我们建议课题的领导者应当要请有经验的工程师、技术员、工人共同讨论决定。在一次试验中,因素不宜选得太多(如超过10个),那样可能会造成主次不分,丢了西瓜,拣了芝麻。相反地,

因素也不宜选得太少,(如只选定一、二个因素),这样可能会遗漏重要的因素,或遗漏因素间的交互作用,使试验的结果达不到预期的目的。例如,有这样的故事,原计划试验方案中只有三个因素,而利用试验设计的方法,可以在不增加试验数目的前提下,再增加一个因素,既然不费事何乐而不为呢?试验的结果发现,最后添加的这个因素是最重要的,从而发现了历史上最好的工艺条件,正是“有心栽花花不成,无意插柳柳成荫。”

3.试验的范围应当尽可能大一点。如果试验在试验室进行,试验范围大比较容易实现;如果试验直接在生产中进行,则试验范围不宜太大,以防产生过多次品,或产生危险。试验范围太小的缺点是不易获得比已有条件有显著改善的结果。历史上有些重大的发明和发现,是由于“事故”而获得的,也就是说试验的范围大大不同于有经验的范围。

4.若试验范围允许大一些,则每一因素的水平个数最好适当多一些。

5.水平的间隔大小和生产控制精度是密切相关的。若在例1中温度的控制只能作到

±3℃,且我们设定控制在85℃,于是在生产过程中温度将会在85°±3℃,即82—88℃波动。不难看到,这时设定的三个水平80℃,85℃,90℃之间是太近了,应当加大,例如80℃,90℃,100℃。如果温度控制的精度可达±1℃,则例1如设定的三个水平是合理的。

6.因素和水平的含意可以是广义的。例如五种棉花用于织同一种布,要比较不同棉花影响布的质量的效应,这时“棉花品种”可设定为一个因素,五种棉花就是该因素下的五个水平 。

1.3因素的主效应和因素间的交互效应

根据试验的目的,要预先确定一项或多项试验指标,为简单计,本书仅讨论只有一项试验指标(记作Y )的情形。如例如1的试验Y 是得率。在数理统计中,称试验指标为响应(response )为通俗起见,本书中就叫试验指标。

考察一个因素对试验指标的影响是试验的目的之一。若在一项试验中,考察温度和得率Y 之间的关系,并取温度五个水平,其相应Y 值如下:

上述试验可以表成一个线性数学模型

5,,1, =+=i Y i i αμ (1.1)

其中i Y 为第i 次试验结果,μ为温度从50℃到90℃范围内Y 的平均值。

通常可以用五次试验的平均值来估计,记作μ

?,即 ()4050454035305

1?=++++=μ i α表示温度取第i 个水平时i Y 的值与之μ差。不难发现,它们的估计

值为

104050?54045?,04040?54035?,104030?54321=-==-==-=-=-=-=-=α

αααα

这里51,,αα 称为温度在五个水平下的主效应,51?,,?αα

为它们的估计值。

由于试验中总存在一些偶然因素的干扰,如室温的变化,电压的波动,材料的不均匀性,这些偶然因素总称为随机误差。由于试验误差的存在,不可能产生上例那么理想的情况。其实际数据可能为

5,,1, =++=i Y i i i εαμ (1.2)

这里i ε为第i 次试验的试验误差。这时试验必须有重复才能估计出i α和i ε.

实际上,当试验的水平和相应的Y 为连续变量时,其数学模型也可以用回归方程来表达,例如,用线性回归方程

εβα++=X Y (1.3)

其中X 表示温度,α和β是回归系数,ε为随机误差。在第二章将介绍,α和β可以用最小二乘法由试验数据估出,由上述温度和得率的数据可得回归方程

X Y

46.080.7?+= (1.4) 这里Y ?为试验结果Y 的估计值。利用方程(1.4)可以估出五次试验的结果如下:

其中I

I Y Y ?-称为残差,它的大小反映了回归方程(1.4)的精确程度,并可用它作回归诊断,更详细讨论请看第二章。

方程(1.4)中,X 的回归系数0.46有明确的实际含意,它表示温度每增加一度,其得率Y 平均增加0.46%,于是0.46反映了X 对Y 的效应,这里可以称为线性回归效应。

有一点是必须注意的,无论是模型(1.2)中的主效应{}i α,还是模型

(1.3)中的线性回归效应β,都强烈地依赖于试验条件,尤其是X 的试验范围,也就是说,这两个模型只适用于X 的试验范围内。否则,

当X 为210°时,Y

?的估值为104.4%,这是不可能的,因为得率总是小于100%的。

显然,模型(1.2)和(1.3)是最简单的情形,实际情况是多种多样的,例如X 和Y 之间可能有非线性回归关系,或其它相关关系。这些将在以后讨论。

现在我们来介绍因素间交互作用的概念。首先,设有两个因素A 和B 它们各取两个水平21,A A 和21,B B 。这时共有四种不同的水平组合,

其试验结果列于图1。当1B B =时,1A 变到2A 使Y 增加30-10=20;类

似地,当2B B =时,1A 变到2A 使Y 也增加40-20=20。这就是说A 对Y

的影响与B 取什么水平无关。类似地,当B 从1B 变到2B 时,Y 增加

20-10(或40-30=10),与A 取的水平无关。这时,我们称A 和B 之间没有交互作用。判断和之间有没有交互作用,选用图2的作图方法更为直观。当图中的两条线平行时(或接近平行时),判断A 和B 之间没有交互作用.图3和图4给出了一个有交互作用的例子,它们的含意和作图方法与图和图2是一样的。

1

交互作用在实际中是大量存在的,例如化学反应中催化剂的多少与其它成分的投入量通常是有交互作用的。水中各种金属含量太多,对人体健康会造成危害,金属之间对人体的危害也存在交互作用(参见例5)。

当因素A,B 及其它们的试验指标Y都为连续变量时,可以建立Y和A;B之间的回归方程。若回归方程为

α+

β

γ

ε

A

Y(1.5)

=B

+

+

时,A对Y的影响由回归系数β完全决定,不受B取哪个水平的影响;类似地,B对Y的影响由回归系数γ完全决定,不受A取哪个水平的影响;类似地,对的影响由回归系数完全决定,不受取哪个水平的影响。这时A和B没有交互作用。

当A和B之间有交互作用时,回归模型不可能为线性的,其中一定有非线性的。最常见的模型之一为

α+

β

γ

ε

δ

A

Y(1.6)

B

+

=AB

+

+

其中δ

α,

γ

β

,为回归系数,ε为随机误差。这时若δ>0,称A和B之,

间有正交互作用;若δ<0,称A 和B 之间有负交互作用.请看如下两个例子

AB

B A Y AB B A Y 5.3321?5.3321?2-++=+++= 当A=3.5,B=4.10时,相应两个回归方程的试验指标列于图5和图6。我们看到两种情形均有交互作用,且一个为正交互作用,另一个为负交互作用。

两个因素之间有交互作用时,其回归模型不一定呈(1.6)形式,更详细讨论可参见第二章第三节。多个因素之间(超过二个因素)也可能有交互作用,该问题也将在第二章讨论。

1.4全面试验和多次单因素试验

在一项试验中,当因素和水平确定后,如何设计该项试验呢?下面两种方法是最容易想到的:

1、全面试验

该方法将每一个因素的不同水平组合做同样数目的试验,例如将每个因素的不同水平组合均作一次试验。

在一项试验中若有m 个因素, 它们各有m l l ,,1 个水平, 则全面试

验至少需做m l l l ??? 21次试验。例如,在例1中,3321===l l l 则全面试验至少做27333=??次试验。当因素的个数不多,每个因数的水平数也不多时,人们常用全面试验的方法,并且通过数据分析可以获得较为丰富的结果,结论也比较精确。当因数较多,水平数较大时,全面试验要求较多的试验。例如,有六个因素,每个因素都是五水平,则至少需1562556=次试验,这个数目太大了,对绝大多数场合,做这么多次试验是不可能的。因此,我们需要一种试验次数较少,效果又与全面试验相近的试验设计方法。

2、多次单因素试验

这个方法在工程和科学试验中常被人们所采用,现以例1来说明这个方法。例1试验的目的是要寻找好的工艺使得化学反应后的得率最高。为介绍简单计,设试验误差较小,故不作重复试验(即在同一试验条件下将试验重复多次)。

设先将时间和加碱量固定,变化温度,试验结果如下:

B =90分 80℃ 85℃ 90℃

C =5% 33% 70% 64%

其中33%,70%和 64%为得率,三次试验中,以70%为最高,故温度85°为最佳。第二步

固定温度和加碱量,变化时间,其试验结果如下:

A=85℃ 90分 120分 150分

C=5% 70% 73% 59%

以反应时间为120分最佳。下一步是固定时间和温度,变化加碱量,

获得如下结果:

A=85℃5% 6% 7%

B=120分73% 75% 68%

以加碱量75%为最佳,于是有人就得出结论:最佳工艺为A=80℃,B=120分,C=6%。

当因素之间没交互作用时,这个结论是正确的;当因素之间有交互作用时,该结论一般不真,今设例1的因素间有交互作用,在上述试验的基础上,若我们固定B=120分,C=6%,变化因素A并获得如下结果:

B=120分80℃85℃90℃

C=6% 46% 75% 78%

发现有更好的工艺条件。这时我们发现温度的效应是依赖于因素B 和C的,当B=90分,C=

5%时,温度以85℃为佳,而当B=120分,C=6%时,温度以90℃为佳,这种现象表明温

度和其他两因素间有交互作用。当因素间有交互作用时,用上述方法不一定能选到最好的工艺条件。例如,例1的试验应当继续按原来的方法做下去:

A=90℃90分120分150分

C=6% 73% 78% 84%

发现工艺条件A =90℃, B =120分,C =6%为最优工艺条件且似乎已不能改进。如果我们将27个工艺组合进行全面试验,发现当工艺条件为A =90℃,B =150分,C =7%时得率可达82%,而这个工艺条件没有为上面的试验方法所发现。因此,多次单因素试验法有局限性。特别是,当因素的数目和水平数更多时,常常会得到错误的结论,不能达到预期的目的。

1.5正交试验法(正交设计)

这是目前最流行,效果相当好的方法。统计学家将正交设计通过一系列表格来实现,这些表叫做正交表。例如表2就是一个正交表,并记为()493L ,这里“L ”表示正交表“9”表示总共要作9次试验,“3”表示每个因素都有3个水平,“4”表示这个表有4列,最多可以安排4个因素。常用的二水平表有()()()();2,2,2,2313215167834L L L L 三水平表有()();3,3132749L L 四水平表有()5164L ;五水平表有()6255L 等。还有一批混合水平的表在实际中也十分有用,如 ()(

)()(),24,24,32,2463163416131248????L L L L (),249216?L ()()()718811612

1632,28,24???L L L 等。例如()631624?L 表示要求做16次试验,允许最多安排三个“4”水平因素,六个“2”水平因素。

表2 正交表 L 9 (34 )

若用正交表来安排例1的试验,其步骤十分简单,具体如下:

(1)选择合适的正交表。适合于该项试验的正交表有()()()1327718493,32,3L L L ?等,我们取()

493L ,因为所需试验数较少。 (2)将A ,B ,C 三个因素放到()493L 的任意三列的表头上,例如放在前三列。

(3)将A ,B ,C 三例的“1”,“2”,“3”变为相应因素的三个水平。

(4)9 次试验方案为:第一号试验的工艺条件为A 1 (80℃),B 1 (90分),C 1 (5%);

第二号试验的工艺条件为A 1 (80℃),B 2 (120分),C 2 (6%)…。这样试验方案就排好了。该例的进一步讨论请参考文献[25]。

表 3 正交试验方案

在表3的正交试验设计中,可以看到有如下的特点:

1)每个因素的水平都重复了3次试验;

2)每两个因素的水平组成一个全面试验方案。这两个特点使试验点在试验范围内排列规律整齐,有人称为“整齐可比”。另一方面,如果将正交设计的9个试验点点成图(图7),我们发现9个试验点在试验范围内散布均匀,这个特点被称为“均匀分散”。正交设计的优点本质上来自“均匀分散,整齐可比”这两个特点。有关正交设计的详细讨论可参看文献[24—26,30]。

1.6均匀设计

每一个方法都有其局限性,正交试验也不例外,它只宜于用于水平数不多的试验中。若在一项试验中有s 个因素,每个因素各有q 水平,用正交试验安排试验,则至少要作2q个试验,当q 较大时,2q将更大,使实验工作者望而生畏。例如,当q=12 时,2q=144,对大多数实际问题,要求做144 次试验是太多了!对这一类试验,均匀设计是非常有用的。

所有的试验设计方法本质上就是在试验的范围内给出挑选代表点的方法。正交设计是根据正交性准则来挑选代表点,使得这些点能反映试验范围内各因素和试验指标的关系。上节我们提及正交设计在挑选代表点时有两个特点:均匀分散,整齐可比。“均匀分散”使试验点有代表性;“整齐可比”便于试验数据的分析。为了保证“整齐

可比”的特点,正交设计必须至少要求做q2次试验。若要减少试验

的数目,只有去掉整齐可比的要求。

均匀设计就是只考虑试验点在试验范围内均匀散布的一种试验设计方法,其原理将在第三章给出。

均匀设计和正交设计相似 ,也是通过一套精心设计的表来进行试验设计的。附录Ⅰ给出了41个均匀设计表和相应的使用表。表4、表5和表6就是其中的三个。每一个均匀设计表有一个代号()s n q U 或()

s n q U *,其中“U ”表示均匀设计,“n ” 表示要做n 次试验,“q ”表示每个因素有q 个水平,“s ”表示该表有s 列。的右上角加“*”和不加“*”代表两种不同类型的均匀设计表。通常加“*”的均匀设计

表有更好的均匀性,应优先选用。例如()4*6

6U 表示要做次6试验,每个因素有6个水平,该表有4列。

每个均匀设计表都附有一个使用表,它指示我们如何从设计表中选用适当的列,以及由这些列所组成的试验方案的均匀度。表7是()

4*66U 的使用表。它告诉我们,若有两个因素,应选用1,3两列来安排试验;若有三个因素,应选用1,2,3三列,…,最后1列D 表示刻划均匀度的偏差(discrepancy),偏差值越小,表示均匀度越好。

例如由附录A1.3和A1.4的两个均匀设计()4*7

7U 表和及它们的使用表来安排试验,今有两个因素,若选用()477U 的1,3列,其偏差D=0.2398,

选用()4*7

7U 的1,3列,相应偏差D=0.1582,后者较小,应优先择用。有关D 的定义和计算将在第三章介绍。当试验数n 给定时,通常n U 表

比*n U 表能安排更多的因素。故当因素s 较大,且超过*n U 的使用范围

时可使用n U 表。

表4 ()4*6

6U

表5 ()477U

如上所述,表()6*6

6U 最多可以安排四个因素的试验。若用正交表安排三个6水平因素,至少要采用()3366L ,该表最多能安排三个因素,可要做36次试验,而两个表的偏差一个为0.1875()*6U ,另一个为

0.1597()36L (参见表23),相差并不十分大。由此例可见均匀设计的优

点。

表6 ()4*7

7U

表7 ()4*6

6U 的使用表

均匀设计有其独特的布(试验)点方式,其特点表现在:

1)每个因素的每个水平做一次且仅做一次试验。

常用均匀设计表

常用(校园交达电脑最新版)均匀设计表 表1 试验号 1 2 3 1 1 2 4 2 2 4 3 3 3 1 2 4 4 3 1 5 5 5 5 表2 的使用表 因素个数 列号 D 2 1 2 3 1 2 3 表3 )6(4* 6 U 试验号 1 2 3 4 1 1 2 3 6 2 2 4 6 5 3 3 6 2 4 4 4 1 5 3 5 5 3 1 2 6 6 5 4 1 表4 的使用表 因素个数 列 号 D 2 1 3 3 1 2 3 4 1 2 3 4

表5 )7(47U 试验号 1 2 3 4 1 1 2 3 6 2 2 4 6 5 3 3 6 2 4 4 4 1 5 3 5 5 3 1 2 6 6 5 4 1 7 7 7 7 7 表6 )7(47U 的使用表 因素个数 列号 D 2 1 3 3 1 2 3 4 1 2 3 4 表7 )7(4* 7 U 试验号 1 2 3 4 1 1 3 5 7 2 2 6 2 6 3 3 1 7 5 4 4 4 4 4 5 5 7 1 3 6 6 2 6 2 7 7 5 3 1 表8 )7(4* 7 U 的使用表

因素个数 列号 D 2 1 3 3 2 3 4 表9 )8(5* 8 U 试验号 1 2 3 4 5 1 1 2 4 7 8 2 2 4 8 5 7 3 3 6 3 3 6 4 4 8 7 1 5 5 5 1 2 8 4 6 6 3 6 6 3 7 7 5 1 4 2 8 8 7 5 2 1 表10 )8(5* 8 U 的使用表 因素个数 列号 D 2 1 3 3 1 3 4 4 1 2 3 5 表11 )9(59U 试验号 1 2 3 4 5 1 1 2 4 7 8 2 2 4 8 5 7 3 3 6 3 3 6 4 4 8 7 1 5 5 5 1 2 8 4

可查询均匀设计表

可查询均匀设计表、均匀设计表概况表、各因素水平排列表(或配方均匀设计的配方表)、相关系数临界值表、检验临界值表、检验临界值表(变量引入/剔除临界值参考用表)及检验临界值表。 一、均匀设计表 1、均等水平的均匀设计表: 所有因素的水平数都是相等的, 均等于运行次数的均匀设计表。可供查询的表共有41个, 每个均匀设计表都有与之配套的使用表, 用这些表可以进行2~7个因素、每个因素为5~31、37个水平的试验设计。图1是均等水平均匀设计表的一个例子。 图1均等水平的均匀设计表及其使用表 2、混合水平的均匀设计表: 将部分因素的临近水平进行水平合并处理后得到混合水平的均匀设计表(混合水平的均匀设计表没有与之配套的使用表)。可供查询的表共有243个, 用这些表可进行2因素6~30混合水平、3因素6~30混合水平及4因素6~12混合水平的试验设计(运行次数均为双数)。图2是混合水平均匀设计表的一个例子。

图2混合水平的均匀设计表 二、均匀设计表概况表 反映41个均等水平均匀设计表的运行次数、水平数、列数、类型(*类型还是非*类型)以及它们可安排试验因素数的总体情况的一个表, 见图3。 图3均匀设计表概况表 三、各因素水平排列表 反映各因素水平数值代号排列方式的表。图4是各因素水平排列表的一个例子。 图4各因素水平排列表 四、配方均匀设计的配方表 反映各原料组成百分比数值排列方式的表。图5是配方表的一个例子。

图5有约束配方均匀设计的原始配方表 五、相关系数临界值表 显著性水平为0.01、0.05、0.10、0.15、0.20和0.25六个水平值的相关系数临界值的表(自由度1~100)。 图6相关系数临界值表(显著性水平α=0.01) 六、检验临界值表 显著性水平为0.01、0.05、0.10、0.15、0.20和0.25六个水平值的检验临界值的表(第一、第二自由度范围均为1~100)。

均匀设计方法简介

均匀设计方法简介 在工农业生产和科学研究中,常须做试验,以获得予期目的:改进生产工艺,提高产品收率或质量,合成出某化合物等等。怎样做试验,是大有学问的。本世纪30年代,费歇(R.A.Fisher)在试验设计和统计分析方面做了一系列先驱工作,使试验设计成为统计科学的一个分支。今天,试验设计理论更完善,试验设计应用更广泛。本节着重介绍均匀设计方法。 一、试验设计 对于一项试验,例如用微波加热法通过离子交换制备Cu13X分子筛。我们可以13X分子筛、CuCl2为原料来制备,为寻找最佳条件,应如何设计这个试验呢?若我们已确定了微波加热功率(A)、交换时间(B)、交换液摩尔浓度(C)为三个影响因素,每个因素取五个不同值(即水平:A1,…,A5,B1,…,B5,C1,…,C5)。有两种方法最易想到: 1.全面试验:将每个因素的不同水平组合做同样数目的试验。对上述示例,不计重复试验,共需做5×5×5=125次试验。 2.多次单因素试验:依次考查各因素(考查某因素时,其它因素固定)取最佳值。容易知道,对上示例(不计重复试验)共需做3×5=15次试验。该法在工程和科学试验中常被人们采用,可当考查的因素间有交互作用时,该法所得结论一般不真。 3.正交设计法:利用正交表来安排试验。 本世纪60年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化,使正交试验设计得到更广泛的使用。 70年代以来,我国许多统计学家深入工厂、科研单位,与广大工程技术人员、工人一起,广泛开展正交设计的研究、应用,取得了大批成果。该法是目前最流行,效果相当好的方法。 正交表记为:L n(q m),这里“L”表示正交表,“n”表总共要做的试验次数,“q” 表每个因素都有q个水平,“m”表该表有4列,最多可安排m个因素。常用的二水平正交表为L4(23),L8(27),L16(215),L32(231);三水平正交表有L9(34),L27(313);四水平正交表L16(45)及五水平正交表L25(56)等。采用拟水平法,人们还得到一系列在实际中很有用的混合水平正交表,例如:L8(4×24),L12(23×31),L16(44×23)等,此处 L16(44×23)表示要做16次试验,允许最多安排四个“4”水平因素,三个“2”水平因素。在我们的示例中,可取L25(56)。该正交表如下: 6

均匀设计与均匀设计表

第一章试验设计和均匀设计 1.1试验设计 在工农业生产和科学研究中,经常需要做试验,以求达到预期的目的。例如在工农业生产中希望通过试验达到高质、优产、低消耗,特别是新产品试验,未知的东西很多,要通过试验来摸索工艺条件或配方。如何做试验,其中大有学问。试验设计得好,会事半功倍,反之会事倍功半,甚至劳而无功。 本世纪30年代,由于农业试验的需要,费歇尔(R.A.Fisher)在试验设计和统计分析方面做出了一系列先驱工作,从此试验设计成为统计科学的一个分支。随后,F.Yates,R.C. Bose,O.Kempthome,W.G.Cochran,D.R.Cox和G.E.P.Box对试验设计都作出了杰出的贡献,使该分支在理论上日趋完善,在应用上日趋广泛。60年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化,在方法解说方面深入浅出为试验设计的更广泛使用作出了众所周知的贡献。田口玄一的方法对我国试验设计的普及和广泛应用有巨大的影响,70年代我国许多统计学家深入工厂、科研单位,用通俗的方法介绍正交试验设计,帮助工程技术人员进行试验的安排和数据分析,获得了一大批优秀成果,出版了许多成果汇编,举办了不少成果展览会。 在广泛使用试验设计方法的洪流中,必然会出现一些新的问题,这些总是用原有的各种试验设计方法不能圆满地解决,特别是当试验的范围较大,试验因素需要考察较多等级(在试验设计中这些等级称之为水平)时,用正交试验及其它流行的试验方法要求做较多的试验,常使得试验者望而生畏。许多实际问题要求一种新的试验方法,它能有效地处理多水平的试验,于是王元和

方开泰于1978年提出了均匀设计(见文献「1-3」),该设计考虑如何将设计点均匀地散布在试验范围内,使得能用较少的试验点获得最多的信息。10多年来,均匀设计在国内得到了广泛应用,并获得不少好的成果。 试验设计在工业生产和工程设计中能发挥重要的作用,例如:1)提高产量; 2)减少质量的波动,提高产品质量水准; 3)大大缩短新产品试验周期; 4)降低成本; 5)延长产品寿命。 在自然科学中,有些规律开始尚未由人们所认识,通过试验设计可以获得其统计规律,在此基础上提出科学猜想,这些猜想促进了学科的发展,例如遗传学的许多发现都藉助于上述过程。 材料工业是工业中的栋梁,汽车拖拉机的制造离不开各种合金钢,钛合金的发明和发现使飞机制造工业产生飞跃。超导的研究和超导材料的配方息息相关。配方试验又称混料试验(Experiments with Mixtures),不仅出现于材料工业,而且在人们生活和其它工业中处处可见,例如在中药、饮料、混凝土的配方中。由于在配方中各种材料的总和必须为100%,其试验设计必须考虑到这个约束条件,由于这个原因正交试验设计等方法不能直接用于配方设计。针对配方设计的要求,Scheffé于1958年提出了单纯形格子点设计,随后于1963年他又提出了单纯形重心设计。Cornell[27]对配方试验设计的各种方法作了详尽的介绍和讨论。显然,均匀设计的思想也能用于配方试验,王元和方开泰[9]给出了配方均匀设计的设计方法和有关的讨论。本书第五章将系统介绍配方试验设计和配方均匀设计。 不论是均匀设计或配方均匀设计,其数据分析都要藉助于回归分析,要用到线性回归模型、二次回归模型、非线性模型,,以及各种选择回归变量的方法(如前进法、后退法、逐步回归、最

常用均匀设计表

常用(校园交达电脑最新版)均匀设计表 表1 )5(3 5U 试验号 1 2 3 1 1 2 4 2 2 4 3 3 3 1 2 4 4 3 1 5 5 5 5 表2 )5(3 5U 的使用表 因素个数 列号 D 2 1 2 0.3100 3 1 2 3 0.4570 表3 )6(4*6U 试验号 1 2 3 4 1 1 2 3 6 2 2 4 6 5 3 3 6 2 4 4 4 1 5 3 5 5 3 1 2 6 6 5 4 1 表4 )6(4*6U 的使用表 因素个数 列 号 D 2 1 3 0.1875 3 1 2 3 0.2656

4 1 2 3 4 0.2990 表5 )7(47U 试验号 1 2 3 4 1 1 2 3 6 2 2 4 6 5 3 3 6 2 4 4 4 1 5 3 5 5 3 1 2 6 6 5 4 1 7 7 7 7 7 表6 )7(47U 的使用表 因素个数 列号 D 2 1 3 0.2398 3 1 2 3 0.3721 4 1 2 3 4 0.4760 表7 )7(4* 7U 试验号 1 2 3 4 1 1 3 5 7 2 2 6 2 6 3 3 1 7 5 4 4 4 4 4 5 5 7 1 3 6 6 2 6 2 7 7 5 3 1

表8 )7(4* 7U 的使用表 因素个数 列号 D 2 1 3 0.1582 3 2 3 4 0.2132 表9 )8(5* 8U 试验号 1 2 3 4 5 1 1 2 4 7 8 2 2 4 8 5 7 3 3 6 3 3 6 4 4 8 7 1 5 5 5 1 2 8 4 6 6 3 6 6 3 7 7 5 1 4 2 8 8 7 5 2 1 表10 )8(5* 8U 的使用表 因素个数 列号 D 2 1 3 0.1445 3 1 3 4 0.2000 4 1 2 3 5 0.2709 表11 )9(59U 试验号 1 2 3 4 5 1 1 2 4 7 8 2 2 4 8 5 7 3 3 6 3 3 6 4 4 8 7 1 5

均匀设计

?均匀设计方法 ?一、均匀试验设计 ?均匀设计是在正交试验设计的基础上,创造出的一种新适用于多因素、多水平试验的试验设计方法。 ?均匀设计特别适合需要考察因素因素变化范围较大,且每个因素有较多水平的试验设计问题。 ?二、均匀设计及均匀表的使用 ?均匀设计的基本思想就是让试验点在所考察的试验范围内尽量均匀地分布,为了达到均匀布点目的,与正交设计类似,可以使用均匀设计表(简称均匀表)安排试验,均匀表的表头形式是: ? ? ? ?均匀表U4 ? ?正交表U6 ? ?正交表U6

? ? ?三、均匀表的特点 ? 1.任何一列,各水平仅出现一次; ? 2.任何两列同行数码构成的有序数对仅出现一次; ? 3.均匀表中任两列组成的试验方案不等价; 因此,每个均匀表都附加了使用表,告诉我们如何挑选相应的列按排试验。 ? 4.当因素的水平数增加时,试验次数按水平数增加; ? 5.使用表最多可安排的因素数都比均匀表列数少。只能安排(s/2+1)个因素 ?四、用均匀表安排试验的步骤 ? 1.根据试验的目的,确定考察的指标; ? 2.选择合适的因素和因素的考察范围; ? 3.选择合适该项试验的均匀表,然后根据该表的使用表从中选出列号,将因素分别安排到相应的列号上; ? 4.确定各因素的水平,并将这些因素的水平按所在列的指示分别对号号入座。最后进行试验。 ? 5.对实验结果进行分析,确定最佳的试验方案。 ?例1.在阿魏酸的合成工艺考察中,选取原料配比,吡啶量,反应时间三个因素进行考察,试验的考察指标是阿魏酸的收率。因素的变化范围如下: ?原料配比A:1.0~3.4 ?吡啶量B:10~28(ml) ?反应时间C:0.5~3.5(hr) ?试用均匀设计安排试验。 ?解:对于三个因素,s/2+1=3,求出s=4或5,考虑试验的承受程度,选用U7(76)均匀表安排试验,根据各因素的变化范围,划分因素水平表如下: ?由U7(76)均匀表的配套使用表可知,应选1,2,3列,因而得下面的试验设计表:

均匀设计方法

均匀设计方法 1均匀设计的特点 化学化工实验多为多因素多水平的实验,对此,以往的设计方法通常有全面实验法和正交实验法。 全面实验法是让每个因素的每个水平都有配合的机会,并且配合的次数一样多。一般地全面实验的次数至少是各因素水平数的乘积。该法的优点是可以分析出事物变化的内在规律,结论较精确,但由于试验次数较多,在多因素多水平的情况下常常是不可想象的。如5因素4水平的试验次数为45=1024次,而6因素5水平的试验次数为56=15625次,这在实际中很难做到。 正交实验法是在试验中使用一套规格化的正交表,排出最有代表性的试验,比较合理地节省试验次数,并能从仅做的少数试验中充分得到所需信息。该法的优点是从方案设计到结果分析都完全表格化,试验具有均匀分散、整齐可比性,是安排多因素试验的有效方法,因此被广泛应用。但是有些试验,由于影响因素很多,每个因素变化范围大,水平也多,即使采用正交设计法,试验次数仍嫌太多。对于要求时间紧和昂贵的科学试验,亦不允许安排太多的试验。 对于这种情况,继60年代华罗庚教授倡导、普及的优选法和我国数理统计学者在国内普及推广的正交法之后,于70年代末应航天部第三研究院飞航导弹火控系统建立数学模型、并研究其诸多影响因素的需要,由中国科学院应用数学所方开泰教授和王元教授提出了一种试验设计方法——均匀设计。均匀设计是统计试验设计的方法之一,它与其它的许多试验设计方法,如正交设计、最优设计、旋转设计、稳健设计等相辅相成。 均匀设计是通过一套精心设计的表来进行试验设计的,对于每一个均匀设计表都有一个使用表,可指导如何从均匀设计表中选用适当的列来安排试验。每个表有一个代号U n(q s)或U*n(q s),其中U代表均匀设计;n表示试验次数;q表示水平数;s表示该表最多可安排的因素数。U的右上角加“*”和不加“*”代表两种不同类型的均匀设计表。

常用均匀设计表

1 常用(校园交达电脑最新版)均匀设计表 表1 ) 5(35U 试验号 1 2 3 1 1 2 4 2 2 4 3 3 3 1 2 4 4 3 1 5 5 5 5 表2 ) 5(35U 的使用表 因素个数 列号 D 2 1 2 3 1 2 3 表3 )6(4* 6 U 试验号 1 2 3 4 1 1 2 3 6 2 2 4 6 5 3 3 6 2 4 4 4 1 5 3 5 5 3 1 2 6 6 5 4 1 表4 ) 6(4* 6U 的使用表 因素列 号 D

个数 2 1 3 3 1 2 3 4 1 2 3 4 表5 )7(47U 试验号 1 2 3 4 1 1 2 3 6 2 2 4 6 5 3 3 6 2 4 4 4 1 5 3 5 5 3 1 2 6 6 5 4 1 7 7 7 7 7 表6 )7(47U 的使用表 因素个数 列号 D 2 1 3 3 1 2 3 4 1 2 3 4 表7 )7(4* 7 U 试验号 1 2 3 4 1 1 3 5 7 2 2 6 2 6

3 3 3 1 7 5 4 4 4 4 4 5 5 7 1 3 6 6 2 6 2 7 7 5 3 1 表8 )7(4* 7 U 的使用表 因素个数 列号 D 2 1 3 3 2 3 4 表9 )8(5* 8 U 试验号 1 2 3 4 5 1 1 2 4 7 8 2 2 4 8 5 7 3 3 6 3 3 6 4 4 8 7 1 5 5 5 1 2 8 4 6 6 3 6 6 3 7 7 5 1 4 2 8 8 7 5 2 1 表10 )8(5* 8 U 的使用表 因素个数 列号 D 2 1 3

均匀试验设计

均匀试验设计 主要参考文献: 1、方开泰. 均匀设计与均匀设计表. 北京:科学出版社,1994 2、林维萱. 试验设计方法.大连:大连海事大学出版社,1995 3、栾军. 现在试验设计优化方法. 上海:上海交通大学出版社,1995 4、茆诗松等. 回归分析及其试验设计. 上海:华东师范大学出版社, 1981 一、均匀设计的概念及特点 均匀设计是由我国数学家方开泰教授和王元教授于1978年提出的。1978年,七机部由于导弹设计的要求,提出了一个五因素的试验,希望每个因素的水平数要多于10,而试验总数又不超过50。显然,正交试验设计不能用。 对于一个水平数为m的正交试验,至少要做m2次试验,如m=10时,m2=100,即至少要做100次试验,这在实际中是难于实施的。因此,正交试验设计方法只适用于因素水平数不太多的多因素试验。 正交表的特点是使试验点“均匀分散、整齐可比”。“均匀分散”即均匀性,使试验点均匀分布在试验范围内,让每个试验点都具有一定的代表性,可以用部分试验反映全面试验的情况,大大减少试验次数。“整齐可比”就是综合可比性,使试验结果的分析十分方便,易于分析各因素及其交互作用对试验指标的影响大小及规律性。但是,为了保证整齐可比性(即“均衡搭配”),对任意两个因素而言,必须是全面试验,每个因素的水平必须有重复。这样,试验点在试验范围内就不能充分均匀分散,试验点就不能太少。

综上所述,正交试验为了保证“整齐可比”,使均匀性受到了一定限制,使试验点的代表性还不够强,试验次数不能充分地少,如果不考虑整齐可比(即综合可比)性,而完全保证均匀性,让试验点在试验范围内充分地均匀分散,不仅可大大减少试验点,而且仍能得到反映试验体系主要特征的试验结果。这种从均匀性出发的试验设计,称为均匀试验设计。 均匀试验设计的最大优点是可以节省大量的试验工作量,尤其在试验因素水平较多的情况下,其优势更为明显。例如,一个四因素七水平试验,进行一轮全面试验要做74=2401次,用正交试验也至少要做72 = 49次,而用均匀试验则仅需7次。因此,对于水平数很多的多因素试验,对于试验费用昂贵或实际情况要求尽量少做试验的场合,对于筛选因素或收缩试验范围进行逐步寻优的场合,均匀设计都是十分有效的试验设计方法。 由于均匀设计没有整齐可比性,所以试验结果的处理不能采用方差分析法,而必须用回归分析。因此,试验数据处理较为复杂,这是均匀设计的一个缺点。对于发明均匀设计法的那个年代(1978年),计算机应用尚未普及,这确实是一个大难题,但对于计算机十分普及的今天,则已不是一个难题。再说,多分析数据比多做试验,一般来讲要更为经济。 二、均匀设计表及其使用表 与正交试验设计相似,均匀设计也是通过一套精心设计的表格来安排试验的,这种表称为均匀设计表。 均匀设计表是根据数论方法在多重数值积分中的应用原理构造的,它分为等水平和混合水平两种。 1、等水平均匀设计表

均匀设计试验

均匀设计试验 一、简介 均匀设计是基于试验点在整个试验范围内均匀散布的,从均匀性角度出发提出的一种试验设计方法。它是数论方法中的“伪蒙特卡罗方法”的一个应用。 所有的试验设计方法本质上都是在试验的范围内给出挑选代表性点的方法,均匀设计也是如此。它能从全面试验点中挑选出部分代表性的试验点,这些试验点在试验范围内充分均衡分散,但仍能反映体系的主要特征。例如,正交设计是根据正交性来挑选代表点,它在挑选代表点时有两个特点:均匀分散、整齐可比。“均匀分散”使试验点均衡地布在试验范围内,让每个试验点有充分的代表性,因此,即使在正交表中各列都排满的情况下,也能得到满意的结果;“整齐可比”性使试验结果的分析十分方便,易于估计各因素的主效应和部分交互效应,从而可分析各因素对指标影响的大小及指标的变化规律。但是,为了照顾“整齐可比”,正交设计的试验点并没有能做到充分“均匀分散”,而为了达到“整齐可比”,也使得其试验布点的数目比较多。它必须至少要做次试验(为因素的水平数)。而对于均匀设计,尤其在条件范围变化大而需要进行多水平试验的情况下,均匀设计可极大地降低试验的次数,它只需要与因素水平数相等次数的次试验即可达到正交设计的至少做次试验所能达到的试验效果。 均匀设计只考虑试验点在试验范围内充分“均匀散布”而不考虑“整齐可比”,因此试验的结果没有正交试验结果的整齐可比性,其试验结果的处理多采用回归分析方法。 二、原理 均匀设计的数学原理是数论中的一致分布理论,此方法借鉴了“近似分析中的数论方法”这一领域的研究成果,将数论和多元统计相结合,是属于伪蒙特卡罗方法的范畴。均匀设计只考虑试验点在试验范围内均匀散布,挑选试验代表点的出发点是“均匀分散”,而不考虑“整齐可比”,它可保证试验点具有均匀分布的统计特性,可使每个因素的每个水平做一次且仅做一次试验,任两个因素的试验点点在平面的格子点上,每行每列有且仅有一个试验点。它着重在试验范围内考虑试验点均匀散布以求通过最少的试验来获得最多的信息,因而其试验次数比

常用均匀设计表

常用(校园交达电脑最新版)均匀设计表 表1 ) 5(35U 试验号 1 2 3 1 1 2 4 2 2 4 3 3 3 1 2 4 4 3 1 5 5 5 5 表2 ) 5(35U 的使用表 因素个数 列号 D 2 1 2 0、3100 3 1 2 3 0、4570 表3 )6(4* 6 U 试验号 1 2 3 4 1 1 2 3 6 2 2 4 6 5 3 3 6 2 4 4 4 1 5 3 5 5 3 1 2 6 6 5 4 1 表4 ) 6(4* 6U 的使用表 因素个数 列 号 D 2 1 3 0、1875 3 1 2 3 0、2656 4 1 2 3 4 0、2990 表5 )7(47U 试验号 1 2 3 4

1 1 2 3 6 2 2 4 6 5 3 3 6 2 4 4 4 1 5 3 5 5 3 1 2 6 6 5 4 1 7 7 7 7 7 表6 )7(47U 的使用表 因素个数 列号 D 2 1 3 0、2398 3 1 2 3 0、3721 4 1 2 3 4 0、4760 表7 )7(4* 7 U 试验号 1 2 3 4 1 1 3 5 7 2 2 6 2 6 3 3 1 7 5 4 4 4 4 4 5 5 7 1 3 6 6 2 6 2 7 7 5 3 1 表8 )7(4* 7 U 的使用表 因素个数 列号 D 2 1 3 0、1582 3 2 3 4 0、2132 表9 )8(5* 8 U 试验号 1 2 3 4 5 1 1 2 4 7 8

2 2 4 8 5 7 3 3 6 3 3 6 4 4 8 7 1 5 5 5 1 2 8 4 6 6 3 6 6 3 7 7 5 1 4 2 8 8 7 5 2 1 表10 )8(5* 8 U 的使用表 因素个数 列号 D 2 1 3 0、1445 3 1 3 4 0、2000 4 1 2 3 5 0、2709 表11 )9(59U 试验号 1 2 3 4 5 1 1 2 4 7 8 2 2 4 8 5 7 3 3 6 3 3 6 4 4 8 7 1 5 5 5 1 2 8 4 6 6 3 6 6 3 7 7 5 1 4 2 8 8 7 5 2 1 9 9 9 9 9 9 表12 )9(59U 的使用表 因素个数 列号 D 2 1 3 0、1944 3 1 3 4 0、3102 4 1 2 3 5 0、4066

均匀设计与均匀设计表

第一章试验设计与均匀设计 1、1试验设计 在工农业生产与科学研究中,经常需要做试验,以求达到预期的目的。例如在工农业生产中希望通过试验达到高质、优产、低消耗,特别就是新产品试验,未知的东西很多,要通过试验来摸索 工艺条件或配方。如何做试验,其中大有学问。试验设计得好,会事半功倍,反之会事倍功半,甚至劳而无功。 本世纪30年代,由于农业试验的需要,费歇尔(R、A、Fisher)在试验设计与统计分析方面做出了一系列先驱工作,从此试验设计成为统计科学的一个分支。随后,F、Yates,R、C、 Bose,O、Kempthome,W、G、Cochran,D、R、Cox与G、E、P、Box对试验设计都作出了杰出的贡献,使该分支在理论上日趋完善,在应用上日趋广泛。60年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化,在方法解说方面深入浅出为试验设计的更广泛使用作出了众所周知的贡献。田口玄一的方法对我国试验设计的普及与广泛应用有巨大的影响,70年代我国许多统计学家深入工厂、科研单位,用通俗的方法介绍正交试验设计,帮助工程技术人员进行试验的安排与数据分析,获得了一大批优秀成果,出版了许多成果汇编,举办了不少成果展览会。 在广泛使用试验设计方法的洪流中,必然会出现一些新的问题,这些总就是用原有的各种试验设计方法不能圆满地解决,特别就是当试验的范围较大,试验因素需要考察较多等级(在试验设计中这些等级称之为水平)时,用正交试验及其它流行的试验方法要求做较多的试验,常使得试验者望而生畏。许多实际问题要求一种新的试验方法,它能有效地处理多水平的试验,于就是王元与方开泰于1978年提出了均匀设计(见文献「1-3」),该设计考虑如何将设计点均匀地散布在试验范围内,使得能用较少的试验点获得最多的信息。10多年来,均匀设计在国内得到了广泛应用,并获得

均匀设计与均匀设计表之欧阳家百创编

第一章试验设计和均匀设计 欧阳家百(2021.03.07) 1.1试验设计 在工农业生产和科学研究中,经常需要做试验,以求达到预期的目的。例如在工农业生产中希望通过试验达到高质、优 产、低消耗,特别是新产品试验,未知的东西很多,要通过试验来摸索工艺条件或配方。如何做试验,其中大有学问。试验设计得好,会事半功倍,反之会事倍功半,甚至劳而无功。 本世纪30年代,由于农业试验的需要,费歇尔(R.A.Fisher)在试验设计和统计分析方面做出了一系列先驱工作,从此试验设计成为统计科学的一个分支。随后,F.Yates,R.C. Bose,O.Kempthome,W.G.Cochran,D.R.Cox和G.E.P.Box对试验设计都作出了杰出的贡献,使该分支在理论上日趋完善,在应用上日趋广泛。60年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化,在方法解说方面深入浅出为试验设计的更广泛使用作出了众所周知的贡献。田口玄一的方法对

我国试验设计的普及和广泛应用有巨大的影响,70年代我国许多统计学家深入工厂、科研单位,用通俗的方法介绍正交试验设计,帮助工程技术人员进行试验的安排和数据分析,获得了一大批优秀成果,出版了许多成果汇编,举办了不少成果展览会。 在广泛使用试验设计方法的洪流中,必然会出现一些新的问题,这些总是用原有的各种试验设计方法不能圆满地解决,特别是当试验的范围较大,试验因素需要考察较多等级(在试验设计中这些等级称之为水平)时,用正交试验及其它流行的试验方法要求做较多的试验,常使得试验者望而生畏。许多实际问题要求一种新的试验方法,它能有效地处理多水平的试验,于是王元和方开泰于1978年提出了均匀设计(见文献「1-3」),该设计考虑如何将设计点均匀地散布在试验范围内,使得能用较少的试验点获得最多的信息。10多年来,均匀设计在国内得到了广泛应用,并获得不少好的成果。 试验设计在工业生产和工程设计中能发挥重要的作用,例如: 1)提高产量; 2)减少质量的波动,提高产品质量水准; 3)大大缩短新产品试验周期; 4)降低成本; 5)延长产品寿命。

常用均匀设计表

精品资料 表 2 U 5 (5 ) 3 的使用表 因素个数 列号 D 2 1 2 0.3100 3 1 2 3 0.4570 表 3 U 6 (6 ) * 4 常用(校园交达电脑最新版)均匀设计表 试验号 3 表 1 U 5 (5 ) 1 2 3 1 1 2 4 2 2 4 3 3 3 1 2 4 4 3 1 5 5 5 5 试验号 1 2 3 4 1 1 2 3 6 2 2 4 6 5 3 3 6 2 4 4 4 1 5 3 5 5 3 1 2

2 6 6 5 4 1 表 4 U * (6 4 ) 6 的使用表 表 6 U 7 (7 ) 的使用表 4 因素个数 列 号 D 2 1 3 0.1875 3 1 2 3 0.2656 4 1 2 3 4 0.2990 表 5 4 U 7 (7 ) 试验号 1 2 3 4 1 1 2 3 6 2 2 4 6 5 3 3 6 2 4 4 4 1 5 3 5 5 3 1 2 6 6 5 4 1 7 7 7 7 7 因素个数 列号 D 2 1 3 0.2398 3 1 2 3 0.3721

精品资料 7 7 8 4 1 2 3 4 0.4760 表 7 U * (7 4 ) 试验号 1 2 3 4 1 1 3 5 7 2 2 6 2 6 3 3 1 7 5 4 4 4 4 4 5 5 7 1 3 6 6 2 6 2 7 7 5 3 1 因素个数 表 8 U * (7 4 ) 的使用表 列号 D 2 1 3 0.1582 3 2 3 4 0.2132 表 9 U * ( 85 ) 试验号 1 2 3 4 5 1 1 2 4 7 8 2 2 4 8 5 7 3 3 6 3 3 6

均匀设计与均匀设计表--方开泰

目录 序言 (2) 前言 (4) 第一章试验设计和均匀设计 (5) 1.1试验设计 (5) 1.2试验的因素和水平 (7) 1.3因素的主效应和因素间的交互效应 (9) 1.4全面试验和多次单因素试验 (13) 1.5正交试验法(正交设计) (16) 1.6均匀设计 (18) 1.7均匀设计表的使用 (21) 第二章回归分析简介及其在均匀设计中的应用 (24) 2.1一元线性回归模型 (24) 2.2多元线性回归模型 (29) 2.3二次型回归模型与变量筛选 (31) 2.4应用实例 (32) 2.5寻求最优工艺条件 (35) 第三章均匀设计表的构造和运用 (36) 3.1 均匀设计表的构造 (36) 3.2 均匀性准则和使用表的产生 (39) 3.4 均匀设计和正交设计的比较 (46) 第四章配方均匀设计 (49) 4.1 配方试验设计 (49) 4.2 配方均匀设计 (51) 4.3 有约束的配方均匀设计 (53) 4.4 均匀设计在系统工程中的应用 (56)

序言 在科学实验与工农业生产中,经常要做实验。如何安排实验,使实验次数尽量少,而又能达到好的试验效果呢?这是经常会碰到的问题。解决这个问题有一门专门的学问,叫做“试验设计”。试验设计得好,会事半功倍,反之就会事倍功半了。60年代,华罗庚教授在我国倡导与普及的“优选法”,即国外的斐波那契方法,与我国的数理统计学者在工业部门中普及的“正交设计”法都是试验设计方法。这些方法经普及后,已为广大技术人员与科学工作者掌握,取得一系列成就,产生了巨大的社会效益和经济效益。随着科学技术工作的深入发展,上述两种方法就显得不够了。“优选法”是单变量的最优调试法,即假定我们处理的实际问题中只有一个因素起作用,这种情况几乎是没有的。所以在使用时,只能抓“主要矛盾”,即突出一个因素,而将其他因素固定,这样来安排实验。因此“优选法”还不是一个很精确的近似方法。“正交设计”的基础是拉丁方理论与群论,可以用来安排多因素的试验,而且试验次数对各因素的各水平的所有组合数来说是大大地减少了,但对于某些工业试验与昂贵的科学实验来说,试验仍嫌太多,而无法安排。 1978年,七机部由于导弹设计的要求,提出了一个五因素的试验,希望每个因素的水平数要多于10,而试验总数又不超过50,显然优选法和正交设计都不能用,方开泰教授在几年前,曾为近似计算一个多重积分问题找过我,我向他介绍了多重数值积分的方法并取得了好结果,这就使他想到是否可能用数论方法于试验设计的问题,于是我们经过几个月的共同研究,提出了一个新的试验设计,即所谓“均匀设计”,将这一方法用于导弹设计,取得了成效,我们的文章在80年代初发表后,15年来,均匀设计已在我国有较广泛的普及与使用,取得了一系列可喜的成绩。 均匀设计属于近30年发展起来的“伪蒙特卡罗方法”的范筹。将经典的确定的单变量问题的计算方法推广后用于多变量问题的计算时,计算量往往跟变量个数有关,即使电脑再进步很多,这种方法仍无法实际应用,乌拉母(S.Ulam)与冯诺依曼(J.von Neumann)在40年代提出蒙特卡罗方法,即统计模拟方法,这个方法的大意是将一个分析问题化为一个有同样解答的概率问题,然后用统计模拟的方法来处理后面这个问题,这样使一些困难的分析问题反而得到了解决,例如多重定积分的近似计算。蒙特卡罗方法的关键是找一组随机数作为统计模拟之用,所以这一方法的精度在于随机数的均匀性与独立性。 50年代末,有些数学家试图用确定性方法寻找空间中均匀散布的点集来代替蒙特卡罗方法中的随机数,已经找到的点集都是用数论方法找到的。按照外尔(H. Weyl)定义的测度来度量,它们的均匀性很好,但独立性差些,用这些点集来代替蒙特卡罗方法中的随机数,

0803-第三节 均匀设计表的构造和运用

第三节 均匀设计表的构造和运用 本节介绍均匀设计表的构造和使用表的来源,其中均匀性度量──偏差将起关键作用,我们将介绍偏差的定义,并给出正交设计与均匀设计各自偏差的比较,从中可以了解为什么均匀设计可以比正交设计节省试验次数,本节还介绍拟水平在均匀设计中的使用和有关表的构造,熟悉本节内容对于正确理解和使用均匀设计有很大帮助。 3.1 均匀设计表的构造 定义1 每一个均匀设计表是一个方阵,设方阵有n 行m 列,每一行是{1,2,...,n}的一个置换(即1,2,…,n 的重新排列),表的第一行是{1,2,…,n}的一个子集,但不一定是真子集。 显然,第一章表4-6列举的U 6*(64),U 7(74)和U 7*(74 )都符合上述定义。 符合定义1的均匀设计表数量太多,本节仅介绍用好格子点法(good lattice point)构造的均匀设计表,其方法如下: 1) 给定试验数n ,寻找比n 小的整数h ,且使n 和h 的最大公约数为1。符合这些条件的正整数组成一个向量h =(h 1,…,h m )。 2) 均匀设计表的第j 列下法生成 i ij ih u =[mod n] (3.1) 这里[mod n] 表示同余运算,若jh i 超过n ,则用它减去n 的一个适当倍数,使差落在[1,n] 之中。U i j 可以递推来生成 u h j j 1= ???? ?-++=+n h u h u u j ij j ij j i ,1n h u n h u j ij j ij >+≤+若若1,,1-=n i (3.2) 例如,当n =9 时,符合条件1)的h 有1,2,4,5,7,8;而 h=3 或h=6 时不符合条件1),因为最大公约数(3,9)=3 ,(6,9)=3,均大于1.所以9U 最多只可能有6列,又如当h 34=时,用公式 (3.2) 来生成该列时其结果依次如下: u u u u u u u u u 1323334353637383 93444884123934774112924664101914559 ==+==+===+==+===+==+===+==+,,(mod ),(mod ) ,(mod ), 其结果列于表16的第三列。

均匀设计试验案例

均匀设计 某冶炼厂排出的废水中含有大量的镉、鉮、铅等有害元素,对环境造成严重污染。考察的试验因素为温度(z1)、时间(z2)、碱与硫酸亚铁之比(z3)以及硫酸亚铁用量(z4),每个因素取9个水平。根据使用表可知,我们选取的均匀设计表为U9(95) 表1因素水平表 水平温度(z1)时间(z2)碱与硫酸亚 铁之比(z3)硫酸亚铁用量(z4) 1 1 2 0. 3 48 0.2 2 14 0.4 53.5 0.35 3 17 0.5 59 0.5 4 19. 5 0. 6 64.5 0.65 5 22 0.7 70 0.8 6 24.5 0.8 75.5 0.95 7 27 0.9 81 1.1 8 29.5 1.0 86.5 1.25 9 32 1.1 92 1.4 表2 U9(95)的使用表 因素数列号D 2130.1944 31340.3102

412350.4066 根据因素和水平,可以选择均匀设计表U9(95)。根据U9(95)的使用表,将z1,z2,z3和z4分别安排在U9(95)表的1、2、3、5列(D =0.4066),其试验方案及试验结果如下表。 表3 均匀设计表U9(95) 试验号 列号 12345 112478 224857 336336 448715 551284 663663 775142 887521 999999 表4 均匀设计结果 序号温度(z1)时间(z2)碱与硫酸亚 铁之比(z3)硫酸亚铁 用量(z4) 除镉效率 y 1 1 2 4 8 34 2 2 4 8 7 42 3 3 6 3 6 40

4 4 8 7 5 45 5 5 1 2 4 55 6 6 3 6 3 59 7 7 5 1 2 60 8 8 7 5 1 61 9 9 9 9 9 63 D = 0.4066 (1)直观分析法: 由表可以看出9号试验所得产品的吸盐水能力最强,可以将9号试验对应的条件作为较优的工艺条件。 (2)回归分析 将实验结果表输入到SPSS软件中,进行回归分析,得到以下结果: 输入/移去的变量b 模型输入的变 量 移去的变 量方法 1 z4, z2, z3, z1 . 输入 a. 已输入所有请求的变量。 b. 因变量: y Anova b 模型平方和df 均方 F Sig. 1 回归916.234 4 229.059 58.115 0.001a 残差15.766 4 3.941 模型汇总 模型R R 方调整R方 标准估计的 误差 1 0.992a0.983 0.966 1.98531 a. 预测变量: (常量), z4, z2, z3, z1。

常用均匀设计表

常用均匀设计表-CAL-FENGHAI.-(YICAI)-Company One1

常用(校园交达电脑最新版)均匀设计表 表1 ) 5(35U 试验号 1 2 3 1 1 2 4 2 2 4 3 3 3 1 2 4 4 3 1 5 5 5 5 表2 ) 5(35U 的使用表 因素个数 列号 D 2 1 2 3 1 2 3 表3 )6(4* 6 U 试验号 1 2 3 4 1 1 2 3 6 2 2 4 6 5 3 3 6 2 4 4 4 1 5 3 5 5 3 1 2 6 6 5 4 1 表4 ) 6(4* 6U 的使用表 因素个数 列 号 D 2 1 3 3 1 2 3

4 1 2 3 4 表5 )7(47U 试验号 1 2 3 4 1 1 2 3 6 2 2 4 6 5 3 3 6 2 4 4 4 1 5 3 5 5 3 1 2 6 6 5 4 1 7 7 7 7 7 表6 )7(47U 的使用表 因素个数 列号 D 2 1 3 3 1 2 3 4 1 2 3 4 表7 )7(4* 7 U 试验号 1 2 3 4 1 1 3 5 7 2 2 6 2 6 3 3 1 7 5 4 4 4 4 4 5 5 7 1 3 6 6 2 6 2 7 7 5 3 1 表8 )7(4* 7 U 的使用表

因素个数 列号 D 2 1 3 3 2 3 4 表9 )8(5* 8 U 试验号 1 2 3 4 5 1 1 2 4 7 8 2 2 4 8 5 7 3 3 6 3 3 6 4 4 8 7 1 5 5 5 1 2 8 4 6 6 3 6 6 3 7 7 5 1 4 2 8 8 7 5 2 1 表10 )8(5* 8 U 的使用表 因素个数 列号 D 2 1 3 3 1 3 4 4 1 2 3 5 表11 )9(59U 试验号 1 2 3 4 5 1 1 2 4 7 8 2 2 4 8 5 7 3 3 6 3 3 6 4 4 8 7 1 5 5 5 1 2 8 4 6 6 3 6 6 3

常用均匀设计表

. 常用(校园交达电脑最新版)均匀设计表 表1 ) 5(35U 试验号 1 2 3 1 1 2 4 2 2 4 3 3 3 1 2 4 4 3 1 5 5 5 5 表2 ) 5(35U 的使用表 因素个数 列号 D 2 1 2 0.3100 3 1 2 3 0.4570 表3 )6(4* 6 U 试验号 1 2 3 4 1 1 2 3 6 2 2 4 6 5 3 3 6 2 4 4 4 1 5 3 5 5 3 1 2 6 6 5 4 1 表4 ) 6(4* 6U 的使用表 因素个数 列 号 D 2 1 3 0.1875 3 1 2 3 0.2656

4 1 2 3 4 0.2990 表5 )7(47U 试验号 1 2 3 4 1 1 2 3 6 2 2 4 6 5 3 3 6 2 4 4 4 1 5 3 5 5 3 1 2 6 6 5 4 1 7 7 7 7 7 表6 )7(47U 的使用表 因素个数 列号 D 2 1 3 0.2398 3 1 2 3 0.3721 4 1 2 3 4 0.4760 表7 )7(4* 7 U 试验号 1 2 3 4 1 1 3 5 7 2 2 6 2 6 3 3 1 7 5 4 4 4 4 4 5 5 7 1 3 6 6 2 6 2 7 7 5 3 1

. 表8 )7(4* 7 U 的使用表 因素个数 列号 D 2 1 3 0.1582 3 2 3 4 0.2132 表9 )8(5* 8 U 试验号 1 2 3 4 5 1 1 2 4 7 8 2 2 4 8 5 7 3 3 6 3 3 6 4 4 8 7 1 5 5 5 1 2 8 4 6 6 3 6 6 3 7 7 5 1 4 2 8 8 7 5 2 1 表10 )8(5* 8 U 的使用表 因素个数 列号 D 2 1 3 0.1445 3 1 3 4 0.2000 4 1 2 3 5 0.2709 表11 )9(59U 试验号 1 2 3 4 5 1 1 2 4 7 8 2 2 4 8 5 7 3 3 6 3 3 6 4 4 8 7 1 5

相关主题