中国学术杂志网

设计优化析因对比

 论文栏目:实验探索研究发展论文     更新时间:2012-10-15 11:58:41   

本文作者:程敬丽 郑 敏 楼建晴 单位:浙江大学农业与生物技术学院党委办公室

引言

在工农业生产和科学研究中,经常需要做大量试验,以求达到预期的目的。例如在工农业生产中希望通过试验达到高质、优产、低消耗,特别是在新产品试验中,由于未知的因素很多,需要通过试验来摸索工艺和条件,在这种情况下,试验设计安排妥当与否,直接影响着研究进度与效果。试验设计得好,会事半功倍;反之会事倍功半,甚至劳而无功。如何安排实验能够使实验次数少且实验效果好,就成了人们比较关心的问题。这里就涉及到试验优化设计的问题。所谓试验优化,是指在最优化思想的指导下进行最优设计的一种优化方法。它从不同的优良性出发,合理设计试验方案,有效控制试验干扰,科学处理试验数据,全面进行优化分析,直接实现优化目标。试验优化已成为现代化技术的一个重要方面,析因设计、正交设计、均匀设计及响应面设计是试验优化设计中最常用的几种方法。本文针对这4种优化方法的概念、应用及优缺点等方面进行对比性阐述。

1析因设计

1.1析因设计的定义和特点完全随机、随机区组、拉丁方设计资料的方差分析,均只能分析各因素水平间的差异有无显著性[1],在医药、食品研究中常用到实验中涉及到的两因素有交互作用,这时采用析因设计比较好。析因设计是一种多因素多水平的交叉分组进行全面试验的设计方法。它不仅可检验每个因素各水平间的差异,研究2个或2个以上因素的主效应,而且可检验各因素间的交互作用,通过比较各种组合,可以找出最佳组合[2]。它是一种全面的高统计效率的设计,当因素数目和水平数都不太大,且效应与因素之间的关系比较复杂时,常常采用该种设计。例:在评价药物疗效时,除需知道A药和B药各剂量的疗效外(主效应),还需知道两种药同时使用的交互效应。析因设计及相应的方差分析能分析药物的单独效应、主效应和交互效应。

1.2析因设计表析因设计数据处理均采用方差分析,析因设计对各因素不同水平的全部组合进行试验,故具有全面性和均衡性;析因设计可以提供三方面的重要信息:各因素不同水平的效应大小;各因素间的交互作用;通过比较各种组合,找出最佳组合。通过合理的设计表,对得到的数据进行方差分析,可以求出主效应和交互效应,一般分为:正交互效应(协同作用)———两因素联合(共同)作用大于其单独作用之和;负交互作用(拮抗作用)———两因素联合作用小于其单独作用之和。常用的析因设计表如表1~3所示。

1.3析因设计的优缺点析因设计的优点之一是可以用来分析全部主效应(即各个单因素的作用)和因素之间的各级交互作用的效应(即任何两个因素之间的交互作用效应、任何三个因素之间的交互作用效应等)的大小[3];但有时高阶交互作用是很难解释的,实际工作中常只考虑一、二阶交互作用。析因设计与完全随机设计是有区别的,完全随机析因设计与完全随机设计表面类似,但是其设计理念不同、方差分析方法不同。完全随机设计为单因素设计,不能分析因素间交互作用,析因设计为多因素设计,可以分析交互作用。将析因设计的资料做完全随机设计的方差分析,会掩盖交互作用,得出错误的结论。析因设计比单处理因素设计能提供更多的实验信息,效率高,从得到的信息来看,它节省了组数和例数,可用来分析全部因素的主效应,以及因素间各级的交互作用,在医学上可以用于筛选最佳治疗方案、药物配方、实验条件等研究。缺点是由于所需要的实验次数很多(因该设计的原名也叫做“有重复实验的全因子设计”),故因素过多或因素的水平数过多时,所需要的实验次数太多,研究者常无法承受。当考虑的因素增加时,试验组数呈几何倍数增加,所需试验的次数很多,不但计算复杂,而且给众多交互作用的解释带来困难(比如,4个因素各3个水平的处理数为34=81种)。因此,当因素与水平数都较多时,一般不采用完全交叉分组的析因设计,而采用正交设计。

2正交设计

2.1正交设计的原理正交试验设计是试验优化的一种常用技术。它是建立在概率论、数量统计和实践经验的基础上,运用标准化正交表安排试验方案,并对结果进行计算分析,从而快速找到最优试验方案的一种设计方法[4]。正交试验设计较之于析因设计的优点在于它大大减少了试验次数,提高了工作效率。它的优点来自于它的特点,它是根据正交性从全面试验中挑选出部分有代表性的点进行试验,这些点并不是随便找的点,而是一些具备“均匀分散、齐整可比”的点。然后我们通过对代表性点的试验进行结果分析,进而推广到整体试验,以实现工艺的优化。


2.2正交设计表如何保证正交试验点的均匀分散性和齐整可比性就成了正交设计的关键,这就涉及到正交表的设计和选取。正交表是将正交试验选择的各种水平组合列成表格,然后在具体的设计时,参照表格安排试验方案[5]。正交表是一整套规则的设计表格,用Ln(tq)表示,其中:L为正交表的代号;n为试验的次数;t为水平数;q为列数,也就是可能安排最多的因素个数。例如L9(34),它表示需作9次实验,最多可观察4个因素,每个因素均为3水平(见表4)。一个正交表中也可以各列的水平数不相等,我们称它为混合型正交表,如L8(4×25),此表的5列中,有1列为4水平,4列为2水平。正交表的出现使得试验设计标准化了,从正交表中,我们可以确定出因素的主次效应顺序,同时也可以运用方差分析对试验数据进行分析,分析出各因素对指标的影响程度,从而找出优化条件或最优组合来安排试验。

2.3正交设计的优缺点正交试验设计由于其诸多优点而被广泛应用于科研中。正交设计使用上按表格安排试验,比较方便;其布点均衡,试验次数减少;它能保证主要因素的各种可能都不会漏掉;它能提供一种分析结果(包括交互作用)的方法,结果直观容易分析,且每个试验水平都重复相同次数,可以消除部分试验误差的干扰;因其具有正交性,易于分析出各因素的主效应。但其也有一些缺点:它提供的数据分析方法所获得的优选值,只能是试验所用水平的某种组合,优选结果不会超越所取水平的范围;另外,也不能给进一步的试验提供明确的指向性,使试验仍然带很强的摸索性色彩,不很精确。这样,正交试验法用在初步筛选时显得收敛速度缓慢,难于确定数据变化规律,增加试验次数。尤其在试验工作烦琐、费用昂贵的情况更显突出。

3均匀设计

3.1均匀设计的原理均匀设计[6]是统计试验设计的方法之一,它的发明涉及数论、函数论、试验设计、随机优化、计算复杂性等领域,开创了一个新的研究方向,形成了中国人创立的学派,并获得国际认可,已在国内外诸如航天、化工、制药、材料、汽车等领域得到广泛应用。均匀设计法是一种建立在正交设计上的试验设计方法。均匀设计的数学原理是数论中的一致分布理论,此方法借鉴了“近似分析中的数论方法”这一领域的研究成果,将数论和多元统计相结合,是属于伪蒙特卡罗方法的范畴[7]。与所有的试验设计方法本质一样,其本质是在试验的范围内给出挑选代表性点的方法。与正交设计不同的是,均匀设计只考虑试验点在试验范围内均匀散布,挑选试验代表点的出发点是“均匀分散”,而不考虑“整齐可比”,它可保证试验点具有均匀分布的统计特性,可使每个因素的每个水平做一次且仅做一次试验,任两个因素的试验点点在平面的格子点上,每行每列有且仅有一个试验点。它着重在试验范围内考虑试验点均匀散布以求通过最少的试验来获得最多的信息,因而其试验次数比正交设计明显的减少,使均匀设计特别适合于多因素多水平的试验和系统模型完全未知的情况。例如,当试验中有m个因素,每个因素有n个水平时,如果进行全面试验,共有nm种组合,正交设计是从这些组合中挑选出n2个试验,而均匀设计是利用数论中的一致分布理论选取n个点试验。如某项试验影响因素有5个,水平数为10个,则全面试验次数为105次,即做十万次试验;正交设计是做102次,即做100次试验;而均匀设计只做10次。很明显,均匀设计比正交设计更简便。

3.2均匀设计表和正交设计需要标准正交表一样,均匀设计也需要其专业的标准表,我们称之为均匀设计表[8]。每个均匀设计表有一个代号,其中U表示均匀设计,n表示水平数亦表示试验次数,m表示该表最多可安排的因素数量。如U5(53)(见表5)。右上角加“*”的U表均匀性较好,应优先选用。均匀设计表的列是不平等的,每次试验选取的列与试验因素的数目密切相关。因此,每个均匀设计表都有一个使用表供参考(见表6)。而且适合相同因素的均匀设计表通常不止一个,可根据使用表挑选既满足自己试验因素要求的、均匀性好的,即偏差小的,同时又是试验次数相对较少的均匀设计表[9]。

3.3均匀设计的优缺点均匀设计使得试验次数大大减少,能够自动将各试验因素分为重要与次要,并将因素按重要性排序;同时过程数字化,可通过电脑对结果与因素条件进行界定与预报(如天气预报),进而控制各因素。但同时它也存在一些缺点。由于均匀设计是非正交设计,所以它不可能估计出方差分析模型中的主效应和交互效应,但是它可以估出回归模型中因素的主效应和交互效应[10]。另外,值得注意的是,在具体的试验设计中,不可以一味地只图少的试验次数。除非有很好的前期工作基础和丰富的经验,否则不要企图通过做很少的试验就可达到试验目的,因为试验结果的处理一般需要采用回归分析方法完成,过少的试验次数很可能导致无法建立有效的模型,也就不能对问题进行深入的分析和研究,最终使试验和研究停留在表面化的水平上。一般情况下建议试验的次数取因素数的3~5倍为好。

4响应面设计

4.1响应面设计原理响应面分析是一种优化工艺条件的有效、快速、精确的试验方法,系通过中心组合试验,采用多元线性回归方法为函数估计的工具,将多因素试验中的因素与水平的相互关系用多项式进行拟合,然后对函数的响应面等值线和用回归方程的分析来寻求最优工艺参数,可精确地描述因素与响应值之间的关系[11]。响应面是指响应变量η与一组输入变量(ζ1,ζ2,…,ζk)之间的函数关系式:η=f(ζ1,ζ2,…,ζk)。响应面顾名思义需要一个模型,在实际操作中,需要通过大量的试验,获得大量的试验数据,然后通过多元线性回归方法去建模。建立模型后以两因素水平为X坐标和Y坐标,相应地由模型计算的响应值为Z坐标作出三维空间的曲面。如图1、图2所示。响应面法(RSM)主要有三种常用的试验设计方案:Box-Behnken设计(BBD)、均匀外壳设计(UniformShellDesign,USD)和中心组合设计(CentralCompositeDesign,CCD)。前两种较少使用,中心组合设计是响应曲面中最常用的二阶设计。CCD设计是多因素5水平的实验设计,是在二水平析因设计的基础上加上极值点和中心点构成的[12]。

4.2CCD设计表CCD设计表由三部分组成:①2k或2k×1/2析因设计。②极值点。由于二水平的析因设计只能用作线性考察,需再加上第二部分极值点,才适合于非线性拟合。如果以坐标表示,极值点在坐标轴上的位置称为轴点或星点,表示为(±α,0,…,0),(0,±α,…,0),…,(0,0,…,±α)星点的组数与因素数相同。③一定数量的中心点重复试验。中心点的个数与CCD设计的特殊性质如正交或均一精密有关[13]。不同因素数CCD设计方案见表7。

4.3响应面设计优缺点相比于正交设计和均匀设计,响应面设计法得到的回归方程精度高,能够得到几种因素间交互作用等优点,并且它不是一种点对点之间的优化方法,RSM能够将优化过程延伸到面的程度,呈现三维立体效果。同时RSM能够减少最佳条件下效应的预测值和实测值偏差,具有突出的优越性。当然响应面法也不能完全替代传统的设计,它相对于因子分析,精度仍不够,它要求自变量必须是连续的而且能被试验者自由控制,如果先用CCD找到最优区,再使用因子分析在较小的范围内应用效应面优化法则效果会更好。

4.4响应面的广泛应用20世纪50年代,CCD最先应用于化学工业中,目的在于确定最优操作过程[14]。现在,CCD被频繁地用来确定各种反应物的剂量,使得响应达到最优值或预期值。例如:用于优化各种培养基和有机合成中工艺优化。同时,CCD在其他领域中也发挥了重要的作用。在生物学方面,用于研究反应混合物中各化学反应成分所占比例与其生物学活性之间的关系,确定生物材料的最优试验条件。在食品工业方面,用来确定食品中各成分作用以确定各种成分所占比例和确定最优反应条件。在工程学方面,用于结构优化、可靠性分析和车辆动力学等方面。响应面法还被广泛应用到生态学和环境学等领域中。值得一提的是,在国外影响因子较高的SCI期刊中,响应面更是得到了广泛的应用,具有更高的适用性[15-16]。

5结语

每一项科学理论都是在实践中不断发展和完善的,试验设计方法也不例外。研究发现,如果均匀性测度取得适当,常用的正交设计均可通过均匀设计来获得。此外,人们还提出了正交表型均匀LH设计等方法[17],另外,在某些试验中可以结合几种不同的试验设计方法来安排试验方案[18]。例如先采用析因设计法找出影响较显著的因素,再采用响应面设计进一步优化[19],或者均匀采用正交设计[20]等。这些方法是对单一试验设计方法的补充和完善,同时只有通过实践才能检验其正确性并发挥更大的效益。


学术网收录7500余种,种类遍及
时政、文学、生活、娱乐、教育、学术等
诸多门类等进行了详细的介绍。


实验探索研究发展论文
@2008-2012 学术网
主机备案:200812150017
值班电话
0825-6697555
0825-6698000

夜间值班
400-888-7501

投诉中心
13378216660
咨询电话
唐老师:13982502101
涂老师:18782589406
文老师:15882538696
孙老师:15982560046
何老师:15828985996
江老师:15228695391
易老师:15228695316
其它老师...
咨询QQ
89937509
89937310
89903980
89937302
89937305
89937307
89937308
业务
综合介绍
论文投稿
支付方式
常见问题
会员评价
关于我们
网站简介
版权声明
友情链接
人员招聘
联系我们