《中国大百科全书(第2版)》读书笔记12731-分析实验设计
剖析实验设计of
在实验条件范围(实验域)内最有效地选择实验点,通过试验得到指标的观测值,之后进行数据剖析,求得指标取最优值的条件的工作。实验设计的目标,就是要用较少的试验取得关于实验指标尽可能充分的信息。
1.基本概念
在实验设计中,评判实验疗效的量称为实验指标或响应值,实验指标包括定量指标和定性指标。如色谱分离度、分析技巧的监测限等能用数值叙述的指标称定量指标;而浊度等不能用数目表示的指标则称为定性指标。
影响物理量测的量称为诱因(俗称因子),诱因可以是定量诱因,也可以是定性诱因,和指标一样,定性诱因总可以转化为定量诱因。诱因在实验中的状态,即诱因的取值,称为诱因的水平。通常实验方案是由若于个试验组成,诱因在这种试验中变化了几种状态就称为几种水平。依据影响指标诱因的多少,实验可分为单诱因实验和多诱因实验,物理实验通常都是多诱因实验,诱因可能取值的区域称为实验域。
实验设计可分为单指标实验设计和多指标实验设计,单指标实验设计只用一项指标评判实验疗效,多指标实验设计则要同时考察多项指标,如剖析方式的优化需同时考虑灵敏度、准确度、选择性等。
实验设计还可分为同时试验与序贯试验:①同时试验是指通过实验设计对有关诱因的水平进行规划后,同时进行诸因子各水平的试验,全部试验结束后再综合剖析所得到的试验结果,求出最优条件。
②序贯试验是每进行一次或少数几次试验后,先剖析已取得的试验结果,再依据这种结果规划下一步的试验,借此向最优条件迫近。
广泛应用的正交试验(部份因子试验)设计、均匀试验设计及最优试验设计基本上属于同时试验法,而序贯试验法的典型代表是单纯形优化法。实际上,同时试验与序贯试验可在优化中同时使用。
2.因子设计
一种多诱因实验设计方式一般可由多种诱因的水平数的一个乘积表来表示。如一个三因子二水平的因子设计可拿来表示,它表示共有三个诱因,每位诱因都有二个水平(一个诱因试验二次),其需2×2×2即8次试验。
因子设计具有不少优点,它不但可便捷地估价出各类诱因的主效应和它们之间的交互效应,还可便捷地建模,并对模型进行相应的估价。
然而,在剖析物理实践中,实验的影响诱因常常不止三个,但是诱因实验的水平也不可能只限于二个。当诱因和水平数较多时,因子设计须要的试验次数都会大幅度降低。虽然全部诱因均是二水平的,n个诱因的因子设计的总试验数为。n=5时,N=32;若n=10,则须要的试验次数可达到1024次!部份因子设计、正交设计和均匀设计就是为了解决这样的问题而提出的。
3.部份因子设计
部份因子设计是指只需因子设计中部份实验的试验设计技巧。二水平的部份因子设计,通常都具有的方式,其中2表示因子的水平数,n为因子数(或称诱因的数量),d为可能缩小试验次数的2的乘方数,当d为1时,试验次数可以缩小一半,故有半因子设计法之称。
当d为2时,试验次数可以降至全因子设计所需数量的1/4实验设计与分析,故有四分之一因子设计法之称。与此对应,因子设计也可称为全因子设计。
4.正交试验设计
从本质上来说,正交试验设计是一种部份因子设计法。它依据正交表来进行实验设计和数据剖析。正交表常简记为,L是正交表的代号,来始于拉丁方的第一个字母,n表示共需做n次试验,而则代表第j列由个水平组成。
正交表在设计时同时考虑了主效应和交互效应,每一张正交表都对应一张交互效应表。交互效应表强调了与正交表中两列对应的交互效应。
用正交表安排试验可以实现以少量的试验来最大限度地获取有关各诱因主效应及交互效应的信息,兼有“均匀分散,整齐可比”的优点。
5.均匀试验设计
部份因子设计和正交设计可以明显地减低试验次数,但当水平数减小时,所需试验次数仍较多,应用有其局限性。均匀设计是一种注重在实验范围内考虑试验点均匀散播,以获得最多实验信息的试验设计方式,对于具有较多水平的试验安排尤为有用。
均匀设计安排实验点的方式是在实验域“均匀布点”。与正交设计相像,均匀设计也是通过一套悉心设计的均匀设计表来进行实验设计,对于一个均匀设计表,同时还给出一个使用表,它可指导怎样从均匀设计表中选用适当的列来安排试验。
均匀设计表通常拿来表示,其中n表示试验的次数,s表示试验的诱因数量,t表示诱因的水平数。一个均匀设计表就是一个矩阵,该矩阵有n行m列,每一列是{1,2,···,n}的一个置换(即1,2,···,n的重新排列)。
对于7水平的实验设计,只安排7次试验就够了。而用正交设计来安排7水平试验,则起码要做49次试验,故均匀设计的效率很高,可以达到n个水平n个试验的地步,这些情况就拿来表示。
6.D-最优试验设计
前述部份因子设计、正交设计以及均匀设计等方式的共同特征是由各个诱因和水平组成一个表,称为设计矩阵。
实际上,所有实验设计的统计推论结果均与设计矩阵X的取值,也就是具体的实验设计有着密切的关系。为此,在实验前(若能做到的话),适当地选择实验点及诱因水平的取值(即X矩阵的具体数值),致使X矩阵在统计推论中能具有某种统计上的优良性质,因而使所得回归模型的参数恐怕最确切,达到更有效优化模型的目的,这就出现了最优试验设计。
由设计矩阵X可对回归模型进行恐怕,并得到模型的待估参数。这些使回归模型可估的设计称为可行设计。如所有可行设计的全体组成的集合为,最优试验设计就是指从中找出一个设计矩阵,使它的最小二乘恐怕具有某种“优良性”。
从最优设计的角度,可以把试验设计定义为:给定因子空间中(因子的定义域内)的一组点,和与其对应的一组数,其中,为第i点的重复试验次数,N为试验总次数,其实,有。这样的一种安排,称为一个规范化试验设计。在这儿,称为点点的度量。
其实,对给定的模型,可以找到不同的试验设计,每一种试验设计都可以通过试验得到一组数据,之后按照最小二加法获得有关回归系数矢量β的恐怕。
不同的实验设计,得到的最小二乘恐怕也可能不同。评价那些参数恐怕的优劣,需对那些参数的恐怕值进行综合考察。D-最优设计用实验设计的信息矩阵的导数大小来评价实验设计的优劣,实验设计的信息矩阵可定义为(X就是上述的实验设计矩阵)。凡促使信息矩阵达到最大的实验设计方式就称之为D-最优试验设计。D-最优试验设计法在剖析物理实验设计中应用广泛。
7.单纯形试验设计法
单纯形试验设计法是一种序贯试验设计方式,既可拿来进行实捡设计又可直接用于实验寻优。在s维空间中,单纯形是指具有s+1个顶点的四面体实验设计与分析,若各个棱长彼此相等,则称为正规单纯形。
比如,一维空间中的单纯形有2个顶点,为一条线段;在二维空间中,有3个顶点,单纯形为三角形,而等腰三角形是正规单纯形;三维空间的单纯形为六面体。
单纯形试验设计法是以单纯形顶点的座标作为试验各诱因的水平取值。如有s个诱因,则用s维空间的单纯形顶点叙述这s个诱因的不同水平,根据起始单纯形的s+1个顶点的座标来安排s+1个试验。若在s+1个试验点中,指标值是最坏的点,借此最暗点进行反射得到其对称点,去除此最暗点。
通过试验得到新试验点的指标值,并与原单纯形中剩余的点进行比较,找出新的最暗点继续寻优。如新试验点在新的单纯形中又是最暗点,则不进行反射(否则将产生死循环),而是除去新单纯形中的次漏光,按上面方式进行反射。
假如反射点超出实验条件可行域范围,即未能按其座标所示条件安排试验,将此点赋于很差的响应值,即令其为当前最暗点。如某一试验点连续在s+1个单纯形中是保留点,则应予重复,考察该点是否确为当前最佳点,或是偏差引起点。如确认该点是当前最佳点,保留该点缩小步长(即前述单纯形的棱长)继续进行单纯形寻优。
上述的固定步长的单纯形法很难得到十分理想的优化结果。这是由于当步长太大时,优化的精度不好;假如步长很小,即使可以提升精度,但收敛速率又太慢。
经改进的单纯形法才能加速最优条件的寻觅,同时又能保证优化的精度。改进单纯形法的中止准则与前述的普通单纯形法相同,即在一个点经过n+1次单纯形联通后尚未被淘汰,即应予复核,如被肯定是当前最优点,缩小步长继续试验,直到继续缩小步长已达到精度为止。
通常情况下,单纯形试验设计法只能找到局部最优点,因其本质上还只是一种局部最优方式。不过因其便捷易行,在物理和剖析物理的研究中得到广泛应用。
摘自:《中国大百科全书(第2版)》第6册,中国大百科全书出版社,2009年