第五章-回归设计.ppt-得力文库

资源描述

《第五章-回归设计.ppt》由会员分享，可在线阅读，更多相关《第五章-回归设计.ppt（78页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、5.1 5.1 回归设计的基本概念回归设计的基本概念5.2 Box5.2 BoxBenhkenBenhken设计设计5.3 5.3 二次回归的中心组合设计二次回归的中心组合设计5.4 5.4 二次回归正交设计二次回归正交设计5.5 5.5 二次回归旋转设计二次回归旋转设计5.6 D5.6 D最优混合设计最优混合设计第五章第五章回归设计回归设计5.1 回归设计的基本概念回归设计的基本概念回归设计方法是由英国统计学家回归设计方法是由英国统计学家G.BoxG.Box在在2020世世纪纪5050年代初针对化工生产提出的。年代初针对化工生产提出的。回归设计也称为响应面设计，目的是寻求试回归设计也称为

2、响应面设计，目的是寻求试验指标与各定量因子间的定量规律，找到工作验指标与各定量因子间的定量规律，找到工作条件的最优值（最优工艺、最佳配方等）。条件的最优值（最优工艺、最佳配方等）。它是在多元线性回归的基础上用主动收集数它是在多元线性回归的基础上用主动收集数据的方法获得具有较好性质的回归方程的一种据的方法获得具有较好性质的回归方程的一种试验设计方法。试验设计方法。5.1.1 回归分析回归分析数据处理由被动变主动数据处理由被动变主动古典的回归分析方法只是被动地处理已有的试验数据，古典的回归分析方法只是被动地处理已有的试验数据，对试验点的安排不提任何要求，试验点散乱而不均匀，预对试验点的安排不提任

3、何要求，试验点散乱而不均匀，预测值的标准误很大，且对于回归方程的精度研究也很少。测值的标准误很大，且对于回归方程的精度研究也很少。其后果：其后果：（1 1）盲目增加试验次数盲目增加试验次数，这些试验数据还不能提供充分，这些试验数据还不能提供充分的信息，在许多复因子试验问题中达不到试验目的。的信息，在许多复因子试验问题中达不到试验目的。（2 2）对模型的合适性有时无法检验对模型的合适性有时无法检验，因为在被动处理数，因为在被动处理数据时在同一试验点上不一定存在重复试验数据。据时在同一试验点上不一定存在重复试验数据。为了适应寻求最佳工艺、最佳配方、建立生产过程的数为了适应寻求最佳工艺、最佳配方、建

4、立生产过程的数学模型等的需要，人们就要求以较少的试验次数建立精度学模型等的需要，人们就要求以较少的试验次数建立精度较高的回归方程。较高的回归方程。为此，要求摆脱古典回归分析的被动局面，主动把试验为此，要求摆脱古典回归分析的被动局面，主动把试验的安排、数据的处理和回归方程的精度统一起来考虑，即的安排、数据的处理和回归方程的精度统一起来考虑，即根据试验目的和数据分析的要求来选择试验点，不仅使得根据试验目的和数据分析的要求来选择试验点，不仅使得在每一个试验点上获得的数据含有最大的信息，从而减少在每一个试验点上获得的数据含有最大的信息，从而减少试验次数，而且使数据的统计分析具有一些较好的性质。试验次数

5、，而且使数据的统计分析具有一些较好的性质。这就是二十世纪五十年代发展起来的这就是二十世纪五十年代发展起来的“回归设计回归设计”所研所研究的问题。究的问题。回归设计的分类：回归设计的分类：根据建立的回归方程的次数不同，回归设计通常有一次根据建立的回归方程的次数不同，回归设计通常有一次回归设计、二次回归设计等；回归设计、二次回归设计等；根据设计的性质又有正交设计、旋转设计、通用设计和根据设计的性质又有正交设计、旋转设计、通用设计和最优设计等。最优设计等。本章仅介绍二次回归的各种设计方法。本章仅介绍二次回归的各种设计方法。5.1.2 多项式回归模型多项式回归模型在一些试验中希望建立试验指标在一些试

6、验中希望建立试验指标 y 与各个定与各个定量因子量因子之间关系的定量表达式，之间关系的定量表达式，即回归方程，以便通过该回归方程找出使指标即回归方程，以便通过该回归方程找出使指标满足极值要求的各因子的取值。满足极值要求的各因子的取值。可以假定可以假定 y与与间有如下关系：间有如下关系：这这里里是是的的一一个个函函数数，其图形也称为响应曲面。其图形也称为响应曲面。是是随随机机误误差差，通通常常假假定定它它服服从从均均值值为为0 0，方差为方差为的正态分布。的正态分布。试验设计中，我们称试验设计中，我们称为因子或自变量。为因子或自变量。称称的可能取值的空间为因子空间。的可能取值的空间

7、为因子空间。我们的任务就是从因子空间中寻找一个最佳工艺我们的任务就是从因子空间中寻找一个最佳工艺条件（最优点）条件（最优点），使，使y满足要求。满足要求。当当f 的函数形式已知时，可以通过最优化的方法的函数形式已知时，可以通过最优化的方法去寻找去寻找。在许多情况下。在许多情况下f 的形式并不知道，这的形式并不知道，这时常常用一个多项式去逼近它，即假定：时常常用一个多项式去逼近它，即假定：这里各这里各为未知参数，称为回为未知参数，称为回归系数，通常需要通过试验数据对它们进行估计。归系数，通常需要通过试验数据对它们进行估计。在实际中常用如下的一次与二次回归方程：在实际中常用如下的一次与二次回归

8、方程：若用若用表示相应的估计，则称表示相应的估计，则称为为y关于关于的的多项式回归方程多项式回归方程。5.1.3 多元线性回归多元线性回归多项式回归模型，在对变量作了变换并重新命名后也可多项式回归模型，在对变量作了变换并重新命名后也可以看成是一个多元线性回归模型。比如对二次回归模型以看成是一个多元线性回归模型。比如对二次回归模型令令即变成五元线性回归模型。即变成五元线性回归模型。1 1回归模型回归模型假定回归模型为：假定回归模型为：记随机变量的观测向量为记随机变量的观测向量为回归参数向量为回归参数向量为，随机误差向量为，随机误差向量为结构矩阵结构矩阵上述模型可以表示为矩阵形式：上述

9、模型可以表示为矩阵形式：2回归系数的最小二乘估计回归系数的最小二乘估计估计回归模型中回归系数的方法是最小二乘法。估计回归模型中回归系数的方法是最小二乘法。记回归系数的最小二乘估计为记回归系数的最小二乘估计为，应满足，应满足如下正规方程组：如下正规方程组：当当存在时，最小二乘估计为：存在时，最小二乘估计为：在求得了最小二乘估计后，可以写出回归方程：在求得了最小二乘估计后，可以写出回归方程：3对回归方程的显著性检验对回归方程的显著性检验对回归方程的显著性检验是指检验如下假设：对回归方程的显著性检验是指检验如下假设：H0：H1：不全为不全为0 则平方和分解式则平方和分解式其中其中为残差平

10、方和，自由度为为残差平方和，自由度为为回归平方和，自由度为为回归平方和，自由度为当当H0为真时，有为真时，有给定的显著性水平给定的显著性水平，拒绝域为拒绝域为 4失拟检验失拟检验当在某些点有重复试验数据，便可以对试验指标当在某些点有重复试验数据，便可以对试验指标 y 的期的期望是否是望是否是的函数进行检验，这种检验称为失拟的函数进行检验，这种检验称为失拟检验，它检验如下假设：检验，它检验如下假设：当当在在有有些些试试验验点点上上有有mi重重复复试试验验时时，试试验验点点为为n，总总试试验验次次数数为为N，残残差差平平方方和和可可进进一一步步分分解解为为组组内内平平方方和和与与组组间

11、间平平方方和和，其其中中组组内内平平方方和和就就是是纯纯误误差差平平方方和和，记记为为，组组间平方和称为失拟平方和，记为间平方和称为失拟平方和，记为，即：，即：，检验统计量为检验统计量为在在H H0 0为真时，为真时，对于给定的显著性水平，对于给定的显著性水平下，拒绝域为：下，拒绝域为：当拒绝当拒绝H H0 0时，需要寻找原因，改变模型，否则接受线性回时，需要寻找原因，改变模型，否则接受线性回归模型合适，可以将归模型合适，可以将S Se e与与S SLfLf合并作为合并作为S SE E检验方程是否显著。检验方程是否显著。其中其中 5对回归系数的显著性检验对回归系数的显著性检验当回归方

12、程显著时，可进一步检验某个回归系数是否为当回归方程显著时，可进一步检验某个回归系数是否为0 0，也即检验如下假设：也即检验如下假设：每一项回归系数每一项回归系数j=1,2,=1,2,p逐一进行。逐一进行。常用的检验方法是常用的检验方法是t t检验或等价的检验或等价的F F检验，检验，F F统计量为：统计量为：其中其中是是中的第中的第j j+1+1个对角元素。个对角元素。记分子为记分子为，它是因子，它是因子的回归平方和。的回归平方和。分母分母是模型中是模型中的无偏估计。的无偏估计。当当H H0j0j为真时，有为真时，有。给定的显著性水平给定的显著性水平，当，当时拒绝原假时拒绝原

13、假设设H H0j0j，即认为，即认为显著不为零，回归关系显著；否则人为显著不为零，回归关系显著；否则人为回归关系不显著，可以将对应的变量从回归方程中删除。回归关系不显著，可以将对应的变量从回归方程中删除。注：当有不显著的系数时，一般情况下一次只能删除注：当有不显著的系数时，一般情况下一次只能删除一个一个F F值最小的变量，重新计算回归系数，再重新检验。值最小的变量，重新计算回归系数，再重新检验。通常要到余下的系数都显著时为止。通常要到余下的系数都显著时为止。5.1.4 因子水平的编码因子水平的编码在回归问题中各因子的量纲不同，其取值的范围也不在回归问题中各因子的量纲不同，其取值的范围也不同

14、，为了数据处理的方便，对所有的因子作一个线性变同，为了数据处理的方便，对所有的因子作一个线性变换，使所有因子的取值范围都转化为中心在原点的一个换，使所有因子的取值范围都转化为中心在原点的一个单位单位“立方体立方体”中，这一变换称为对因子水平的编码。中，这一变换称为对因子水平的编码。方法如下：方法如下：设因子设因子的取值范围为：的取值范围为：与与分别为因子分别为因子的下水平的下水平()()与上水平与上水平()()其中心也称为零水平：其中心也称为零水平：因子的变化半径为因子的变化半径为令编码值令编码值，而实际值，而实际值此变换式就称为此变换式就称为“编码变换编码变换”例例5.1.1 5

15、.1.1 因子因子z z的取值范围为：的取值范围为：1030，对其作编码：对其作编码：编码后，编码后，10对应对应-1，30对应对应1，20对应对应0。变换后，正交点在编码空间变换后，正交点在编码空间为中心在原点的立方体，其边为中心在原点的立方体，其边长为长为2 2。编码变换后，编码变换后，z zm m对应的编码为对应的编码为，z zM M对应的编码为对应的编码为，z z0 0对应的对应的编码为编码为0 0。这样不管什么取值范。这样不管什么取值范围，都转化为值域围，都转化为值域-1,1-1,1或或-,-,。见示意图。见示意图。5.2 BoxBoxBenhkenBenhken设计设计BoxB

16、oxBehnkenBehnken设计是由统计学家设计是由统计学家BoxBox和和BehnkenBehnken 提出的一种比较常用的回归设计提出的一种比较常用的回归设计方法，适用于方法，适用于2 2至至5 5个因子的优化实验。个因子的优化实验。BoxBoxBehnkenBehnken设计首先假定实验范围内设计首先假定实验范围内因子存在二次项，其基试验点的选取为编因子存在二次项，其基试验点的选取为编码立方体的每条棱的中点，即码立方体的每条棱的中点，即任意两因子任意两因子做做2 22 2交互，而交互，而其它因子固定在其它因子固定在0 0水平水平。再加上中心点。再加上中心点。三因子三因子Box-Box

17、-BehnkenBehnken设计设计试验点示意图试验点示意图BoxBoxBenhkenBenhken设计设计例题例题：对超高压杀灭枯草芽孢：对超高压杀灭枯草芽孢杆菌效果杆菌效果Y Y的研究发现：温度、的研究发现：温度、压力、保压时间是灭活枯草芽压力、保压时间是灭活枯草芽孢杆菌显著影响因子。孢杆菌显著影响因子。研究结果表明杀灭研究结果表明杀灭6 6个数量个数量级的枯草芽孢杆菌的杀菌条件：级的枯草芽孢杆菌的杀菌条件：温度为温度为T T=30=306060，压力为，压力为P P=200=200600 600 MPaMPa，保压时间为，保压时间为M M=10=1020min20min，试分析最优杀

18、，试分析最优杀菌工艺参数。菌工艺参数。BoxBoxBenhkenBenhken设计设计BoxBoxBenhkenBenhken设计设计题解：题解：本试验采用本试验采用Box-Box-BehnkenBehnken设计，以温设计，以温度度T T，压力，压力P P，保压时间，保压时间M M 三个外界因子为自三个外界因子为自变量，并以变量，并以+1+1、0 0、-1-1分别代表自变量的高、分别代表自变量的高、中、低水平，对自变量进行编码。中、低水平，对自变量进行编码。超高压杀灭菌的数量级超高压杀灭菌的数量级Y Y为响应值（为响应值（Y Y=-=-loglog1010 N Nt t/N/N0 0，即经超

19、高压作用后枯草芽孢，即经超高压作用后枯草芽孢杆菌死亡的数量级，杆菌死亡的数量级，N Nt t为超高压处理后为超高压处理后1ml1ml菌液中的活菌数，菌液中的活菌数，N N0 0为对照为对照1ml1ml菌液中的活菌液中的活菌数）菌数）BoxBoxBenhkenBenhken设计设计因子因子代号代号水平水平编码-1-10 01 1温度温度()()T T303045456060压力力(MPaMPa)P P200200400400 600600保保压时间(min)(min)M M101015152020试验因子的水平及编码表试验因子的水平及编码表BoxBoxBenhkenBenhken设计设计试验设计

20、与试验结果列表试验设计与试验结果列表Trial No.Trial No.T TP PMMY Y1 1-1-10 0-1-14.274.272 21 10 0-1-15.445.443 3-1-10 01 15.115.114 41 10 01 15.795.795 5-1-1-1-10 02.112.116 61 1-1-10 03.213.217 7-1-11 10 06.046.048 81 11 10 06.876.879 90 0-1-1-1-12.702.7010100 0-1-11 13.443.4411110 01 1-1-16.236.2312120 01 11 16.436.

21、4313130 00 00 05.455.4514140 00 00 05.325.3215150 00 00 05.675.6716160 00 00 05.435.4317170 00 00 05.235.23BoxBoxBenhkenBenhken设计设计分析结果分析结果Factor DF SS MS F PT 4 2.041247 0.510312 13.67 0.0020P 4 26.797874 6.699469 179.46 .0001M 4 0.716485 0.179121 4.80 0.0352 在在0.050.05水平下，只有温度（水平下，只有温度（T T）压力（）压力（

22、P P）和保压时间（和保压时间（M M）与灭菌效果都存在显著的）与灭菌效果都存在显著的回归关系。回归关系。在在T=60.37,P=663.87,M=13.51 T=60.37,P=663.87,M=13.51 时，灭菌时，灭菌效果最大，达到效果最大，达到6.796.79。需要进行试验验证。需要进行试验验证。BoxBoxBenhkenBenhken设计设计T=60.37,P=663.87,M=13.51T=60.37,P=663.87,M=13.51时，极大值时，极大值Y=6.79Y=6.795.3 二次回归的中心组合设计二次回归的中心组合设计一、中心组合设计方案一、中心组合设计方案中心组合

23、设计中的试验点由三部分组成：中心组合设计中的试验点由三部分组成：（1 1）将将编编码码值值-1-1与与1 1看看成成每每个个因因子子的的两两个个水水平平，采采用用二二水水平平正正交交表表安安排排试试验验，可可以以是是全全因因子子试试验验，也也可可以以是是其其1/21/2实实施施，1/41/4实实施施等等，称称这这种种试试验验点点为为正正交交点点。这这样样的点有的点有mc c=2=2p个，选取正交表的个，选取正交表的p个基本列构成。个基本列构成。（2 2）在在每每一一因因子子的的坐坐标标轴轴上上取取两两个个试试验验点点，该该因因子子的的编编码码值值分分别别为为 -与与，其其它它因因子子的的编编

24、码码值值为为0 0。由由于于有有p个个因因子子，因因此此这这部部分分试试验验点点共共有有2 2p个个。称称这这种种试试验验点点为为星号点星号点或或主轴点主轴点。（3 3）在在试试验验区区域域的的中中心心进进行行m0 0次次重重复复试试验验，这这时时每每个因子的编码值均为个因子的编码值均为0 0。称这种试验点为。称这种试验点为中心点中心点。如如p=2=2的中心组合设计方案是：的中心组合设计方案是：如如p=2=2的中心组合设计试验点的分布图的中心组合设计试验点的分布图二、中心组合设计方案的特点二、中心组合设计方案的特点该方案总试验次数该方案总试验次数n为：为：每个因子都取每个因子都取5 5个水平

25、，故该方案所布的试验点个水平，故该方案所布的试验点范围较广。范围较广。该方案还有较大的灵活性，因为在方案中留有该方案还有较大的灵活性，因为在方案中留有两个待定参数两个待定参数 m0 0（中心点的试验次数）和（中心点的试验次数）和（主轴点的位置），使二次回归设计具有正交性、（主轴点的位置），使二次回归设计具有正交性、旋转性等。旋转性等。中心点处的中心点处的m0 0次重复，可以准确估计试验误差，次重复，可以准确估计试验误差，从而使对方程与系数的检验有了可靠依据。从而使对方程与系数的检验有了可靠依据。5.4 二次回归正交设计二次回归正交设计二次回归正交设计二次回归正交设计是是二次回归中心组合设计

26、二次回归中心组合设计的一的一种常用设计方法。种常用设计方法。如果一个设计具有正交性，则数据分析将是十分如果一个设计具有正交性，则数据分析将是十分方便的，由于所得的回归系数的估计值之间互不相方便的，由于所得的回归系数的估计值之间互不相关，因此删除某些因子时不会影响其它的回归系数关，因此删除某些因子时不会影响其它的回归系数的估计，从而很容易写出所有回归系数为显著的回的估计，从而很容易写出所有回归系数为显著的回归方程。归方程。我们可以适当选择我们可以适当选择m0 0与与使二次回归中心组合设使二次回归中心组合设计具有正交性。计具有正交性。5.4.1 二次中心组合设计的结构矩阵二次中心组合设计的结构矩

27、阵X X与系数矩阵与系数矩阵 p=2=2的中心组合设计回归模型的结构式为的中心组合设计回归模型的结构式为结构矩阵如下：结构矩阵如下：x0 x1 x2 x1x2 (x1)2(x2)2这里这里mc=4，2p=4，则，则n=mc+2p+m0=8+m0，再记，再记那么那么各平方项所对应的行、列在非对角线都有非各平方项所对应的行、列在非对角线都有非0 0元素元素5.4.2 正交性的实现正交性的实现要使中心组合设计具有正交性，就要求要使中心组合设计具有正交性，就要求为对角阵。为对角阵。首首先先利利用用“中中心心化化”变变换换使使各各平平方方项项列列的的和和为为0 0，为为此此把把列的元素减去该列的均

28、值，而此时的列的元素减去该列的均值，而此时的阵为：阵为：这里这里GG是是p阶对称方阵：阶对称方阵：为使设计成为正交的只要设法使为使设计成为正交的只要设法使g=0因为因为 n=mc+2p+m0设定设定 m0后，因此可以适当选取后，因此可以适当选取使使 g=0。对不同的因子个数对不同的因子个数 p 与中心点重复次数与中心点重复次数 m0，对对应的值见表应的值见表5.4.1。表表5.4.1 二次回归正交设计的参数二次回归正交设计的参数值表值表 1 1回归系数的估计回归系数的估计在对在对列作了中心化变换后，我们可以首先建立列作了中心化变换后，我们可以首先建立y 关于关于诸诸的回归方程：的回

29、归方程：再记再记，其中，其中则各项回归系数：则各项回归系数：5.4.3 统计分析统计分析2对回归方程与回归系数的检验对回归方程与回归系数的检验由于是正交设计，各项由于是正交设计，各项的回归平方和为的回归平方和为总回归平方和为总回归平方和为仍然用仍然用表示总平方和，其自由度为表示总平方和，其自由度为，则残差，则残差平方和为平方和为回归方程的检验：回归方程的检验：若在中心点上有重复试验的话，还可以进一步对若在中心点上有重复试验的话，还可以进一步对进行进行分解：分解：则失拟项：则失拟项：可用可用对二次回归模型的合适性进行检验。对二次回归模型的合适性进行检验。各项回归系数可用各项回

30、归系数可用进行检验。进行检验。例例5.4.1 5.4.1 为提高钻头的寿命，在数控机床上进行试验，为提高钻头的寿命，在数控机床上进行试验，考察钻头的寿命与钻头轴向振动频率考察钻头的寿命与钻头轴向振动频率F F及振幅及振幅A A的关系。的关系。在试验中，在试验中，F F与与A A的变动范围分别为：的变动范围分别为：125 Hz125 Hz，375Hz375Hz与与1.51.5，5.55.5，采用二次回归正交组合设计，并在中心点重复，采用二次回归正交组合设计，并在中心点重复进行三次试验。进行三次试验。1对因子的取值进行编码对因子的取值进行编码现在有两个因子，即现在有两个因子，即p=2=2，现在中

31、心点进行三次试验，现在中心点进行三次试验，即即m0 0=3=3，则查得此二次回归正交组合设计中的，则查得此二次回归正交组合设计中的 =1.148=1.148。因子因子F F与与A A的零水平分别是的零水平分别是250250，3.5;3.5;它们的变化半径它们的变化半径分别是分别是109109，1.74.1.74.因子编码值见表因子编码值见表5.4.45.4.4。5.4.4 2试验计划与试验结果试验计划与试验结果本例的试验计划及试验结果见表本例的试验计划及试验结果见表5.4.5。表表5.4.5 5.4.5 试验计划与试验结果试验计划与试验结果 5.4.6 3参数估计参数估计4.模型、方程及系数

32、的检验模型、方程及系数的检验本例中由于在中心点有本例中由于在中心点有3 3次重复试验，所以在给出所得到次重复试验，所以在给出所得到的回归方程之前，先对模型的合适性、方程及系数作显著的回归方程之前，先对模型的合适性、方程及系数作显著性检验：性检验：中心点上中心点上3 3次试验结果的平均值为次试验结果的平均值为 =206=206，由此求得纯，由此求得纯误差平方和误差平方和 S Se e=1026=1026，从而失拟平方和为：从而失拟平方和为：S SLfLf=1281.53-1026=255.53=1281.53-1026=255.53，失拟检验的统计量为：失拟检验的统计量为：在在时，时，所以认

33、为模型合适。，所以认为模型合适。有关方程与系数的检验见表有关方程与系数的检验见表5.4.75.4.7。由于由于，所以认为方程显著。又，所以认为方程显著。又，。所以。所以与与的系数在显著性水平的系数在显著性水平0.050.05上是上是显著的，显著的，x x2 2的系数在显著性水平的系数在显著性水平0.100.10上是显著的。上是显著的。5.4.75.写出二次回归方程并求最佳条件写出二次回归方程并求最佳条件我们可以写出在我们可以写出在0.100.10水平上各系数都显著的回归方程为：水平上各系数都显著的回归方程为：再将再将(5.4.16)(5.4.16)代入，即可得代入，即可得y关于关于x

34、1 1,x2 2的二次回归方程：的二次回归方程：最后再将编码式最后再将编码式代入，即可得代入，即可得y关于关于F，A的二次回归方程：的二次回归方程：为延长寿命，可以将回归方程对为延长寿命，可以将回归方程对F F与与A A分别求导，并令其分别求导，并令其为零以解出最佳水平组合为为零以解出最佳水平组合为F=291.58F=291.58，A=3.50A=3.50，在该水平，在该水平组合下，平均寿命的估计是组合下，平均寿命的估计是211.6211.6。5.5 二次回归旋转设计二次回归旋转设计5.5.1 旋转性旋转性回归正交设计的最大优点是试验次数较少，计算简便，回归正交设计的最大优点是试验次数较少，

35、计算简便，又消除了回归系数间的相关性。又消除了回归系数间的相关性。但是其缺点是预测值的方差依赖于试验点在因子空间中但是其缺点是预测值的方差依赖于试验点在因子空间中的位置。由于误差的干扰，试验者不能根据预测值直接寻的位置。由于误差的干扰，试验者不能根据预测值直接寻找最优区域。找最优区域。若能使二次设计具有若能使二次设计具有旋转性旋转性，即能使与试验中心距离相，即能使与试验中心距离相等等()的点上预测值的方差相等，即的点上预测值的方差相等，即VarVar()=()=f()，那，那就有助于克服上述缺点。就有助于克服上述缺点。所以试验者常常希望牺牲部分的正交性而获得旋转性，所以试验者常常希望牺牲部分的

36、正交性而获得旋转性，计算的工作量可以交由计算机帮助处理。计算的工作量可以交由计算机帮助处理。5.5.2 二次旋转设计二次旋转设计一一个个中中心心组组合合设设计计要要成成为为二二次次旋旋转转设设计计应应满满足足旋旋转转性性条件和非退化条件。条件和非退化条件。1.二次设计的旋转性条件二次设计的旋转性条件二次设计的旋转性条件为：二次设计的旋转性条件为：2.2.二次旋转设计的非退化条件：二次旋转设计的非退化条件：为使设计是使矩阵为使设计是使矩阵不退化，就要求试验点的分不退化，就要求试验点的分布满足：布满足：在中心组合设计方案中在中心组合设计方案中n个试验点分布在三个不同半径个试验点分布在三个不同

37、半径的球面上，其中：的球面上，其中：个点分布在半径为个点分布在半径为的球面上；的球面上；2 2p个点分布在半径为个点分布在半径为的球面上；的球面上；个点分布在半径为个点分布在半径为的球面上。的球面上。满足不会使矩阵满足不会使矩阵退化的条件。退化的条件。3.的选取的选取为使设计满足旋转性条件只要适当选取参数为使设计满足旋转性条件只要适当选取参数，在中心组，在中心组合设计中有：合设计中有：因此因此，为使设计具有旋转性，则要求，为使设计具有旋转性，则要求即只要：即只要：或或当对中心组合设计提出进一步的要求时，可以确定设计中当对中心组合设计提出进一步的要求时，可以确定设计中的另一个参

38、数的另一个参数m0 0。5.5.3 二次回归正交旋转设计二次回归正交旋转设计（Orthogonal）当要求一个回归设计不仅具有当要求一个回归设计不仅具有旋转性旋转性，还要求具有，还要求具有正交正交性性，或至少是近似正交的，称为，或至少是近似正交的，称为二次回归正交旋转设计二次回归正交旋转设计。这需要使这需要使的非对角线元素全为的非对角线元素全为0 0，即只需要：，即只需要：在在g的表达式中，的表达式中，mc c是给定的，因为满足旋转性是给定的，因为满足旋转性也已也已确定，式中确定，式中，所以，所以g只是只是m0 0的函数，所的函数，所以可解出以可解出m0 0。如果解得的如果解得的m0 0

39、是整数，则所得设计为正交旋转设计；是整数，则所得设计为正交旋转设计；如果如果m0 0不是整数，则取最接近的整数，这时是近似正交不是整数，则取最接近的整数，这时是近似正交的旋转设计。的旋转设计。二次回归正交（或近似正交）旋转组合设计的参数二次回归正交（或近似正交）旋转组合设计的参数与与m0 0见表见表5.5.15.5.1。表表5.5.1 二次回归正交旋转组合设计参数二次回归正交旋转组合设计参数5.5.4 二次回归通用旋转设计二次回归通用旋转设计(Uniform Precision)所谓一个设计具有所谓一个设计具有通用性通用性是指在与编码中心距离小于是指在与编码中心距离小于1 1的任意点的任意点

40、(x1 1,x2 2,xp p)上的预测值的方差近似相等上的预测值的方差近似相等。一一个个旋旋转转设设计计各各点点预预测测值值的的方方差差仅仅与与该该点点到到中中心心的的距距离离有有关关，即即VarVar()=)=f()。而而通通用用设设计计要要求求当当1|t|X17.8188740.2843927.493460.0001X2-8.566080.28439-30.12090.0001X310.80570.2843937.996020.0001X1*X1-0.706850.276846-2.553230.028705X1*X2-1.90.371574-5.113390.000455X1*X32.

41、70.3715747.2663920.0001X2*X2-0.017410.276846-0.06290.951088X2*X3-0.350.371574-0.941940.368422X3*X3-3.464570.276846-12.51440.00015.5.去掉不显著的项重新回归去掉不显著的项重新回归模型检验模型检验SourceDFSSMSFPrFModel73695.62527.9458526.6410.0001Error1212.029731.002478(Lackoffit)78.9213971.2744852.050110.223309(PureError)53.1083330.

42、621667Total193707.656.6.重新回归后重新回归后参数估计参数估计TermEstimateStdErrtPr|t|X17.8188740.27093328.859050.0001X2-8.566080.270933-31.6170.0001X310.80570.27093339.883270.0001X1*X1-0.705120.262443-2.686770.019788X1*X2-1.90.353991-5.367370.000169X1*X32.70.3539917.6273110.0001X3*X3-3.462850.262443-13.19470.00017.7.回

43、归方程及其驻点回归方程及其驻点Y1=43.096+7.819*X1-8.5669*X2+10.806*X3-0.705*X1*X1-1.9*X1*X2+2.7*X1*X3-0.463*X3*X3驻点处驻点处X1-4.53107鞍点鞍点X26.711891Y=-6.296 X3-0.54514特征值特征值0.865802-1.02896-4.02568 在驻点处其二次型矩阵特征值有正有负，此驻点为鞍点，在驻点处其二次型矩阵特征值有正有负，此驻点为鞍点，不存在极值，需进行岭脊分析。不存在极值，需进行岭脊分析。8.8.岭脊分析岭脊分析半径半径Y预测值预测值标准误标准误X1X2X3043.110318

44、0.4286350000.145.7716310.4272330.086905-0.0932550.1097060.248.4318250.4238690.180418-0.1906540.2103300.351.1010420.4211250.278880-0.2914100.3030960.453.7871420.4233790.381000-0.3948910.3891690.556.4962010.4364940.485803-0.5006040.4695790.659.2329320.4666900.592567-0.6081610.5452040.762.0010150.51880

45、80.700760-0.7172610.6167770.864.8033500.5951280.809989-0.8276660.6849050.967.6422440.6956180.919966-0.9391880.7500891.070.5195490.8190191.030477-1.0516750.8127418.8.岭脊分析（续）岭脊分析（续）半径半径Y预测值预测值标准误标准误X1X2X31.173.436770.9637831.141363-1.1650.8732051.276.395141.1285371.252504-1.279070.9317661.379.395671.3

46、121991.363813-1.393790.9886631.482.439221.5139641.475222-1.509091.0440961.585.526481.733241.586681-1.624911.0982361.688.658071.9695961.698153-1.74121.1512281.791.83452.2227141.809609-1.857921.2031961.895.056192.4923591.921028-1.975021.2542471.998.323552.7783522.032395-2.092471.3044732.0101.63693.080

47、562.143697-2.210241.3539545.6 D最优混合设计最优混合设计5.6.1 D D最优设计最优设计回归设计的正交性、旋转性和通用性各有其优回归设计的正交性、旋转性和通用性各有其优点，但是都没有涉及统计意义上的优劣。点，但是都没有涉及统计意义上的优劣。最优设计最优设计就是从统计意义上来研究不同试验方就是从统计意义上来研究不同试验方案的优劣并建立最优方案。在所有的试验方案中，案的优劣并建立最优方案。在所有的试验方案中，能使回归预测值与观察值拟合最好的那个方案就能使回归预测值与观察值拟合最好的那个方案就是最优方案，即最优设计。是最优方案，即最优设计。判断试验方案的优劣有很多标

48、准，如：判断试验方案的优劣有很多标准，如：D D优良性、优良性、G G优良性、优良性、A A优良性、优良性、E E优良性、优良性、I I优良性、优良性、U U优良性优良性等。其中以等。其中以D D优良性的使用最为普遍，有人证明：优良性的使用最为普遍，有人证明：事实上事实上G G优良性与优良性与D D优良性等价。优良性等价。5.6.1 D D最优设计最优设计 1943年，年，Wald提出提出信息矩阵的行列式极大值判信息矩阵的行列式极大值判别法。结构矩阵和信息矩阵与试验方案有关，设别法。结构矩阵和信息矩阵与试验方案有关，设试验方案为试验方案为，可以证明，试验方案的信息矩阵可以证明，试验方案的信息矩

49、阵A(A()的行列式的值的行列式的值|A(|A()|)|越大，回归系数的预越大，回归系数的预测值的方差越小，预测值的方差也越小，试验方测值的方差越小，预测值的方差也越小，试验方案也就越优良。以此为依据，从各种试验方案中案也就越优良。以此为依据，从各种试验方案中挑选最优设计方案的方法，称为挑选最优设计方案的方法，称为D D最优设计最优设计。在同一模型下，两个试验方案在同一模型下，两个试验方案1和和2，如果方案，如果方案1的信息矩阵行列式的值大于的信息矩阵行列式的值大于2的值，即的值，即：|A(|A(1)|A()|A(2)|)|，则说明在，则说明在D D优良性下方案优良性下方案1比比2有更好的优良

50、性。有更好的优良性。5.6.2 D D最优混合设计最优混合设计 D D优良设计一般不满足正交性和旋转性，于是有优良设计一般不满足正交性和旋转性，于是有人以回归组合设计为基础，提出了部分兼有近似人以回归组合设计为基础，提出了部分兼有近似D D优良性、正交性和旋转性的优良性、正交性和旋转性的D D最优混合设计最优混合设计。D D最优混合设计的设计方案处理数较少，试验效最优混合设计的设计方案处理数较少，试验效率较高，回归系数和待估参数之间拟合得较好，统率较高，回归系数和待估参数之间拟合得较好，统计分析上也较为方便。到目前为止，人们已经找到计分析上也较为方便。到目前为止，人们已经找到了若干了若干2 2

展开阅读全文