五章节统计假设测验.ppt-得力文库

资源描述

《五章节统计假设测验.ppt》由会员分享，可在线阅读，更多相关《五章节统计假设测验.ppt（89页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、五章节统计假设测验 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望第一节统计假设测验的基本原理第一节统计假设测验的基本原理一、统计假设的基本概念一、统计假设的基本概念二、统计假设测验的基本方法二、统计假设测验的基本方法三、两尾测验与一尾测验。三、两尾测验与一尾测验。四、假设测验的两类错误四、假设测验的两类错误一、统计假设的基本概念一、统计假设的基本概念所谓所谓统计假设统计假设(statistical hypothesis)(statistical hypothe

2、sis)是指有关某一总体是指有关某一总体参数的假设。例如假设某小麦新品种的产量和原地方品种参数的假设。例如假设某小麦新品种的产量和原地方品种的产量一样，或者比旧地方品种更好。的产量一样，或者比旧地方品种更好。单个平均数的假设单个平均数的假设适于统计测验的假设适于统计测验的假设两个平均数相比较的假设两个平均数相比较的假设 (一一)单个平均数的假设单个平均数的假设一个样本是从一个具有平均数一个样本是从一个具有平均数的总体中随机抽的总体中随机抽出的，记作：出的，记作：。例如：。例如：(1)某一小麦品种的产量具有原地方品种的产量，某一小麦品种的产量具有原地方品种的产量，这指新品种的产量表现乃原地

3、方品种产量表现的一个随这指新品种的产量表现乃原地方品种产量表现的一个随机样本，其平均产量机样本，其平均产量等于某一指定值等于某一指定值，故记为，故记为。(2)某一棉花品种的纤维长度某一棉花品种的纤维长度()具有工业上某一具有工业上某一指定的标准指定的标准()，这可记为，这可记为。(二二)两个平均数相比较的假设两个平均数相比较的假设两个样本乃从两个具有相等参数的总体中随机抽出两个样本乃从两个具有相等参数的总体中随机抽出的，记为的，记为或或。例如：。例如：(1)两个小麦品种的产量是相同的。两个小麦品种的产量是相同的。(2)两种杀虫药剂对于某种害虫的药效是相等的。两种杀虫药剂对于某种害

4、虫的药效是相等的。上述两种假设称为上述两种假设称为无效假设无效假设(null hypothesis)(null hypothesis)。因为假设。因为假设总体参数总体参数(平均数平均数)与某一指定值相等或假设两个总体参数与某一指定值相等或假设两个总体参数相等，即假设其没有效应差异，或者说实得差异是由误差相等，即假设其没有效应差异，或者说实得差异是由误差造成的。造成的。和无效假设相对应的应有一个统计假设，叫和无效假设相对应的应有一个统计假设，叫对应对应假设假设或或备择假设备择假设(alternative hypothesis)(alternative hypothesis)，记作，记作或或。

5、如果否定了无效假设，则必接受备择假设；同理，如果否定了无效假设，则必接受备择假设；同理，如果接受了无效假设，当然也就否定了备择假设。如果接受了无效假设，当然也就否定了备择假设。二、统计假设测验的基本方法二、统计假设测验的基本方法 (一一)对所研究的总体首先提出一个统计假设对所研究的总体首先提出一个统计假设 (二二)在承认上述无效假设的前提下，获得平均数在承认上述无效假设的前提下，获得平均数的抽样分布，计算该假设正确的概率的抽样分布，计算该假设正确的概率 (三三)根据根据“小概率事件实际上不可能发生小概率事件实际上不可能发生”原理原理接受或否定假设接受或否定假设下面以一个例子说明假设测验方法的

6、具体内容。下面以一个例子说明假设测验方法的具体内容。设某地区的当地小麦品种一般设某地区的当地小麦品种一般667m2产产300kg，即，即当地品种这个总体的平均数当地品种这个总体的平均数 =300(kg)，并从多年种植，并从多年种植结果获得其标准差结果获得其标准差=75(kg)，而现有某新品种通过，而现有某新品种通过25个个小区的试验，计得其样本平均产量为每小区的试验，计得其样本平均产量为每667m2330kg,即即 =330，那么新品种样本所属总体与，那么新品种样本所属总体与 =300的当地品的当地品种这个总体是否有显著差异呢？以下将说明对此假设进种这个总体是否有显著差异呢？以下将说明对此假设

7、进行统计测验的方法。行统计测验的方法。(一一)对所研究的总体首先提出一个无效假设对所研究的总体首先提出一个无效假设通常所做的无效假设常为所比较的两个总体间无差异。通常所做的无效假设常为所比较的两个总体间无差异。测验单个平均数，则假设该样本是从一已知总体测验单个平均数，则假设该样本是从一已知总体(总体平均总体平均数为指定值数为指定值 )中随机抽出的，即中随机抽出的，即。如上例，即。如上例，即假定新品种的总体平均数假定新品种的总体平均数等于原品种的总体平均数等于原品种的总体平均数=300kg，而样本平均数和之间的差数：，而样本平均数和之间的差数：330300=30(kg)属属随机误差；对应假

8、设则为随机误差；对应假设则为。如果测验两个平均数，则假设两个样本的总体平均数相等，如果测验两个平均数，则假设两个样本的总体平均数相等，即即，也就是假设两个样本平均数的差数，也就是假设两个样本平均数的差数属随机误差，而非真实差异；其对应假设则为属随机误差，而非真实差异；其对应假设则为。(二二)在承认上述无效假设的前提下，获得平均数的在承认上述无效假设的前提下，获得平均数的抽样分布，计算假设正确的概率抽样分布，计算假设正确的概率先承认无效假设，从已知总体中抽取样本容量为先承认无效假设，从已知总体中抽取样本容量为n=25的样本，该样本平均数的抽样分布具正态分布形状，的样本，该样本平均数的抽

9、样分布具正态分布形状，平均数平均数 =300(kg)，标准误，标准误 =15(kg)。通过试验，如果新品种的平均产量很接近。通过试验，如果新品种的平均产量很接近300 kg，例如，例如301kg或或299kg等，则试验结果当然与假设相符，等，则试验结果当然与假设相符，于是应接受于是应接受H0。如果新品种的平均产量为。如果新品种的平均产量为500kg，与总，与总体假设相差很大，那当然应否定体假设相差很大，那当然应否定H0。但如果试验结果与。但如果试验结果与总体假设并不相差悬殊总体假设并不相差悬殊,就要借助于概率原理，具体做就要借助于概率原理，具体做法有以下两种：法有以下两种：1.计算概率计算概率

10、在假设在假设为正确的条件下，根据的抽样分布算出为正确的条件下，根据的抽样分布算出获得获得 =330kg的概率，或者说算得出现随机误差的概率，或者说算得出现随机误差 =30(kg)的概率：在此，根据的概率：在此，根据u 测验公式可算得：测验公式可算得：因为假设是新品种产量有大于或小于当地品种产量的可能因为假设是新品种产量有大于或小于当地品种产量的可能性，所以需用两尾测验。性，所以需用两尾测验。查附表查附表3，当，当u=2时，时，P(概率概率)界于界于0.04和和0.05之间，即这之间，即这一试验结果：一试验结果：=30(kg)，属于抽样误差的概率小于，属于抽样误差的概率小于5%。2.计算接受

11、区和否定区计算接受区和否定区在假设在假设H0为正确的条件下，根据为正确的条件下，根据的的抽样分布划出一个区间，如抽样分布划出一个区间，如在这一区间内则接受在这一区间内则接受H0，如，如在在这一区间外则否定这一区间外则否定H0。如何确定这一区间呢？如何确定这一区间呢？根据上章所述根据上章所述和和的分布，可知：的分布，可知：因此，在因此，在的抽样分布中，落在的抽样分布中，落在()区间内的有区间内的有95%，落在这一区间外的只有，落在这一区间外的只有5%。如果以如果以5%概率作为接受或否定概率作为接受或否定H0的界限，则上述区间的界限，则上述区间()为接受假设的区域，简称为接受假设的区

12、域，简称接受区接受区(acceptance region)(acceptance region)；和和为否定假设的区域，简称为否定假设的区域，简称否定区否定区(rejection(rejection region)region)。同理，若以同理，若以1%作为接受或否定作为接受或否定H0的界限，则的界限，则()为接受区域，为接受区域，和和为否定区域。为否定区域。所以在测验时需先计算所以在测验时需先计算1.96 或或2.58 ，然后从，然后从加加上和减去上和减去1.96 或或2.58 ，即得两个否定区域的临界值。，即得两个否定区域的临界值。如上述小麦新品种例，如上述小麦新品种例，=300，,

13、1.96 =29.4(kg)。因之，。因之，它的两个它的两个2.5%概率概率的否定区域为的否定区域为 30029.4和和 300+29.4，即，即大于大于329.4(kg)和小于和小于270.6(kg)的概率只有的概率只有5%(见图见图5.1)。图图5.1 5%显著水平假设测验图示显著水平假设测验图示（表示接受区域和否定区域）（表示接受区域和否定区域）(三三)根据根据“小概率事件实际上不可能发生小概率事件实际上不可能发生”原理接受或否定假设原理接受或否定假设当当由随机误差造成的概率小于由随机误差造成的概率小于5%或或1%时，就可认时，就可认为它不可能属于抽样误差，从而否定假设。为它不可能属

14、于抽样误差，从而否定假设。如果因随机误差而得到某差数的概率如果因随机误差而得到某差数的概率P0.05，则称这个，则称这个差数是显著的。如果因随机误差而得到某差数的概率差数是显著的。如果因随机误差而得到某差数的概率P0.01，则称这个差数是极显著的。而这种假设测验也叫显著性测，则称这个差数是极显著的。而这种假设测验也叫显著性测验。验。用来测验假设的概率标准用来测验假设的概率标准5%或或1%等，称为等，称为显著水平显著水平(significance level)significance level)。一般以一般以表示，如表示，如 =0.05或或 =0.01。综合上述，统计假设测验的步骤可总结如下

15、：综合上述，统计假设测验的步骤可总结如下：(1)对样本所属的总体提出统计假设，包括无效假设和备对样本所属的总体提出统计假设，包括无效假设和备择假设。择假设。(2)规定测验的显著水平规定测验的显著水平值。值。(3)在在为正确的假定下，根据平均数为正确的假定下，根据平均数()或其他统计数或其他统计数的抽样分布，如为正态分布的则计算正态离差的抽样分布，如为正态分布的则计算正态离差u值。由值。由u值查值查附表附表3即可知道因随机抽样而获得实际差数即可知道因随机抽样而获得实际差数(如如等等)由误由误差造成的概率。或者根据已规定概率，如差造成的概率。或者根据已规定概率，如 =0.05,查出查出u=1

16、.96,因而划出两个否定区域为因而划出两个否定区域为:和和 (4)将规定的将规定的值和算得的值和算得的u值的概率相比较，或者将试验值的概率相比较，或者将试验结果和否定区域相比较，从而作出接受或否定无效假设的推结果和否定区域相比较，从而作出接受或否定无效假设的推断。断。三、两尾测验与一尾测验三、两尾测验与一尾测验如果统计假设为如果统计假设为 ,则备择假设为则备择假设为 ,在在假设测验时所考虑的概率为曲线左边一尾概率假设测验时所考虑的概率为曲线左边一尾概率(小于小于 )和右和右边一尾概率边一尾概率(大于大于 )的总和。这类测验称为的总和。这类测验称为两尾测验两尾测验(two-(two-tail

17、ed test)tailed test)，它具有两个否定区域。，它具有两个否定区域。如果统计假设为如果统计假设为 ,则其对应的备择假设必为则其对应的备择假设必为。因而，这个对应的备择假设仅有一种可能性。因而，这个对应的备择假设仅有一种可能性,而统计假设仅而统计假设仅有一个否定区域，即曲线的右边一尾。这类测验称有一个否定区域，即曲线的右边一尾。这类测验称一尾测验一尾测验(one-tailed test)one-tailed test)。一尾测验还有另一种情况，即。一尾测验还有另一种情况，即，,这时否定区域在左边一尾这时否定区域在左边一尾.作一尾测验时，需将附表作一尾测验时，需将附表3列出的两

18、尾概率乘以列出的两尾概率乘以1/2，再查，再查出其出其u值。值。四、假设测验的两类错误四、假设测验的两类错误表5.1 假设测验的两类错误测验结测验结果果如果如果H0是是正确的正确的如果如果H0是是错误错误的的H0被否被否定定第一第一类错类错误误没有没有错错误误H0被接被接受受没有没有错误错误第二第二类类错误错误第一类错误的概率为显著水平第一类错误的概率为显著水平值。值。第二类错误的概率为第二类错误的概率为值。值。值的计算方法就是计算抽值的计算方法就是计算抽样平均数落在已知总体的接受区的概率样平均数落在已知总体的接受区的概率(这里的已知总体是这里的已知总体是假定的假定的)。例：已知

19、总体的均值例：已知总体的均值 =300，其平均数抽样标准误为，其平均数抽样标准误为15，被抽样总体的平均数，被抽样总体的平均数 315kg、标准误也为、标准误也为15，由此可以，由此可以画出这两个总体的分布曲线如图画出这两个总体的分布曲线如图5.2，图中标出了已知总体的，图中标出了已知总体的接受区域在接受区域在c1和和c2之间。由于两个总体的平均数不同，这种可之间。由于两个总体的平均数不同，这种可能性正是第二类错误的概率值，其一般计算方法为：能性正是第二类错误的概率值，其一般计算方法为：查附表查附表2，P(u12.96)=0.0015，P(u20.96)=0.8315，故有故有 =P(u20.

20、96)P(u1 2.96)=0.83150.0015=0.83或或83%图图5.2 ：=300是错误时的是错误时的值值关于两类错误的讨论可总结如下：关于两类错误的讨论可总结如下：(1)在样本容量在样本容量n固定的条件下，提高显著水平固定的条件下，提高显著水平 (取较小的取较小的值值)，如从，如从5%变为变为1%则将增大第二类错误的概率则将增大第二类错误的概率值。值。(2)在在n和显著水平和显著水平相同的条件下，真总体平均数相同的条件下，真总体平均数和假设和假设平均数平均数的相差的相差(以标准误为单位以标准误为单位)愈大，则犯第二类错误的概愈大，则犯第二类错误的概率率值愈小。值愈小。

21、(3)为了降低犯两类错误的概率，需采用一个较低的显著水为了降低犯两类错误的概率，需采用一个较低的显著水平，如平，如 =0.05；同时适当增加样本容量，或适当减小总体方差；同时适当增加样本容量，或适当减小总体方差，或两者兼有之。，或两者兼有之。(4)如果显著水平如果显著水平已固定下来，则改进试验技术和增加样已固定下来，则改进试验技术和增加样本容量可以有效地降低犯第二类错误的概率。本容量可以有效地降低犯第二类错误的概率。第二节第二节平均数的假设测验平均数的假设测验一、一、t 分布分布二、单个样本平均数的假设测验二、单个样本平均数的假设测验三、两个样本平均数相比较的假设测验三、两个样本平均数相

22、比较的假设测验一、一、t 分布分布从一个平均数为从一个平均数为、方差为、方差为的正态总体中抽样，的正态总体中抽样，(2)当样本容量不太大当样本容量不太大(n30)而而为未知时，以样本均为未知时，以样本均方方估计估计，则其标准化离差，则其标准化离差的分布不呈正态，而的分布不呈正态，而作作 t 分布，具有自由度分布，具有自由度DF=n-1。(1)样本平均数样本平均数的分布必趋向正态分布的分布必趋向正态分布，并且并且遵循正态分布遵循正态分布N(0，1)。(51)为样本平均数的标准误，为样本平均数的标准误，s为样本标准差，为样本标准差，n为样本容量。为样本容量。t 分布分布(t-d

23、istribution)是是1908年年.S.Gosset首先提出的，首先提出的，又叫学生氏分布又叫学生氏分布(students t distribution)。它是一组对称密度函。它是一组对称密度函数曲线，具有一个单独参数数曲线，具有一个单独参数以确定某一特定分布。以确定某一特定分布。v 是自由度。是自由度。在理论上，当在理论上，当v 增大时，增大时，t 分布趋向于正态分布。分布趋向于正态分布。t 分布的密度函数为：分布的密度函数为：t 分布的平均数和标准差为：分布的平均数和标准差为：(54)(53)图图5.5 标标准化正准化正态态分布与自由度分布与自由度为为4 4的的t t分布曲分布曲线

24、线 t 分布曲线是对称的，分布曲线是对称的，围绕其平均数围绕其平均数向两向两侧递降。和正态曲线比较，侧递降。和正态曲线比较，t 分布曲线稍为扁平，峰分布曲线稍为扁平，峰顶略低，尾部稍高顶略低，尾部稍高(图图5.5)。t 分布是一组随自分布是一组随自由度由度v 而改变的曲线，但而改变的曲线，但当当v30时接近正态曲线，时接近正态曲线，当当v=时和正态曲时和正态曲线合一。由于线合一。由于t 分布受自由度制约，所以分布受自由度制约，所以t 值与其相应的概率也值与其相应的概率也随自由度而不同。随自由度而不同。t 分布的概率累积函数为：分布的概率累积函数为：(55)和正态概率累积函数一样，和正态概率累

25、积函数一样，t 分布的概率累积函数也分一分布的概率累积函数也分一尾表和两尾表。计算尾表和两尾表。计算于给定于给定 t0 值时值时因而因而t 分布曲线右尾从分布曲线右尾从 t 到到的面积为的面积为1Fv(t)，而两尾面，而两尾面积则为积则为21Fv(t)在在t 表中，若表中，若v相同，则相同，则P越大，越大，t 越小；越小；P越小，越小，t 越大。越大。因此在假设测验时，若算得的因此在假设测验时，若算得的|t|，则接受无效假设。，则接受无效假设。二、单个样本平均数的假设测验二、单个样本平均数的假设测验测验某一样本测验某一样本所属总体平均数是否和某一指定的所属总体平均数是否和某一指定的总体

26、平均数相同。总体平均数相同。例例5.1 某春小麦良种的千粒重某春小麦良种的千粒重 34g，现自外地，现自外地引入一高产品种，在引入一高产品种，在8个小区种植，得其千粒重个小区种植，得其千粒重(g)为：为：35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6，问，问新引入品种的千粒重与当地良种有无显著差异？新引入品种的千粒重与当地良种有无显著差异？这里总体这里总体为未知，又是小样本，故需用为未知，又是小样本，故需用t 测验；又测验；又新引入品种千粒重可能高于也可能低于当地良种，故需作新引入品种千粒重可能高于也可能低于当地良种，故需作两尾测验。测验步骤为：两尾测验。测验

27、步骤为：H0：新引入品种千粒重与当地良种千粒重指定值相同，：新引入品种千粒重与当地良种千粒重指定值相同，即即 34g；或简记作；或简记作H0：34g；对；对HA：34g。显显著水平著水平 =0.05。测验计算：测验计算：查附表查附表4，v=7时，时，t0.05=2.365。现实得。现实得|t|0.05。推断：接受推断：接受H0：34g，即新引入品种千粒重与当地良种千，即新引入品种千粒重与当地良种千粒重指定值没有显著差异。粒重指定值没有显著差异。三、两个样本平均数相比较的假设测验三、两个样本平均数相比较的假设测验由两个样本平均数的相差，以测验这两个样本所属由两个样本平均数的相差，以测验这两个样

28、本所属的总体平均数有无显著差异。的总体平均数有无显著差异。测验方法测验方法成组数据的平均数比较成组数据的平均数比较成对数据的比较成对数据的比较(一一)成组数据的平均数比较成组数据的平均数比较如果两个处理为完全随机设计的两个处理，各供试如果两个处理为完全随机设计的两个处理，各供试单位彼此独立，不论两个处理的样本容量是否相同，所单位彼此独立，不论两个处理的样本容量是否相同，所得数据皆称为成组数据，以组得数据皆称为成组数据，以组(处理处理)平均数作为相互比平均数作为相互比较的标准。较的标准。成组数据的平均数比较又依两个样本所属的总体方成组数据的平均数比较又依两个样本所属的总体方差差(和和 )是

29、否已知、是否相等而采用不同的测验方法。是否已知、是否相等而采用不同的测验方法。(1)在两个样本的总体方差在两个样本的总体方差和和为已知时，用为已知时，用u测验测验由抽样分布的公式知，两样本平均数由抽样分布的公式知，两样本平均数和和的差数标准误的差数标准误，在，在和和是已知时为：是已知时为：并有并有:在假设在假设下，正态离差下，正态离差u值为值为，故可对两样本平均数的差异作出假设测验。故可对两样本平均数的差异作出假设测验。例例5.2 据以往资料，已知某小麦品种每平方米产量的据以往资料，已知某小麦品种每平方米产量的。今在该品种的一块地上用。今在该品种的一块地上用A、B两法取样

30、，法取两法取样，法取12个样点，得每平方米产量个样点，得每平方米产量 =1.2(kg)；B法取法取8个样点，得个样点，得 =1.4(kg)。试比较。试比较A、B两法的每平方米产量是否有显著差异两法的每平方米产量是否有显著差异？假设假设H0:A、B两法的每平方米产量相同，即两法的每平方米产量相同，即系随机误差；对系随机误差；对显著水平显著水平因为实得因为实得|u|0.05 推断推断:接受接受 ,即即A、B两种取样方法所得的每平方两种取样方法所得的每平方米产量没有显著差异。米产量没有显著差异。(2)在两个样本的总体方差在两个样本的总体方差和和为未知，但可假定为未知，但可假定，而两个样本

31、又为小样本时，用，而两个样本又为小样本时，用t 测验。测验。从样本变异算出平均数差数的均方从样本变异算出平均数差数的均方，(56)其两样本平均数的差数标准误为：其两样本平均数的差数标准误为：当当时，时，于是有：于是有：由于假设由于假设故故自由度自由度(57)(58)(59A)(59B)例例5.3 调查某农场每亩调查某农场每亩30万苗和万苗和35万苗的稻田各万苗的稻田各5块，块，得亩产量得亩产量(单位：单位：kg)于表于表5.2，试测验两种密度亩产量的差异，试测验两种密度亩产量的差异显著性。显著性。表表5.2 两种密度的稻田两种密度的稻田亩产亩产(kg)(kg)y1(30万苗万苗)y2(3

32、5万苗万苗)400450420440435445460445425420 假设假设H0:两种密度的总体产量两种密度的总体产量没有差异，即没有差异，即对对显著水平显著水平 =0.05 测验计算：测验计算：=428kg =440kg SS1=1930 SS2=550 故故查附表查附表4，v=4+4=8时时,t0.05=2.306。现实得现实得|t|=1.080.05。推断：接受假设推断：接受假设，两种密度的亩产量没，两种密度的亩产量没有显著差异。有显著差异。例例5.4 研究矮壮素使玉米矮化的效果，在抽穗期测定喷矮研究矮壮素使玉米矮化的效果，在抽穗期测定喷矮壮素小区壮素小区8株、对照区玉米株

33、、对照区玉米9株，其株高结果如表株，其株高结果如表5.3。试作假设。试作假设测验。测验。表表5.3 喷喷矮壮素与否的矮壮素与否的玉米株高玉米株高(cm)(cm)y1(喷喷矮壮素矮壮素)y2(对对照照)160170160270200180160250200270170290150270210230170矮壮素只可能矮化无效而不可矮壮素只可能矮化无效而不可能促进植侏长高，因此假设能促进植侏长高，因此假设H0：喷：喷矮壮素的株高与未喷的相同或更高，矮壮素的株高与未喷的相同或更高，即即对对即喷矮壮素的株高较未喷的为矮，即喷矮壮素的株高较未喷的为矮，作一尾测验。作一尾测验。显著水平显著水平 =0.05

34、。测验计算：测验计算：=176.3cm =233.3cm SS1=3787.5 SS2=18400故有故有按按 v=7+8=15，查，查t表得一尾表得一尾 t0.05=1.753(一尾测验一尾测验t0.05等于等于两尾测验的两尾测验的t0.10),现实得现实得 t=3.05t0.05=1.753，P3.106，故，故Pt0.01，故，故P0.01。推断：否定推断：否定，接受，接受，即，即A、B两法对饨两法对饨化病毒的效应有极显著差异。化病毒的效应有极显著差异。例例5.7 研究某种新肥研究某种新肥料能否比原肥料每亩增产料能否比原肥料每亩增产5kg以上皮棉，选土壤和其以上皮棉，选土壤和其他条

35、件最近似的相邻小区他条件最近似的相邻小区组成一对，其中一区施新组成一对，其中一区施新肥料，另一区施原肥料作肥料，另一区施原肥料作对照，重复对照，重复9次。产量结果次。产量结果见表见表5.5。试测验新肥料能。试测验新肥料能否比原肥料每亩增产否比原肥料每亩增产5kg以以上皮棉？上皮棉？表表5.5 两种肥料的皮棉两种肥料的皮棉产产量量(kg)重复区y1(新肥料)y(对照)d67.460.66.872.866.66.268.464.93.566.061.84.270.861.79.169.667.22.467.262.44.868.961.37.662.656.75.9 因为要测验新肥料能否比对照增产

36、因为要测验新肥料能否比对照增产5kg，故采用一尾测验。，故采用一尾测验。H0：新肥料比对照每亩增收不到：新肥料比对照每亩增收不到5kg，最多，最多5kg，即，即；对；对HA:新肥料比对照每亩可增收新肥料比对照每亩可增收5kg以上，即以上，即。显著水平显著水平。测验计算：测验计算：按按v=91=8，查，查t表得，表得，t0.05=1.860(一尾概率一尾概率)。现实得。现实得|t|0.05。推断：接受推断：接受，即认为新肥料较原肥料每亩增，即认为新肥料较原肥料每亩增收皮棉不超过收皮棉不超过5kg。成对数据和成组数据平均数比较的不同成对数据和成组数据平均数比较的不同:(1)成对数据和成组数

37、据平均数比较所依据的条件是不相同成对数据和成组数据平均数比较所依据的条件是不相同的。的。前者是假定各个配对的差数来自差数的分布为正态的总体前者是假定各个配对的差数来自差数的分布为正态的总体,具有具有N(0，)；而每一配对的两个供试单位是彼此相关的。；而每一配对的两个供试单位是彼此相关的。后者则是假定两个样本皆来自具有共同后者则是假定两个样本皆来自具有共同(或不同或不同)方差的正方差的正态总体，而两个样本的各个供试单位都是彼此独立的。态总体，而两个样本的各个供试单位都是彼此独立的。(2)在实践上，如将成对数据按成组数据的方法比较，容易在实践上，如将成对数据按成组数据的方法比较，容易使统计推断发生

38、第二类错误，即不能鉴别应属显著的差异。故使统计推断发生第二类错误，即不能鉴别应属显著的差异。故在应用时需严格区别。在应用时需严格区别。第三节第三节二项资料的百分数假设测验二项资料的百分数假设测验许多生物试验的结果是用百分数或成数表示的，如结实率、许多生物试验的结果是用百分数或成数表示的，如结实率、发芽率等，这些百分数系由计数某一属性的个体数目求得，属发芽率等，这些百分数系由计数某一属性的个体数目求得，属间断性的计数资料间断性的计数资料.在理论上，这类百分数的假设测验应按二项分布进行，即在理论上，这类百分数的假设测验应按二项分布进行，即从二项式从二项式(p+q)n的展开式中求出某项属性个体百

39、分数的概率的展开式中求出某项属性个体百分数的概率。但是，如样本容量但是，如样本容量n 较大，较大，p较小，而较小，而np和和nq又均不小于又均不小于5时时,(p+q)n的分布趋近于正态。因而可以将百分数资料作正态的分布趋近于正态。因而可以将百分数资料作正态分布处理，从而作出近似的测验。分布处理，从而作出近似的测验。适于用适于用u测验所需的二项样本容量测验所需的二项样本容量n见表见表5.6。(样样本百分数本百分数)(较较小小组组次数次数)n(样本容量样本容量)0.5015300.4020500.3024800.20402000.10606000.05701400表表5.6 适于用正态离差测验的

40、二项样本的适于用正态离差测验的二项样本的和和n值表值表一、单个样本百分数一、单个样本百分数(成数成数)的假设测验的假设测验测验某一样本百分数测验某一样本百分数所属总体百分数与某一理论值或期所属总体百分数与某一理论值或期望值望值p0的差异显著性。的差异显著性。由于样本百分数的标准误由于样本百分数的标准误为：为：故由故由即可测验即可测验H0:p=p0。(516)(517)例例5.8 以紫花和白花的大豆品种杂交，在以紫花和白花的大豆品种杂交，在F2代共得代共得289株，其中紫花株，其中紫花208株，白花株，白花81株。如果花色受一对等位基因控株。如果花色受一对等位基因控制，则根据遗传学原理

41、，制，则根据遗传学原理，F2代紫花株与白花株的分离比率应为代紫花株与白花株的分离比率应为31，即紫花理论百分数，即紫花理论百分数p=0.75，白花理论百分数，白花理论百分数q=1p=0.25。问该试验结果是否符合一对等位基因的遗传规律？。问该试验结果是否符合一对等位基因的遗传规律？假设大豆花色遗传符合一对等位基因的分离规律，紫花假设大豆花色遗传符合一对等位基因的分离规律，紫花植株的百分数是植株的百分数是75%，即，即H0:p=0.75；对；对HA:p0.75。显著水平显著水平 0.05，作两尾测验，作两尾测验,u0.05=1.96。测验计算：测验计算：因为实得因为实得|u|0.05。推断：接受

42、推断：接受H0:p=0.75，即大豆花色遗传是符合一对等位，即大豆花色遗传是符合一对等位基因的遗传规律的，紫花植株百分数基因的遗传规律的，紫花植株百分数 =0.72和和p=0.75的相差的相差系随机误差。如果测验系随机误差。如果测验H0:p=0.25，结果完全一样。，结果完全一样。以上资料亦可直接用次数进行假设测验。当二项资料以次以上资料亦可直接用次数进行假设测验。当二项资料以次数表示时，数表示时，,故测验计算：故测验计算：于是于是结果同上结果同上二、两个样本百分数相比较的假设测验二、两个样本百分数相比较的假设测验测验两个样本百分数和所属总体百分数测验两个样本百分数和所属总体百分数p1和

43、和p2的差异显著的差异显著性性.一般假定两个样本的总体方差是相等的，即一般假定两个样本的总体方差是相等的，即，设，设两个样本某种属性个体的观察百分数分别为两个样本某种属性个体的观察百分数分别为和和，而两样本总体该种属性的个体百分数分别为，而两样本总体该种属性的个体百分数分别为p1和和 p2，则两样本百分数的差数标准误，则两样本百分数的差数标准误为：为：(518)上式中的上式中的q1=(1p1)，q2=(1p2)。这是两总体百分数为。这是两总体百分数为已知时的差数标准误公式。已知时的差数标准误公式。如果假定两总体的百分数相同，即如果假定两总体的百分数相同，即 p1=p2=p,q1=q2=

44、q，则：，则：p1 和和 p2 未知时，则在未知时，则在的假定下，可用两样本百分的假定下，可用两样本百分数的加权平均值数的加权平均值作为作为 p1 和和 p2 的估计。的估计。(520)(519)因而两样本百分数的差数标准误为：因而两样本百分数的差数标准误为：(521)故由故由即可对即可对 H0:p1=p2 作出假设测验。作出假设测验。(522)例例5.9 调查低洼地小麦调查低洼地小麦378株株(n1)，其中有锈病株，其中有锈病株355株株(y1)，锈病率，锈病率93.92%()；调查高坡地小麦；调查高坡地小麦396株株(n2)，其中有锈病，其中有锈病346株株(y2)，锈病率，锈病率87

45、.31%()。试测。试测验两块麦田的锈病率有无显著差异？验两块麦田的锈病率有无显著差异？假设假设H0：两块麦田的总体锈病率无差别，即：两块麦田的总体锈病率无差别，即 H0:p1=p2；对；对 HA:p1 p2。显著水平取显著水平取，作两尾测验，作两尾测验，u0.05=1.96。测验计算：测验计算：实得实得|u|u0.05，故，故P0.05，推断：否定推断：否定H0:p1=p2 接受接受HA:p1 p2，即两块麦田，即两块麦田的锈病率有显著差异。的锈病率有显著差异。例例5.10 原杀虫剂原杀虫剂A在在1000头虫子中杀死头虫子中杀死657头，新杀虫头，新杀虫剂剂B在在1000头虫子中杀死头虫子

46、中杀死728头，问新杀虫剂头，问新杀虫剂B的杀虫率是否的杀虫率是否高于原杀虫剂高于原杀虫剂A？假设新杀虫剂假设新杀虫剂B的杀虫率并不高于原杀虫剂的杀虫率并不高于原杀虫剂A，即，即 H0:P2P1；对；对 HA:P2P1。显著水平显著水平，作一尾测验，作一尾测验,u0.01=2.326(一尾概率一尾概率)。测验计算：测验计算：实得实得uu0.01=2.326，故，故P0.01，推断：否定推断：否定H0:P2P1，接受，接受HA:P2P1，即新杀虫剂，即新杀虫剂的杀虫率极显著地高于原杀虫剂的杀虫率极显著地高于原杀虫剂A。三、二项样本假设测验时的连续性矫正三、二项样本假设测验时的连续性矫正二项总

47、体的百分数的分布是间断性的二项分布。把它当二项总体的百分数的分布是间断性的二项分布。把它当作连续性的正态分布或作连续性的正态分布或t分布处理，结果会有些出入，一般容分布处理，结果会有些出入，一般容易发生第一类错误。易发生第一类错误。因此因此,在假设测验时需进行连续性矫正。在假设测验时需进行连续性矫正。(1)在在n30，而，而 5时这种矫正是必须的；经过连续性时这种矫正是必须的；经过连续性矫正的正态离差矫正的正态离差u值或值或t 值，分别以值，分别以uC 或或 tC 表示。表示。(2)如果样本大，试验结果符合表如果样本大，试验结果符合表5.6条件，则可以不作矫条件，则可以不作矫正，用正，用u测验

48、。测验。(一一)单个样本百分数假设测验的连续性矫正单个样本百分数假设测验的连续性矫正单个样本百分数的连续性矫正公式为：单个样本百分数的连续性矫正公式为：它具有它具有 v=n1。式中。式中是是的估计值的估计值(523)(524)例例5.11 用基因型纯合的糯玉米和非糯玉米杂交，按用基因型纯合的糯玉米和非糯玉米杂交，按遗传学原理，预期遗传学原理，预期F1植株上糯性花粉粒的植株上糯性花粉粒的p0=0.5，现在一，现在一视野中检视视野中检视20粒花粉，得糯性花粉粒花粉，得糯性花粉8粒，试问此结果和理粒，试问此结果和理论百分数论百分数p0=0.5是否相符？是否相符？假设系假设系p=p0=0.5的一个随

49、机样本，即的一个随机样本，即H0:p=0.5 对对HA:p0.5 显著水平取显著水平取 ,用两尾测验。用两尾测验。测验计算：测验计算：np=nq=200.5=10 推断认为实得百分数推断认为实得百分数0.4与理论百分数与理论百分数0.5没有显著没有显著差异。差异。查附表查附表4，v=201=19，t0.05=2.093，现实得，现实得|t|0.05 =200.4=8粒粒(糯糯)，=20-8=12粒粒(非糯非糯)(二二)两个样本百分数相比较的假设测验的连续性矫正两个样本百分数相比较的假设测验的连续性矫正设两个样本百分数中，取较大值的具有设两个样本百分数中，取较大值的具有 y1 和和 n1，取较

50、小，取较小值的具有值的具有 y2 和和 n2，则经矫正的，则经矫正的 tC 公式为：公式为：(525)它具有它具有 v=n1+n22。其中其中为为中中的估计值。的估计值。例例5.12 用新配方农药处理用新配方农药处理25头棉铃虫，结果死亡头棉铃虫，结果死亡15头，存活头，存活10头；用乐果处理头；用乐果处理24头，结果死亡头，结果死亡9头，存活头，存活15头。头。问两种处理的杀虫效果是否有显著差异？问两种处理的杀虫效果是否有显著差异？本例不符合表本例不符合表5.6条件，故需要进行连续性矫正。条件，故需要进行连续性矫正。假设两种处理的杀虫效果没有差异，即假设两种处理的杀虫效果没有差异，即H

展开阅读全文