spss非参数检验.ppt-得力文库

资源描述

《spss非参数检验.ppt》由会员分享，可在线阅读，更多相关《spss非参数检验.ppt（152页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、总体分布的卡方（总体分布的卡方（Chi-squareChi-square）检验）检验10.1二项分布检验二项分布检验10.2SPSSSPSS单样本变量值随机性检验单样本变量值随机性检验10.3 SPSS SPSS单样本单样本K-SK-S检验检验10.4两独立样本非参数检验两独立样本非参数检验10.5多独立样本非参数检验多独立样本非参数检验10.6两配对样本非参数检验两配对样本非参数检验10.7多配对样本非参数检验多配对样本非参数检验10.8 前面已经讨论的许多统计分析方法对总体前面已经讨论的许多统计分析方法对总体有特殊的要求，如有特殊的要求，如T T检验要求总体符合正态分检验要求总体符合正态分

2、布，布，F F检验要求误差呈正态分布且各组方差整检验要求误差呈正态分布且各组方差整齐，等等。这些方法常用来估计或检验总体参齐，等等。这些方法常用来估计或检验总体参数，统称为参数检验。数，统称为参数检验。但许多调查或实验所得的科研数据，其总但许多调查或实验所得的科研数据，其总体分布未知或无法确定。因为有的数据不是来体分布未知或无法确定。因为有的数据不是来自所假定分布的总体，或者数据根本不是来自自所假定分布的总体，或者数据根本不是来自一个总体，还有可能数据因为某种原因被严重一个总体，还有可能数据因为某种原因被严重污染，这样在假定分布的情况下进行推断的做污染，这样在假定分布的情况下进行推断的做法就

3、有可能产生错误的结论。此时人们希望检法就有可能产生错误的结论。此时人们希望检验对一个总体分布形状不必作限制。验对一个总体分布形状不必作限制。这种不是针对总体参数，而是针对总体的这种不是针对总体参数，而是针对总体的某些一般性假设（如总体分布）的统计分析方某些一般性假设（如总体分布）的统计分析方法称非参数检验（法称非参数检验（Nonparametric TestsNonparametric Tests）。）。非参数检验根据样本数目以及样本之间的关系非参数检验根据样本数目以及样本之间的关系可以分为单样本非参数检验、两独立样本非参可以分为单样本非参数检验、两独立样本非参数检验、多独立样本非参数检验、

4、两配对样本数检验、多独立样本非参数检验、两配对样本非参数检验和多配对样本非参数检验几种。非参数检验和多配对样本非参数检验几种。本章将介绍总体分布的卡方（本章将介绍总体分布的卡方（Chi-Chi-squaresquare）检验、二项分布（）检验、二项分布（BinomialBinomial）检验、）检验、单样本单样本K-SK-S（Kolmogorov-SmirnovKolmogorov-Smirnov）检验、单）检验、单样本变量值随机性检验（样本变量值随机性检验（Runs TestRuns Test）、两独）、两独立样本非参数检验、多独立样本非参数检验、立样本非参数检验、多独立样本非参数检验、两

5、配对样本非参数检验、多配对样本非参数检两配对样本非参数检验、多配对样本非参数检验等验等8 8类常用的非参数检验方法。其中前类常用的非参数检验方法。其中前4 4种属种属于单样本非参数检验。于单样本非参数检验。在得到一批样本数据后，人们往往希望从在得到一批样本数据后，人们往往希望从中得到样本所来自的总体的分布形态是否和某中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进直方图的方法来进行粗略的判断。如果需要进行比较准确的判断，则需要使用非参数检验的行比较准确的判断，则需要使用非参数检验的

6、方法。其中总体分布的卡方检验（也记为方法。其中总体分布的卡方检验（也记为22检验）就是一种比较好的方法。检验）就是一种比较好的方法。10.1.1 统计学上的定义和计算公式统计学上的定义和计算公式定义：总体分布的卡方检验适用于配合度定义：总体分布的卡方检验适用于配合度检验，是根据样本数据的实际频数推断总体分检验，是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异。它布与期望分布或理论分布是否有显著差异。它的零假设的零假设H0H0：样本来自的总体分布形态和期望：样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。分布或某一理论分布没有显著差异。因此，总体分布的卡方检

7、验是一种吻合性因此，总体分布的卡方检验是一种吻合性检验，比较适用于一个因素的多项分类数据分检验，比较适用于一个因素的多项分类数据分析。总体分布的卡方检验的数据是实际收集到析。总体分布的卡方检验的数据是实际收集到的样本数据，而非频数数据。的样本数据，而非频数数据。研究问题研究问题某地一周内各日患忧郁症的人数分布如表某地一周内各日患忧郁症的人数分布如表10-110-1所示，请检验一周内各日人们忧郁数是否所示，请检验一周内各日人们忧郁数是否满足满足1:1:2:2:1:1:11:1:2:2:1:1:1。10.1.2 SPSS中实现过程中实现过程周周日日患患者者数数13123837048052

8、9624731 实现步骤实现步骤（1 1）本例输出结果中有两个表格，其中）本例输出结果中有两个表格，其中第一个表格如下。第一个表格如下。10.1.3 结果和讨论结果和讨论（2 2）输出的结果文件中第二个表格如下。）输出的结果文件中第二个表格如下。10.2.1 统计学上的定义和计算公式统计学上的定义和计算公式现实生活中有很多数据的取值只有两类，现实生活中有很多数据的取值只有两类，如医学中的生与死、患病的有与无、性别中的如医学中的生与死、患病的有与无、性别中的男性和女性、产品的合格与不合格等。从这种男性和女性、产品的合格与不合格等。从这种二分类总体中抽取的所有可能结果，要么是对二分类总体中抽取

9、的所有可能结果，要么是对立分类中的这一类，要么是另一类，其频数分立分类中的这一类，要么是另一类，其频数分布称为二项分布。调用布称为二项分布。调用SPSSSPSS中的二项分布检验中的二项分布检验（BinomialBinomial）可对样本资料进行二项分布分）可对样本资料进行二项分布分析。析。 SPSS SPSS二项分布检验就是根据收集到的样二项分布检验就是根据收集到的样本数据，推断总体分布是否服从某个指定的二本数据，推断总体分布是否服从某个指定的二项分布。其零假设是项分布。其零假设是H0H0：样本来自的总体与所：样本来自的总体与所指定的某个二项分布不存在显著的差异。指定的某个二项分布不存在显著的

10、差异。 SPSS SPSS中的二项分布检验，在样本小于或中的二项分布检验，在样本小于或等于等于3030时，按照计算二项分布概率的公式进行时，按照计算二项分布概率的公式进行计算；样本数大于计算；样本数大于3030时，计算的是时，计算的是Z Z统计量，统计量，认为在零假设下，认为在零假设下，Z Z统计量服从正态分布。统计量服从正态分布。Z Z统统计量的计算公式如下计量的计算公式如下 SPSS SPSS将自动计算将自动计算Z Z统计量，并给出相应的统计量，并给出相应的相伴概率值。如果相伴概率小于或等于用户的相伴概率值。如果相伴概率小于或等于用户的显著性水平显著性水平，则应拒绝零假设，则应拒绝零假设H

11、0H0，认为样本，认为样本来自的总体分布形态与指定的二项分布存在显来自的总体分布形态与指定的二项分布存在显著差异；如果相伴概率值大于显著性水平，则著差异；如果相伴概率值大于显著性水平，则不能拒绝零假设不能拒绝零假设H0H0，认为样本来自的总体分布，认为样本来自的总体分布形态与指定的二项分布不存在显著差异。形态与指定的二项分布不存在显著差异。SPSSSPSS二项分布检验的数据是实际收集到的样本二项分布检验的数据是实际收集到的样本数据，而非频数数据。数据，而非频数数据。研究问题研究问题某地某一时期内出生某地某一时期内出生3535名婴儿，其中女性名婴儿，其中女性1919名名（定（定Sex=0Sex

12、=0），男性），男性1616名（定名（定Sex=1Sex=1）。问这）。问这个地方出生婴儿的性别比例与通常的男女性比个地方出生婴儿的性别比例与通常的男女性比例（总体概率约为例（总体概率约为0.50.5）是否不同？数据如表）是否不同？数据如表10-210-2所示。所示。 10.2.2 SPSS中实现过程中实现过程婴婴儿儿Sex婴婴儿儿Sex婴婴儿儿Sex111312512014126131151270411612805117029061180300701903118020032090210330100220340111231350121241 实现步骤实现步骤10.2.3 结果和讨论结果和

13、讨论10.3.1 统计学上的定义和计算公式统计学上的定义和计算公式定义：单样本变量值的随机性检验是对某定义：单样本变量值的随机性检验是对某变量的取值出现是否随机进行检验，也称为游变量的取值出现是否随机进行检验，也称为游程检验（程检验（RunRun过程）。过程）。单样本变量值的随机性检验是由单样本变量值的随机性检验是由WaldWald提提出的，它的零假设为出的，它的零假设为H0H0：总体某变量的变量值：总体某变量的变量值出现是随机的。出现是随机的。单样本变量值的随机性检验通过游程单样本变量值的随机性检验通过游程（RunRun）数来实现。所谓游程是样本序列中连）数来实现。所谓游程是样本序列中

14、连续出现的变量值的次数。续出现的变量值的次数。在在SPSSSPSS单样本变量值的随机性检验中，单样本变量值的随机性检验中，SPSSSPSS将利用游程构造将利用游程构造Z Z统计量，并依据正态分统计量，并依据正态分布表给出对应的相伴概率值。如果相伴概率小布表给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平于或等于用户的显著性水平，则应拒绝零假，则应拒绝零假设设H0H0，认为样本值的出现不是随机的；如果相，认为样本值的出现不是随机的；如果相伴概率值大于显著性水平，则不能拒绝零假设伴概率值大于显著性水平，则不能拒绝零假设H0H0，认为变量值的出现是随机的。，认为变量值的出现是随机的。1

15、0.3.2 SPSS中实现过程中实现过程研究问题研究问题某村发生一种地方病，其住户沿一条河排某村发生一种地方病，其住户沿一条河排列，调查时对发病的住户标记为列，调查时对发病的住户标记为“1”1”，对非，对非发病的住户标记为发病的住户标记为“0”0”，共，共3535户，其取值如户，其取值如表表10-310-3所示。所示。住住户户发发病病情情况况住住户户发发病病情情况况住住户户发发病病情情况况11131251201412613115127041161281511702906118030070191311802013209021033010022034011123135

16、0121241 实现步骤实现步骤10.3.3 结果和讨论结果和讨论10.4.1 统计学上的定义和计算公式统计学上的定义和计算公式定义：单样本定义：单样本K-SK-S检验是以两位前苏联数检验是以两位前苏联数学家学家KolmogorovKolmogorov和和SmirnovSmirnov命名的，也是一种命名的，也是一种拟合优度的非参数检验方法。单样本拟合优度的非参数检验方法。单样本K-SK-S检验检验是利用样本数据推断总体是否服从某一理论分是利用样本数据推断总体是否服从某一理论分布的方法，适用于探索连续型随机变量的分布布的方法，适用于探索连续型随机变量的分布形态。形态。单样本单样本K-SK-S

17、检验可以将一个变量的实际频检验可以将一个变量的实际频数分布与正态分布（数分布与正态分布（NormalNormal）、均匀分布）、均匀分布（UniformUniform）、泊松分布（）、泊松分布（PoissonPoisson）、指数）、指数（ExponentialExponential）分布进行比较。其零假设）分布进行比较。其零假设H0H0为样本来自的总体与指定的理论分布无显著差为样本来自的总体与指定的理论分布无显著差异。异。SPSSSPSS实现实现K-SK-S检验的过程如下：检验的过程如下：（1 1）根据样本数据和用户的指定构造出）根据样本数据和用户的指定构造出理论分布，查分布表得到相应的理

18、论累计概率理论分布，查分布表得到相应的理论累计概率分布函数；分布函数； SPSS SPSS在统计中将计算在统计中将计算K-SK-S的的Z Z统计量，并统计量，并依据依据K-SK-S分布表（小样本）或正态分布表（大分布表（小样本）或正态分布表（大样本）给出对应的相伴概率值。如果相伴概率样本）给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平小于或等于用户的显著性水平，则应拒绝零，则应拒绝零假设假设H0H0，认为样本来自的总体与指定的分布有，认为样本来自的总体与指定的分布有显著差异；如果相伴概率值大于显著性水平，显著差异；如果相伴概率值大于显著性水平，则不能拒绝零假设则不能拒绝零假设H0

19、H0，认为样本来自的总体与，认为样本来自的总体与指定的分布无显著差异。指定的分布无显著差异。10.4.2 SPSS中实现过程中实现过程研究问题研究问题某地某地144144个周岁儿童身高数据如表个周岁儿童身高数据如表10-410-4所所示，问该地区周岁儿童身高频数是否呈正态分示，问该地区周岁儿童身高频数是否呈正态分布？布？身身高高区区间间人人数数642684697701671207225732474227616782796831 实现步骤实现步骤10.4.3 结果和讨论结果和讨论（1 1）本例输出结果如下表所示。）本例输出结果如下表所示。10.5.1 统计学上的定义和计算公式统计学

20、上的定义和计算公式定义：两独立样本的非参数检验是在对总定义：两独立样本的非参数检验是在对总体分布不很了解的情况下，通过分析样本数据，体分布不很了解的情况下，通过分析样本数据，推断样本来自的两个独立总体分布是否存在显推断样本来自的两个独立总体分布是否存在显著差异。一般用来对两个独立样本的均数、中著差异。一般用来对两个独立样本的均数、中位数、离散趋势、偏度等进行差异比较检验。位数、离散趋势、偏度等进行差异比较检验。两个样本是否独立，主要看在一个总体中抽取两个样本是否独立，主要看在一个总体中抽取样本对另外一个总体中抽取样本有无影响。如样本对另外一个总体中抽取样本有无影响。如果没有影响，则可以认为两

21、个总体是独立的。果没有影响，则可以认为两个总体是独立的。SPSSSPSS提供了提供了4 4种两独立样本的非参数检验方法。种两独立样本的非参数检验方法。1两独立样本的两独立样本的Mann-Whitney U检验检验两独立样本的两独立样本的Mann-Whitney UMann-Whitney U检验的零假设检验的零假设H0H0为样本来自的两独立总体均值没有显著差异。为样本来自的两独立总体均值没有显著差异。两独立样本的两独立样本的Mann-Whitney UMann-Whitney U检验主要通过检验主要通过对平均秩的研究来实现推断。秩简单地说就是对平均秩的研究来实现推断。秩简单地说就是名次。如果将

22、数据按照升序进行排序，这时每名次。如果将数据按照升序进行排序，这时每一个具体数据都会有一个在整个数据中的位置一个具体数据都会有一个在整个数据中的位置或名次，这就是该数据的秩，数据有多少个，或名次，这就是该数据的秩，数据有多少个，秩便有多少个。秩便有多少个。2两独立样本的两独立样本的K-S检验检验两独立样本的两独立样本的K-SK-S检验能够对两独立样本的总检验能够对两独立样本的总体分布情况进行比较。其零假设是体分布情况进行比较。其零假设是H0H0为样本来为样本来自的两独立总体分布没有显著差异。自的两独立总体分布没有显著差异。两独立样本的两独立样本的K-SK-S检验实现方法是：首先将两检验实现方法

23、是：首先将两组样本数据（组样本数据（X1X1，X2X2，XmXm）和（）和（Y1Y1，Y2Y2，YnYn）混合并按升序排列（）混合并按升序排列（m m和和n n是两是两组样本的样本容量），分别计算两组样本秩的组样本的样本容量），分别计算两组样本秩的累计频率和每个点上的累计频率；最后将两个累计频率和每个点上的累计频率；最后将两个累计频率相减，得到差值序列数据。累计频率相减，得到差值序列数据。两独立样本的两独立样本的K-SK-S检验将关注差值序列。检验将关注差值序列。SPSSSPSS将自动计算将自动计算K-S ZK-S Z统计量，并依据正态分布表统计量，并依据正态分布表给出对应的相伴概率值。如果相

24、伴概率小于或给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平等于用户的显著性水平，则应拒绝零假设，则应拒绝零假设H0H0，认为两个样本来自的总体分布有显著差异；如认为两个样本来自的总体分布有显著差异；如果相伴概率值大于显著性水平，则不能拒绝零果相伴概率值大于显著性水平，则不能拒绝零假设假设H0H0，认为两个样本来自的总体分布无显著，认为两个样本来自的总体分布无显著差异。差异。3两独立样本的游程检验（两独立样本的游程检验（Wald-Wolfwitz Runs）两独立样本的游程检验用来检验样本来自的两两独立样本的游程检验用来检验样本来自的两独立总体的分布是否存在显著差异。其零假设独立

25、总体的分布是否存在显著差异。其零假设是是H0H0为样本来自的两独立总体分布没有显著差为样本来自的两独立总体分布没有显著差异。异。样本的游程检验中，计算游程的方法与观样本的游程检验中，计算游程的方法与观察值的秩有关。首先，将两组样本混合并按照察值的秩有关。首先，将两组样本混合并按照升序排列。在数据排序时，两组样本的每个观升序排列。在数据排序时，两组样本的每个观察值对应的样本组标志值序列也随之重新排列，察值对应的样本组标志值序列也随之重新排列，然后对标志值序列按照前面然后对标志值序列按照前面10.310.3节的方法求游节的方法求游程。程。如果计算出的游程数相对比较小，则说明如果计算出的游程数相

26、对比较小，则说明样本来自的两总体的分布形态存在较大差距；样本来自的两总体的分布形态存在较大差距；如果得到的游程数相对比较大，则说明样本来如果得到的游程数相对比较大，则说明样本来自的两总体的分布形态不存在显著差距。自的两总体的分布形态不存在显著差距。 SPSS SPSS将自动计算游程数得到将自动计算游程数得到Z Z统计量，并统计量，并依据正态分布表给出对应的相伴概率值。如果依据正态分布表给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平相伴概率小于或等于用户的显著性水平，则，则应拒绝零假设应拒绝零假设H0H0，认为两个样本来自的总体分，认为两个样本来自的总体分布有显著差异；如果相伴概

27、率值大于显著性水布有显著差异；如果相伴概率值大于显著性水平，则不能拒绝零假设平，则不能拒绝零假设H0H0，认为两个样本来自，认为两个样本来自的总体分布无显著差异。的总体分布无显著差异。4两独立样本的极端反应检验（两独立样本的极端反应检验（Moses Extreme Reactions）两独立样本的极端反应检验用来检验样本两独立样本的极端反应检验用来检验样本来自的两独立总体的分布是否存在显著差异。来自的两独立总体的分布是否存在显著差异。其零假设其零假设H0H0为样本来自的两独立总体分布没有为样本来自的两独立总体分布没有显著差异。显著差异。两独立样本的极端反应检验将一个样本作两独立样本的极端反

28、应检验将一个样本作为控制样本，另外一个样本作为实验样本。以为控制样本，另外一个样本作为实验样本。以控制样本作对照，检验实验样本是否存在极端控制样本作对照，检验实验样本是否存在极端反应。首先将两组样本混合并按升序排列；然反应。首先将两组样本混合并按升序排列；然后找出控制样本最低秩和最高秩之间所包含的后找出控制样本最低秩和最高秩之间所包含的观察值个数，即跨度（观察值个数，即跨度（SpanSpan）。为控制极端值）。为控制极端值对分析结果的影响，也可以先去掉样本两个最对分析结果的影响，也可以先去掉样本两个最极端的观察值后再求跨度，这个跨度称为截头极端的观察值后再求跨度，这个跨度称为截头跨度。跨度。

29、两独立样本的极端检验计算跨度和截头跨两独立样本的极端检验计算跨度和截头跨度。如果跨度或截头跨度很小，则表明两个样度。如果跨度或截头跨度很小，则表明两个样本数据无法充分混合，可以认为实验样本存在本数据无法充分混合，可以认为实验样本存在极端反应。极端反应。 SPSS SPSS自动计算跨度和截头跨度，依据分自动计算跨度和截头跨度，依据分布表给出对应的相伴概率值。如果相伴概率小布表给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平于或等于用户的显著性水平，则应拒绝零假，则应拒绝零假设设H0H0，认为两个样本来自的总体分布有显著差，认为两个样本来自的总体分布有显著差异；如果相伴概率值大于显著

30、性水平，则不能异；如果相伴概率值大于显著性水平，则不能拒绝零假设拒绝零假设H0H0，认为两个样本来自的总体分布，认为两个样本来自的总体分布无显著差异。无显著差异。10.5.2 SPSS中实现过程中实现过程研究问题研究问题研究两个不同厂家生产的灯泡使用寿命是研究两个不同厂家生产的灯泡使用寿命是否存在显著差异。随机抽取两个厂家生成的灯否存在显著差异。随机抽取两个厂家生成的灯泡若干，实验得到使用寿命，数据如表泡若干，实验得到使用寿命，数据如表10-510-5所所示。示。灯泡寿命（灯泡寿命（h）厂厂家家编编号号67516821691167016501693165016492680263026

31、502646265126202 实现步骤实现步骤10.5.3 结果和讨论结果和讨论（1 1）两独立样本）两独立样本Mann-Whitney UMann-Whitney U检验结检验结果如下面两表所示。果如下面两表所示。（2 2）两独立样本）两独立样本K-SK-S检验输出结果如下检验输出结果如下两表所示。两表所示。（3 3）两独立样本极端反应检验输出结果）两独立样本极端反应检验输出结果如下两表所示。如下两表所示。（4 4）两独立样本游程检验输出结果如下）两独立样本游程检验输出结果如下两表所示。两表所示。10.6.1 统计学上的定义和计算公式统计学上的定义和计算公式定义：多独立样本非参数

32、检验分析样本数定义：多独立样本非参数检验分析样本数据是推断样本来自的多个独立总体分布是否存据是推断样本来自的多个独立总体分布是否存在显著差异。在显著差异。SPSSSPSS多独立样本非参数检验一般多独立样本非参数检验一般推断多个独立总体的均值或中位数是否存在显推断多个独立总体的均值或中位数是否存在显著差异。著差异。多个样本之间是否独立，需要看在一个总多个样本之间是否独立，需要看在一个总体中抽取样本对其他总体中抽取样本是否有影体中抽取样本对其他总体中抽取样本是否有影响。如果没有影响，则认为这些总体之间是独响。如果没有影响，则认为这些总体之间是独立的。立的。例如，随机抽取例如，随机抽取3 3个班

33、级之间学生的学生个班级之间学生的学生成绩，分析成绩，分析3 3个班级总体的成绩是否存在显著个班级总体的成绩是否存在显著的差异。由于对各个班级都是随机抽取样本，的差异。由于对各个班级都是随机抽取样本，抽样没有相互影响，可以认为这三个班级学生抽样没有相互影响，可以认为这三个班级学生成绩是独立的。成绩是独立的。 SPSSSPSS中有中有3 3种多独立样本非参数检验方法。种多独立样本非参数检验方法。1多独立样本的中位数检验（多独立样本的中位数检验（Median）多独立样本的中位数检验通过对多组数据多独立样本的中位数检验通过对多组数据的分析推断多个独立总体分布是否存在显著差的分析推断多个独立总体分布是

34、否存在显著差异。多独立样本的中位数检验的零假设异。多独立样本的中位数检验的零假设H0H0为：为：样本来自的多个独立总体的中位数无显著差异。样本来自的多个独立总体的中位数无显著差异。 2多独立样本的多独立样本的K-W检验检验多独立样本的多独立样本的K-WK-W检验是检验是Kruskal-Kruskal-WaillisWaillis检验的缩写，是一种推广的平均秩检检验的缩写，是一种推广的平均秩检验。其零假设为：样本来自的多个独立总体的验。其零假设为：样本来自的多个独立总体的分布无显著差异。分布无显著差异。多独立样本的多独立样本的K-WK-W检验的基本方法是：首检验的基本方法是：首先将多组样本数

35、混合按升序排列，并求出每个先将多组样本数混合按升序排列，并求出每个观察值的秩，然后对多组样本的秩分别求平均观察值的秩，然后对多组样本的秩分别求平均值。值。如果各组样本的平均秩大致相等，则可以如果各组样本的平均秩大致相等，则可以认为多个独立总体的分布没有显著差异。如果认为多个独立总体的分布没有显著差异。如果各样本的平均秩相差很大，则不能认为多个独各样本的平均秩相差很大，则不能认为多个独立总体的分布无显著差异。立总体的分布无显著差异。3多独立样本的多独立样本的Jonkheere-Terpstra检检验验多独立样本的多独立样本的Jonkheere-TerpstraJonkheere-Terpst

36、ra检验检验用于分析样本来自的多个独立总体分布是否存用于分析样本来自的多个独立总体分布是否存在显著差异。其零假设是：样本来自的多个独在显著差异。其零假设是：样本来自的多个独立总体的分布无显著差异。立总体的分布无显著差异。多独立样本的多独立样本的Jonkheere-TerpstraJonkheere-Terpstra检验检验的基本方法和两独立样本的的基本方法和两独立样本的Mann-Whitney UMann-Whitney U检验比较类似，也是计算一组样本的观察值小检验比较类似，也是计算一组样本的观察值小于其他组样本观察值的个数。于其他组样本观察值的个数。研究问题研究问题随机抽取随机抽取3

37、 3个班级的学生，得到个班级的学生，得到2121个学生个学生成绩样本，如表成绩样本，如表10-710-7所示，问所示，问3 3个班级学生总个班级学生总体成绩是否存在显著差异？体成绩是否存在显著差异？ 10.6.2 SPSS中实现过程中实现过程学学生生成成绩绩所所属属班班级级学学生生成成绩绩所所属属班班级级60.00190.00270.00196.00271.00170.00280.00185.00375.00192.00365.00197.00390.00196.00380.00288.00385.00289.00381.00280.00383.002 实现步骤实现步骤

38、10.6.3 结果和讨论结果和讨论（1 1）多独立样本）多独立样本K-WK-W检验结果如下两表所示。检验结果如下两表所示。（2 2）多独立样本中位数检验结果如下两）多独立样本中位数检验结果如下两表所示。表所示。10.7.1 统计学上的定义和计算公式统计学上的定义和计算公式定义：两配对样本（定义：两配对样本（2 Related Samples2 Related Samples）非参数检验是在对总体分布不很清楚的情况下，非参数检验是在对总体分布不很清楚的情况下，对样本来自的两相关配对总体分别进行检验。对样本来自的两相关配对总体分别进行检验。两配对样本非参数检验一般用于同一研究两配对样本非参数

39、检验一般用于同一研究对象（或两配对对象）分别给予两种不同处理对象（或两配对对象）分别给予两种不同处理的效果比较，以及同一研究对象（或两配对对的效果比较，以及同一研究对象（或两配对对象）处理前后的效果比较。前者推断两种效果象）处理前后的效果比较。前者推断两种效果有无差别，后者推断某种处理是否有效。有无差别，后者推断某种处理是否有效。两配对样本非参数检验的前提要求两个样两配对样本非参数检验的前提要求两个样本应是配对的。在应用领域中，主要的配对资本应是配对的。在应用领域中，主要的配对资料包括：具有年龄、性别、体重、病况等非处料包括：具有年龄、性别、体重、病况等非处理因素相同或相似者。首先两个样本的

40、观察数理因素相同或相似者。首先两个样本的观察数目相同，其次两样本的观察值顺序不能随意改目相同，其次两样本的观察值顺序不能随意改变。变。 SPSS SPSS中有以下中有以下3 3种两配对样本非参数检验种两配对样本非参数检验方法。方法。1两配对样本的两配对样本的McNemar变化显著变化显著性检验性检验 McNemar McNemar变化显著性检验以研究对象自身变化显著性检验以研究对象自身为对照，检验其两组样本变化是否显著。其零为对照，检验其两组样本变化是否显著。其零假设为：样本来自的两配对总体分布无显著差假设为：样本来自的两配对总体分布无显著差异。异。 McNemarMcNemar变化显著性检验

41、要求待检验的两变化显著性检验要求待检验的两组样本的观察值是二值数据，在实际分析中有组样本的观察值是二值数据，在实际分析中有一定的局限性。一定的局限性。 McNemar McNemar变化显著性检验基本方法采用二变化显著性检验基本方法采用二项分布检验。它通过对两组样本前后变化的频项分布检验。它通过对两组样本前后变化的频率，计算二项分布的概率值。率，计算二项分布的概率值。 2两配对样本的符号（两配对样本的符号（Sign）检验）检验当两配对样本的观察值不是二值数据时，当两配对样本的观察值不是二值数据时，无法利用前面一种检验方法，这时可以采用两无法利用前面一种检验方法，这时可以采用两配对样本的符号（

42、配对样本的符号（SignSign）检验方法。其零假设）检验方法。其零假设为：样本来自的两配对样本总体的分布无显著为：样本来自的两配对样本总体的分布无显著差异。差异。两配对样本的符号检验利用正、负符号的两配对样本的符号检验利用正、负符号的个数多少来进行检验。首先，将第二组样本的个数多少来进行检验。首先，将第二组样本的各个观察值减去第一组样本对应的观察值，如各个观察值减去第一组样本对应的观察值，如果得到差值是一个正数，则记为正号；差值为果得到差值是一个正数，则记为正号；差值为负数，则记为负号。然后计算正号的个数和负负数，则记为负号。然后计算正号的个数和负号的个数。号的个数。通过比较正号的个数和

43、负号的个数，可以通过比较正号的个数和负号的个数，可以判断两组样本的分布。例如，正号的个数和负判断两组样本的分布。例如，正号的个数和负号的个数大致相当，则可以认为两配对样本数号的个数大致相当，则可以认为两配对样本数据分布差距较小；正号的个数和负号的个数相据分布差距较小；正号的个数和负号的个数相差较多，可以分为两配对样本数据分布差距较差较多，可以分为两配对样本数据分布差距较大。大。 SPSS SPSS将自动对差值正负符合序列作单样将自动对差值正负符合序列作单样本二项分布检验，计算出实际的概率值。如果本二项分布检验，计算出实际的概率值。如果得到的概率值小于或等于用户的显著性水平得到的概率值小于或等于

44、用户的显著性水平，则应拒绝零假设则应拒绝零假设H0H0，认为两配对样本来自的总，认为两配对样本来自的总体分布有显著差异；如果概率值大于显著性水体分布有显著差异；如果概率值大于显著性水平，则不能拒绝零假设平，则不能拒绝零假设H0H0，认为两配对样本来，认为两配对样本来自的总体分布无显著差异。自的总体分布无显著差异。3两配对样本的两配对样本的Wilcoxon符号平均秩符号平均秩检验检验两配对样本的符号检验考虑了总体数据变两配对样本的符号检验考虑了总体数据变化的性质，但没有考虑两组样本变化的程度。化的性质，但没有考虑两组样本变化的程度。两配对样本的两配对样本的WilcoxonWilcoxon符号

45、平均秩检验考虑符号平均秩检验考虑了这方面的因素。其零假设为：样本来自的两了这方面的因素。其零假设为：样本来自的两配对样本总体的分布无显著差异。配对样本总体的分布无显著差异。两配对样本的两配对样本的WilcoxonWilcoxon符号平均秩检验符号平均秩检验首先按照符号检验的方法，将第二组样本的各首先按照符号检验的方法，将第二组样本的各个观察值减去第一组样本对应的观察值，如果个观察值减去第一组样本对应的观察值，如果得到差值是一个正数，则记为正号；差值为负得到差值是一个正数，则记为正号；差值为负数，则记为负号。同时保存差值的绝对值数据。数，则记为负号。同时保存差值的绝对值数据。然后将绝对差值数据

46、按升序排序，并求出相应然后将绝对差值数据按升序排序，并求出相应的秩，最后分别计算正号秩总合的秩，最后分别计算正号秩总合W +W +、负号秩、负号秩总合总合WW 以及正号平均秩和负号平均秩。以及正号平均秩和负号平均秩。如果正号平均秩和负号平均秩大致相当，如果正号平均秩和负号平均秩大致相当，则可以认为两配对样本数据正负变化程度基本则可以认为两配对样本数据正负变化程度基本相当，分布差距较小。相当，分布差距较小。两配对样本的两配对样本的WilcoxonWilcoxon符号平均秩检验符号平均秩检验按照下面的公式计算按照下面的公式计算Z Z统计量，它近似服从正统计量，它近似服从正态分布态分布研究问题

47、研究问题分析分析1010个学生接受某种方法进行训练的个学生接受某种方法进行训练的效果，收集到这些学生在训练前、后的成绩，效果，收集到这些学生在训练前、后的成绩，如表如表10-910-9所示。表格的每一行表示一个学生的所示。表格的每一行表示一个学生的4 4个成绩。其中第一列表示，训练前的成绩是个成绩。其中第一列表示，训练前的成绩是否合格，否合格，0 0表示不合格，表示不合格，1 1表示合格；第二列表表示合格；第二列表示训练后的成绩是否合格，示训练后的成绩是否合格，0 0表示不合格，表示不合格，1 1表表示合格；第三列表示训练前学生的具体成绩；示合格；第三列表示训练前学生的具体成绩；第四列表示训

48、练后学生的具体成绩。问训练前第四列表示训练后学生的具体成绩。问训练前后学生的成绩是否存在显著差异？后学生的成绩是否存在显著差异？ 10.7.2 SPSS中实现过程中实现过程训练前训练前训练后训练后训练前成绩训练前成绩训练后成绩训练后成绩0158.0070.001170.0071.000145.0065.000156.0068.000045.0050.000050.0055.001161.0075.001170.0070.000155.0065.001160.0070.00 实现步骤实现步骤10.7.3 结果和讨论结果和讨论（1 1）描述性统计部分结果如下表所示。）描述性统计部分结果如下表所示。

49、（2 2）WilcoxonWilcoxon检验结果如下两表所示。检验结果如下两表所示。（3 3）符号检验结果如下两表所示。）符号检验结果如下两表所示。（4 4）McNemarMcNemar检验结果如下两表所示。检验结果如下两表所示。10.8.1 统计学上的定义和计算公式统计学上的定义和计算公式定义：多配对样本非参数检验是对多个匹定义：多配对样本非参数检验是对多个匹配样本的总体分布是否存在显著性差异进行统配样本的总体分布是否存在显著性差异进行统计分析。计分析。 SPSSSPSS中有以下中有以下3 3种多配对样本非参数检验种多配对样本非参数检验方法。方法。 1多配对样本的多配对样本的Friend

50、man检验检验多配对样本的多配对样本的FriendmanFriendman检验是利用秩实检验是利用秩实现多个配对总体分布检验的一种方法，多配对现多个配对总体分布检验的一种方法，多配对样本的样本的FriendmanFriendman检验要求数据是定距的。其检验要求数据是定距的。其零假设为：样本来自的多个配对总体的分布无零假设为：样本来自的多个配对总体的分布无显著差异。显著差异。多配对样本的多配对样本的FriendmanFriendman检验的实现原理检验的实现原理是：首先以样本为单位，将各个样本数据按照是：首先以样本为单位，将各个样本数据按照升序排列，求得各个样本数据在各自行中的秩，升序排列

展开阅读全文