SPSS的非参数检验.pptx-得力文库

资源描述

《SPSS的非参数检验.pptx》由会员分享，可在线阅读，更多相关《SPSS的非参数检验.pptx（169页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、 SPSS 中进行非参数检验由【Analyze(分析)】菜单中的【Nonparametric Tests(非参数检验)】菜单项导出。其中包括以下命令。Chi-square test：卡方检验。Binomial test：二项分布检验。Runs test：游程检验。1-Simple K-S test：单样本K-S检验。2 Independent Sample test：两个独立样本非参数检验。K Independent Samples test：多个独立样本非参数检验。2 Related Sample test：两个相关样本非参数检验。K Related Sample test：多个相关样本非参

2、数检验。第1页/共169页6.1 非参数检验概述6.1.1 非参数检验的提出非参数检验是不依赖总体分布的统计推断方法。它是指在总体不服从正态分布且分布情况不明时，用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法一般不涉及总体参数而得名。这类方法的假定前提比参数假设检验方法少得多，也容易满足，适用于计量信息较弱的资料且计算方法也简便易行，所以在实际中有广泛的应用。第2页/共169页6.1.2 非参数检验的特点和参数方法相比，非参数检验方法的优势如下：（1）稳健性。因为对总体分布的约束条件大大放宽，不至于因为对统计中的假设过分理想化而无法切合实际情况，从而对个别偏离较大的数据

3、不至于太敏感。（2）对数据的测量尺度无约束，对数据的要求也不严格，什么数据类型都可以做。（3）适用于小样本、无分布样本、数据污染样本、混杂样本等。第3页/共169页表表6-1 参数检验和非参数检验的效率比较参数检验和非参数检验的效率比较应用参数检验非参数检验对正态总体的非参数检验的效率评价配对样本数据两个独立样本多个独立样本相关随机性t检验或者z检验t检验或者z检验方差分析(F检验)线性相关无可用的参数检验符号检验Wilcoxon检验Wilcoxon检验K-W检验秩相关检验游程检验0.630.950.950.950.91没有可比较的基础第4页/共169页6.2 SPSS 在卡方检验中的应用1

4、.使用目的卡方检验（Chi-Squar Test）也称为卡方拟合优度检验，是给出的一种最常用的非参数检验方法。它用于检验观测数据是否与某种概率分布的理论数值相符合，进而推断观测数据是否是来自于该分布的样本的问题。2.基本原理进行卡方检验时，首先提出零假设：样本X来自的总体分布服从期望分布或某一理论分布。接着，利用实际观测值的频数与理论的期望频数之间的差异来构造检验统计量，它描述了观察值和理论值之间的偏离程度。3.软件使用方法 SPSS会自动计算出2统计量及对应的相伴概率P值。第5页/共169页6.2.2 卡方检验的SPSS操作详解Step01：打开主菜单选择菜单栏中的【Analyze(分

5、析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Chi-Square(卡方)】命令，弹出【Chi-Square Test(卡方检验)】对话框。第6页/共169页Step02：选择检验变量在【Chi-Square Test(卡方检验)】对话框左侧的候选变量列表框中选择一个或几个变量，将其添加至【Test Variable List(检验变量列表)】列表框中，表示需要进行进行卡方检验的变量。Step03：确定检验范围在【Expected Range(期望全距)】选项组中可以确定检验值的范围，对应有两个单选项。Step04：选择期望值

6、在【Expected Values(期望值)】选项组中可以指定期望值，对应有两个单选项。第7页/共169页Step05：选择计算精确概率单击【Exact】按钮，弹出【Exact Tests(精确检验)】对话框，该对话框用于选择计算概率P值的方法。第8页/共169页Step06：其他选项选择单击【Options】按钮，弹出【Options(选项)】对话框，该对话框用于指定输出内容和关于缺失值的处理方法.Step07单击【OK】按钮，结束操作，SPSS软件自动输出结果。第9页/共169页6.2.3 实例图文分析：人员结构的调动1.实例内容某公司经营多年，形成了一套成熟的企业文化和管理体系，例

7、如根据多年的运营经验，经理层、监察员、办事员三种职务类别人员比例大约在15：5：80为宜，这样运行效率最高。目前公司进行人事调整，公司人员结构发生变动，有员工担心是否人事调整已经导致职务类型比例的失调。请利用数据文件来解决该问题。三种职务的期望构成比为15、5和80。而目前样本中观察到的三种职务的人数比为84：27：363，构成比分别是、和，和理论值有差异。那么这种差异是由随机误差造成的，还是真的构成比和以前有所变化？该问题就可以用2检验来实现。相应的假设检验如下。H0：目前三个职业的总体构成比仍然是15、5和80。H1：目前三个职业的总体构成比不再是15、5和80。第10页/共169页2.实

8、例操作Step01：打开对话框打开数据文件，选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Chi-Square(卡方)】命令，弹出【Chi-Square Test(卡方检验)】对话框。其中，“jobcat”变量表示职业类型，“1”表示办事员，“2”表示监察员，“3”表示经理。Step02：选择检验变量在左侧的候选变量列表框中选择“jobcat”变量作为检验变量，将其添加至【Test Variable List(检验变量列表)】列表框中。第11页/共169页Step03：选择期望值在【Expec

9、ted Values(期望值)】选项组中点选【Values】单选钮，以指定期望概率值。接着在Values的文本框中分别输入、和这三个数值，并且单击【Add】按钮加以确定。Step04：完成操作最后，单击【OK(确定)】按钮，操作完成。第12页/共169页3 实例结果及分析 SPSS的结果报告中列出了期望频数和实际频数。显然残差值越小，说明实际频数与期望频数越接近。Observed NExpected NResidualClerical363379.2-16.2Custodial2723.73.3Manager8471.112.9Total474（1）频数表第13页/共169页（2）卡方检验表

10、具体包括统计量（Chi-Square）、自由度（df）和近似概率P值（Asymp.Sig.）。可见，统计量等于，自由度等于2，对应的概率P值大于显著性水平。因此接受零假设，认为目前三个职业的总体构成比仍然是15、5和80，人数的调动只是随机误差造成的，公司人员结构没有显著性改变。Employment CategoryChi-Square3.492adf2Asymp.Sig.174第14页/共169页6.3 SPSS在二项分布检验中的应用6.3.1 二项分布检验的基本原理1.方法概述事件要服从二项分布，则应该具备下列基本的条件。（1）各观察单位只能具有相互对立的一种结果。（2）已知发生某一结

11、果（阳性）的概率为，其对立结果的概率为1-。（3）n次试验在相同条件下进行，且各个观察单位的观察结果相互独立，即每个观察单位的观察结果不会影响到其他观察单位的结果。第15页/共169页2.软件使用方法 SPSS二项分布检验过程是推断总体的分布是否等于指定的某个二项分布。其假设检验过程如下。H0：样本来自的总体与某个指定的二项分布无显著性差异。H1：样本来自的总体与某个指定的二项分布有显著性差异。SPSS会自动计算出二项分布检验相应的检验统计量及对应的概率P值。如果概率P值小于或等于用户设定的显著性水平，则拒绝零假设，认为总体与某个指定的二项分布有显著性差异；相反的，如果概率P值大于显著性水平，

12、则接受零假设。需要注意的是，二项分布检验过程要求变量必须是数值型的二元变量（只取两个可能值的变量）。假如变量是字符型的，可以使用重编码功能将其转化为数值型变量；假如变量不是二元变量，需要设置断点将数据分为两个部分，将大于断点值的归为一组，其余归为另一组。第16页/共169页6.3.2 二项分布检验的SPSS操作详解 Step01：打开主菜单选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Binomial(二项式)】命令，弹出【Binomial Test(二项式检验)】对话框。第17页/共169页St

13、ep02：选择检验变量在【Binomial Test(二项式检验)】对话框左侧的候选变量列表框中选择一个或几个变量，将其添加至【Test Variable List(检验变量列表)】列表框中，表示需要进行进行二项分布检验的变量。Step03：定义二元变量在【Define Dichotomy(定义二分法)】选项组中可以定义二元变量。Step04：指定检验概率值在【Test Proportion(检验比例)】选项组中可以指定二项分布的检验概率值。系统默认的检验概率值是，这意味着要检验的二项是服从均匀分布的。如果所要检验的二项分布不是同概率分布，参数框中要键入第一组变量所对应的检验概率值。第1

14、8页/共169页Step05：选择计算精确概率【Exact】按钮用于选择计算概率P值的方法。Step06：其他选项选择【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step07：单击【OK】按钮，结束操作，SPSS软件自动输出结果。第19页/共169页6.3.3 实例图文分析：灯泡是否合格1.1.实实例例内内容容某灯泡厂生产的一种特制灯泡按照工艺技术标准的要求，其合格灯泡的寿命必须大于960小时。通常在生产稳定的时候，该厂的这种产品合格品率为95，为检验产品质量，今从新生产的一大批产品中随机抽查了30只灯泡，测得它们的寿命的数据资料，试根据这些样品数据检验该批产品的合格率

15、是否等于95。1070 1073 958 958 975 969 1079 964 968 947962 970 1054 987 967 969 967 1001 994 9931084 1012 985 994 964 952 951 987 963 957第20页/共169页2.实例操作Step01：打开对话框打开数据文件，选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Binomial(二项式)】命令，弹出【Binomial Test(二项式检验)】对话框。第21页/共169页Step02：

16、选择检验变量在左侧的候选变量列表框中选择“time”变量作为检验变量，将其添加至【Test Variable List(检验变量列表)】列表框中。第22页/共169页Step03：定义二元变量在【Define Dichotomy(定义二分法)】选项组中点选【Cut point(割点)】，以指定断点。接着在其文本框中输入“960”，表示以它作为分界点将原始样本分为两组。Step04：指定检验概率值在【Test Proportion(检验比例)】文本框中输入指定概率值“”。第23页/共169页Step05：描述性统计量输出单击【Options】按钮，弹出【Options(选项)】对话框。

17、在【Statistics(统计量)】选项组中勾选【Descriptive(描述性)】和【Quartiles(四分位数)】复选框，表示输出基本统计量。再单击【Continue】按钮，返回【Binomial Test(二项式检验)】对话框。第24页/共169页Step06：完成操作最后，单击【OK(确定)】按钮，操作完成。第25页/共169页3.实例结果及分析（1）基本统计量 SPSS首先输出了样本的描述性统计量表。这里共选择了30个灯泡寿命样本作二项分布检验，灯泡的平均寿命等于小时，标准差等于小时，灯泡寿命最小值等于947小时，寿命最大值等于1084小时。同时其25、50和75分位点等于、和

18、小时。NMeanStd.DeviationMinimumMaximumPercentiles25th50th(Median)75th灯泡寿命30989.1340.9689471084962.75969.50995.75第26页/共169页（2）二项分布检验表首先根据断点“960”将原始数据划分为两部分：“Group 1”和“Group 2”，它们各自的样本容量等于6和24，所占总体的比例为20和80。由于这里要检验合格率是否等于95，也就是要检验“Group 1”组所占比例是否等于。但根据单尾概率P值（）小于显著性水平（），可以判断这批样本的合格率不等于95，即这批产品没有合格。Categ

19、oryNObserved Prop.Test Prop.Asymp.Sig.(1-tailed)灯泡寿命Group 1 96024.80Total301.00第27页/共169页6.4 SPSS 在游程检验中的应用6.4.1 游程检验的基本原理1.方法概述游程检验是一种利用游程数所作的单样本随机性的检验方法，它可以用来判断观察值的顺序是否为随机。许多统计模型的假设中都要求观察值都是独立的，也就是说，收集到的数据样本的顺序是不相关的。如果样本顺序影响到统计结果，那么样本就可能不是随机的，这将使研究者不能得出关于抽样总体的准确结论。因此，研究者可以使用游程检验来检验数据的随机性。第28页/共16

20、9页2.基本原理游程检验可用来检验任何序列的随机性，而不管这个序列是怎样产生的；此外还可用来判断两个总体的分布是否相同，从而检验出它们的位置中心有无显著差异。3.软件使用方法 SPSS中利用游程数构造Z统计量，利用Z统计量的分布来检验序列是否具有随机性。软件将自动计算出Z统计量的取值及对应的概率P值。如果概率P值小于或等于用户设定的显著性水平，则拒绝零假设，认为变量不具有随机性；相反的，如果概率P值大于显著性水平，则认为变量出现是随机的。第29页/共169页6.4.2 游程检验的SPSS操作详解Step01：打开对话框选择菜单栏中的【Analyze(分析)】【Nonparametric T

21、ests(非参数检验)】【Legacy Dialogs(旧对话框)】【Runs(游程)】命令，弹出【Runs Test(游程检验)】对话框。第30页/共169页Step02：选择检验变量在【Runs Test(游程检验)】对话框左侧的候选变量列表框中选择一个或几个变量，将其添加至【Test Variable List(检验变量列表)】列表框中，表示需要进行游程检验的变量。Step03：确定断点在【Cut point(割点)】选项组中指定计算游程数的分界值。小于分界值的观察值归为一组，其余的归为另一组，然后计算游程数。第31页/共169页Step04：选择计算精确概率【Exact】按钮用于

22、选择计算概率P值的方法，它的功能和卡方检验中的相应按钮相同的。Step05：其他选项选择【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step06：单击【OK】按钮，结束操作，SPSS软件自动输出结果。第32页/共169页6.4.3 实例图文分析：企业盈亏预测1.实例内容已知某企业在过去20年的盈亏情况为“0 0 0 0 1 1 1 1 1 1 1 0 0 0 1 1 1 1 1 1”。其中“0”表示亏损，“1”表示盈利。现根据财务统计预测今年该企业盈利，请问这个结果对企业明年的经营状况有无影响？2.实例操作根据过去20年的经营情况看到该企业的盈亏情况经常逐年发生变化。已

23、知今年企业盈利，要判断明年企业的盈亏状态，其实就是要分析今年企业的盈利是否会对明年它的盈亏带来一定的影响。也就是说，要判断不同年份之间的盈亏情况有无影响性，即盈亏情况是否是随机的。这样就可以通过游程检验来分析历史数据。如果历史数据是随机的，说明今年的盈利不会对明年企业的生产产生影响；反之，表明今年的盈利会对明年生产有影响。所以采用SPSS具体操作步骤如下。第33页/共169页Step01：打开对话框打开数据文件，选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Runs Test(游程检验)】命令，弹

24、出【Runs Test(游程检验)】对话框。其中“x”变量表示企业盈亏状态，“0”表示亏损，“1”表示盈利。第34页/共169页Step02：选择检验变量在候选变量列表框中选择“x”变量作为检验变量，将其添加至【Test Variable List(检验变量列表)】列表框中。Step03：确定断点在【Cut point(割点)】选项组中取消勾选【Median(中位数)】复选框，勾选【Mean(均值)】复选框。第35页/共169页Step04：完成操作最后，单击【OK(确定)】按钮，操作完成。第36页/共169页3.实例结果及分析首先“Test Value”表示游程检验以作为断点将原始数据

25、分为两组。在过去20年中，企业亏损的年份数共有7年，而在剩下的13年里该企业都是盈利的。整个历史数据的游程数等于4。接着计算游程检验的Z统计量等于-，相伴概率P值显然小于显著性水平。所以，认为企业盈亏历史数据并不是随机的，其中有一定的规律性。因此，今年企业的盈利会对明年企业的经营状况产生显著影响。盈亏Test Valuea.65Cases=Test Value13Total Cases20Number of Runs4Z-2.843Asymp.Sig.(2-tailed).004第37页/共169页6.4.4 实例进阶分析：工业和商业企业的负债水平1.实实例例内内容容在我国的工业和商业企业中

26、随机抽取22家企业进行资产负债率行业差异分析，其1999年底的资产负债率（）如下，请问两个行业的负债水平是否有显著性差异？工业企业647655825982707561647383商业企业77808065939184918486第38页/共169页2.实例操作要检验工业和商业企业的负债水平是否有差异，可以将两组数据混合起来，同时用“1”表示数据来自工业企业，“2”表示数据来自商业企业。接着将这些序列按照升序或降序重新排列。这样可以得到由1和2构成的数列，如1221122。如果两个行业的负债水平没有差异，它们的资产负债率按大小应该是随机混合排列的，则构成的这组数列应该是随机的；否则说明工业和商业

27、企业的负债水平有一定的规律性，即两个行业有一定的差异性。第39页/共169页SPSS具体操作步骤 Step01：打开数据文件，其中“fzl”变量表示企业的资产负债率；“indicate”变量表示企业类型，“1”表示工业企业，“2”表示商业企业。Step02：选择菜单栏中的【Data(数据)】【Sort Cases(排序个案)】命令，弹出【Sort Cases(排序个案)】对话框。在候选变量列表框中选择变量“fzl”，添加至【Sort by(排序依据)】列表框中。这步的目的就是要按照企业负债率的高低对“indicate”变量重新排序。第40页/共169页Step03：接着利用游程检验分析“ind

28、icate”变量的随机性。选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Runs Test(游程检验)】命令，弹出【Runs Test(游程检验)】对话框。在候选变量列表框中选择“indicate”变量作为检验变量，将其添加至【Test Variable List(检验变量列表)】列表框中。Step04：在【Cut point(割点)】选项组中取消勾选系统默认的【Median(中位数)】复选框，勾选【Mean(均值)】复选框。Step05：单击【Runs Test(游程检验)】对话框中的【OK】按钮

29、，完成操作。第41页/共169页3.实例结果及分析根据第二步操作，数据文件的“indicate”变量进行了重新排列，形成了序列：1 1 1 1 1 2 1 1 1 1 2 2 2 1 1 1 2 2 2 2 2 2 这个序列是按照资产负债率的高低将企业类型“indicate”进行重新排列得到的。下面表6-9是这组序列的游程检验结果。游程检验的Z统计量值等于-，概率P值小于显著性水平，说明这组数据不是随机序列，数据的排序呈现一定的规律性。因此，工业企业和商业企业的负债水平有显著性差异。第42页/共169页indicateTest Valuea1.45Cases=Test Value10Tota

30、l Cases22Number of Runs6Z-2.384Asymp.Sig.(2-tailed).017第43页/共169页6.5 SPSS在单样本K-S检验中的应用6.5.1 单样本K-S检验的基本原理1.方法概述 K-S检验是以两位前苏联数学家柯尔莫哥（Kolmogorov）和斯米诺夫（Smirnov）命名的，是一种拟和优度的非参数检验方法。单样本K-S检验是利用样本数据推断总体是否服从某一理论分布，一般来说它是比卡方检验更精确的非参数检验法。第44页/共169页2.基本原理 K-S检验的理论分布可以为正态分布、均匀分布、指数分布和泊松分布等。其零假设是：样本来自的总体与指定的理论分

31、布无显著差异。它的基本思想是：根据样本数据和用户的指定构造出理论分布，查分布表得到相应的理论累计概率分布函数F0(x)；利用样本数据计算各样本数据点的累计概率，得到经验累计概率分布函数S0(x)；计算S0(x）和F0(x)在相同变量值点x上的差D(x)，得到差值序列D。单样本K-S检验主要对差值D序列进行研究。3.软件使用方法 SPSS将自动计算K-S检验中的Z统计量，依据K-S分布表（小样本）或正态分布表（大样本）给出相应的相伴概率P值。如果P值小于或等于用户指定的显著性水平，则拒绝原假设H0；反之，不能拒绝H0，可以认为样本来自的总体与指定的分布无显著差异。第45页/共169页6.5.2

32、单样本K-S检验的SPSS操作详解Step01：打开对话框选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【1-samples K-S(1样本K-S(1)】命令，弹出【One-Sample K-S Test(单样本K-S检验)】对话框，这是K-S检验的主操作窗口。第46页/共169页Step02：选择检验变量在【One-Sample Kolmogorov-Smirnov Test(单样本K-S检验)】对话框左侧的候选变量列表框中选择一个或几个变量，将其添加至【Test Variable List(检

33、验变量列表)】列表框中，表示需要进行K-S检验的变量。Step03：选择待检验理论分布在【Test Distribution(检验分布)】选项组中，用户需要选择待检验的理论分布。系统提供了四种统计中常见的分布。第47页/共169页Step04：选择计算精确概率【Exact】按钮用于选择计算概率P值的方法，它的功能和卡方检验中相关按钮是相同的。Step05：其他选项选择【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step06：单击【OK】按钮，结束操作，SPSS软件自动输出结果。第48页/共169页6.5.3 实例分析：商品销售收益的分布1.实例内容零售商希望了解某商品

34、销售收益（零售商希望了解某商品销售收益（Revenue）的大致分布情况。依）的大致分布情况。依据其他销售商已有的资料，他认为其销售收益可能服从正态分布。为了据其他销售商已有的资料，他认为其销售收益可能服从正态分布。为了检验其假设，考虑是否与其他零售商一样，销售收益服从正态分布，收检验其假设，考虑是否与其他零售商一样，销售收益服从正态分布，收集到相关的销售收益数据，请使用集到相关的销售收益数据，请使用SPSS软件分析样本数据是否服从正态软件分析样本数据是否服从正态分布。分布。第49页/共169页2.实例操作本案例的目的就是要检验文件中的“revenue”变量是否服从正态部分，因此可以采用非参数

35、K-S检验来判断。首先，通过描述性统计功能绘制了“revenue”变量的直方图及其拟合的正态曲线，具体见图6-19。从图形特征看到，“revenue”变量的分布非常接近正态分布，但需要采用K-S检验来诊断。第50页/共169页Step01：打开对话框打开数据文件，选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【1-samples K-S(1样本K-S(1)】命令，弹出如下图所示的对话框。第51页/共169页Step02：选择检验变量在候选变量列表框中选择“revenue”变量作为检验变量，将其添加

36、至【Test Variable List(检验变量列表)】列表框中。提示：可以在【Test Distribution(检验分布)】选项组中选择检验分布类型；系统默认为正态分布。第52页/共169页Step03：确定断点单击【Options】按钮，在弹出的对话框的【Statistics(统计量)】选项组中勾选【Descriptive(描述性)】和【Quartiles(四分位数)】复选框，表示输出基本统计量。单击【Continue】按钮返回主对话框。第53页/共169页Step04：完成操作最后，单击【OK(确定)】按钮，操作完成。第54页/共169页3.实例结果及分析（1）描述性统计量输出 S

37、PSS首先给出了“revenue”变量的基本统计量。样本总数N等于1488，收益均值等于，收益标准差等于，收益最小值和最大值分别是$13和$6,213，收益25、50和75的分位数是、和。NMeanStd.DeviationMinimumMaximumPercentiles25th50th(Median)75thRevenue1488$2,516.58$994.586$13$6,213$1,830.96$2,490.68$3,183.54第55页/共169页（2）K-S检验结果表检验结果表给出了原假设：销售收益服从均值为、标准差为的正态分布。给出了K-S检验关键结果：实际分布和检验分布之间的正

38、向最大频数差为，负向最大频数差为-，因此用于计算统计量的绝对值最大频数差为。随后的K-S统计量Z值等于，相应的概率P值为，大于显著性水平。所以接受零假设，认为该厂商的销售收益服从正态分布。RevenueN1488Normal ParametersaMean$2,516.58Std.Deviation$994.586Most Extreme DifferencesAbsolute0.019Positive0.019Negative-0.010Kolmogorov-Smirnov Z0.750Asymp.Sig.(2-tailed)0.627第56页/共169页P-P图除了采用上述非参数K-S检

39、验来判断单样本的分布外，还可以利用P-P图和Q-Q图直观判别样本的分布。选择菜单栏中的【Analyze(分析)】【Descriptive Statistics(描述统计)】【P-P Plots(P-P图)】命令，即可生成P-P图。第57页/共169页6.6 SPSS在两独立样本非参数检验中的应用6.6.1 两独立样本非参数检验的方法原理1.方法概述两独立样本的非参数检验是在对总体分布不甚了解的情况下，通过分析样本数据，推断样本来自的两个独立总体的分布是否存在显著差异。这种检验方法一般通过独立总体的均值或中位数是否存在显著差异来推断。关于样本之间是否独立，主要看在一个总体中抽取样本对在另一个总

40、体中抽取样本有无影响。如果没有影响，则可以认为这两个总体是独立的。2.基本原理 SPSS提供了四种相关的非参数检验方法：曼-惠特尼U检验、K-S检验、极端反应检验、游程检验。第58页/共169页6.6.2 两独立样本非参数检验的SPSS操作详解Step01：打开主菜单选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【2 Independent Samples(2个独立样本)】命令，弹出【Two-Independent-Samples Tests(两个独立样本检验)】对话框。第59页/共169页Step

41、02：选择检验变量在【Two-Independent-Samples Tests(两个独立样本检验)】对话框左侧的候选变量列表框中选择一个或几个变量，将其添加至【Test Variable List(检验变量列表)】列表框中，这里表示需要进行两独立样本检验的变量。Step03：选择分组变量在【Two-Independent-Samples Tests(两个独立样本检验)】对话框左侧的候选变量中选择分组变量，将其添加至【Grouping Variable(s)(分组变量)】文本框中，目的是要区分检验变量的不同组别。单击【Grouping Variables】按钮，在弹出的对话框的【Group

42、1(组1)】和【Group2(组2)】文本框中分别输入整数值，这两个值确定的分组将选择的检验变量的观测值分为两组或者分成两个样本，并将检验变量的其他数值排除在检验分析之外。设置完成后，单击【Continue】按钮，返回主对话框。第60页/共169页Step04：选择检验方法在【Test Type(检验类型)】选项组中，用户需要选择两独立样本检验的方法。系统提供了四种常用方法：Mann-Whitney U(曼-惠特尼U检验)、Kolmogorov-Smirnov Z(K-S检验)、Moses Extreme Reactions(极端反应检验)和Wald-Wolfwitz Runs(游程检验)。

43、第61页/共169页Step05：选择计算精确概率【Exact】按钮用于选择计算概率P值的方法。Step06：其他选项选择【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step07：单击【OK】按钮，结束操作，SPSS软件自动输出结果。第62页/共169页6.6.3 实例图文分析：日本和美国公司的市盈率1.实实例例内内容容一个公司的市盈率是指这家公司股票的当前价格除以最近12个月的每股收益。下表列出了10家日本公司和12家美国公司的市盈率，这两个国家公司的市盈率之间是否存在显著差异？日本美国公司市盈率公司市盈率Sumitomo Corp.KindenHeiwaNCP Ja

44、panSuzuki MotorFuji BankSumitomo ChemicalSeibu RailwayShiseidoTodo Gas153211812531213646663368GannetMotorolaSchlumbergerOracle SystemsGapWinn-DixieIngersoll-RandAmerican Electric PowerHerculesTimes MirrorWellPoint HealthNorthern States Power192424432214211421381514第63页/共169页2.实例操作本案例的目的就是要检验日本和美国公司

45、的市盈率是否有显著差异。由于这里样本量较少，难以确定这两个总体的分布，因此可以引入非参数的检验方法。由于讨论的两个样本相互独立，故引入两独立样本非参数检验方法。于是建立如下假设检验。H0：日本公司和美国公司的市盈率没有显著差异。H1：日本公司和美国公司的市盈率存在显著差异。主要是比较日本和美国公司的平均市盈率是否相同，所以采用曼-惠特尼U检验方法。第64页/共169页Step01：打开对话框打开数据文件，选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【2 Independent Samples(2个

46、独立样本)】命令，弹出如下图所示的对话框。第65页/共169页Step02：选择检验变量在左侧的候选变量列表框中选择“PE”变量作为检验变量，将其添加至【Test Variable List(检验变量列表)】列表框中。Step03：选择分组变量选择分组变量x，将其添加至【Grouping Variable(s)(分组变量)】文本框中。第66页/共169页Step04：确定分组标号单击【Grouping Variables】按钮，弹出相应对话框，在【Group1(组1)】文本框中输入“1”，在【Group2(组2)】文本框中输入“2”，分别表示分组的标号。输入完成后，单击【Continue

47、】按钮返回主对话框。第67页/共169页Step05：完成操作最后，单击【OK(确定)】按钮，操作完成。第68页/共169页3.实例结果及分析（1）描述性统计量 NMeanStd.DeviationMinimumMaximumPercentiles25th50th(Median)75th市盈率2275.5000141.6019714.00666.0018.750024.000065.0000国家221.5455.509651.002.001.00002.00002.0000第69页/共169页3.实例结果及分析（2）曼-惠特尼U检验的秩统计表国家NMean RankSum of Ranks

48、市盈率日本1015.70157.00美国128.0096.00Total22第70页/共169页3.实例结果及分析（3）曼-惠特尼U检验结果表市盈率Mann-Whitney U18.000Wilcoxon W96.000Z-2.776Asymp.Sig.(2-tailed)0.005Exact Sig.2*(1-tailed Sig.)0.004a第71页/共169页6.7 SPSS在多独立样本非参数检验中的应用6.7.1 多独立样本非参数检验的基本原理1.方法概述多独立样本的非参数检验是通过分析多组独立样本数据，推断样本来自的多个总体的分布是否存在显著差异。这里样本间的独立是指在一个总体

49、中抽取样本对在其他总体中抽取样本无影响。2.基本原理 SPSS提供的多独立样本非参数检验的方法主要包括：Kruskal-Wallis H检验、中位数检验（Median检验、Joneckheere-Terpstra检验。第72页/共169页6.7.2 多独立样本非参数检验的SPSS操作详解Step01：打开对话框选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【K Independent Samples(K个独立样本)】命令，弹出【Tests for Several Independent Sample

50、s(多个独立样本检验)】对话框，这是多独立样本非参数检验的主操作窗口。第73页/共169页6.7.2 多独立样本非参数检验的SPSS操作详解Step02：选择检验变量在主对话框左侧的候选变量列表框中选择一个或几个变量，将其添加至【Test Variable List(检验变量列表)】列表框中，这里表示需要进行多独立样本检验的变量。第74页/共169页6.7.2 多独立样本非参数检验的SPSS操作详解Step03：选择分组变量在主对话框左侧的候选变量中选择分组变量，将其添加至【Grouping Variable(s)(分组变量)】文本框中，目的是要区分检验变量的不同组别。单击【Groupin

展开阅读全文