秩和检验幻灯片.ppt

上传人:石*** 文档编号:48389795 上传时间:2022-10-06 格式:PPT 页数:48 大小:2.56MB
返回 下载 相关 举报
秩和检验幻灯片.ppt_第1页
第1页 / 共48页
秩和检验幻灯片.ppt_第2页
第2页 / 共48页
点击查看更多>>
资源描述

《秩和检验幻灯片.ppt》由会员分享,可在线阅读,更多相关《秩和检验幻灯片.ppt(48页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、秩和检验第1页,共48页,编辑于2022年,星期一第2页,共48页,编辑于2022年,星期一一、参数统计与非参数统计参数统计与非参数统计的概念 从总体中随机抽取一定含量的样本,用样本指标估计(推断)总体从总体中随机抽取一定含量的样本,用样本指标估计(推断)总体指标,大体上有两种方法。一是参数统计,另一种是非参数统计。指标,大体上有两种方法。一是参数统计,另一种是非参数统计。1、参数统计、参数统计 指指在在总总体体分分布布类类型型已已知知的的条条件件下下,对对其其未未知知参参数数进进行行检检验验的的方方法法。要求独立、正态(方差齐),如要求独立、正态(方差齐),如t检验、检验、F检验均属于参数统

2、计。检验均属于参数统计。2、非参数统计、非参数统计 主要采用符号或等级排列(秩排列)来代替数据本身的分析方法。主要采用符号或等级排列(秩排列)来代替数据本身的分析方法。它适用于它适用于任何分布类型资料任何分布类型资料的统计分析。秩和检验就是一种非参数检的统计分析。秩和检验就是一种非参数检验方法。验方法。第3页,共48页,编辑于2022年,星期一适用条件参数统计参数统计:a.样本所在总体呈正态分布样本所在总体呈正态分布 b.各总体方差要齐各总体方差要齐 c.各个样本是相互独立的随机样本各个样本是相互独立的随机样本非参数统计非参数统计:a.总体分布为偏态或分布未知的计量资料;总体分布为偏态或分布未

3、知的计量资料;b.等级资料;等级资料;c.个别数据偏大或小,一端或两端是不确定数值的资料(必选);个别数据偏大或小,一端或两端是不确定数值的资料(必选);d.各组离散程度相差悬殊,即各总体方差不齐。各组离散程度相差悬殊,即各总体方差不齐。第4页,共48页,编辑于2022年,星期一优 点参数统计:检验效能高(发现差别的能力,即把握度)。参数统计:检验效能高(发现差别的能力,即把握度)。非参数统计:非参数统计:a.适用于任何分布的资料适用于任何分布的资料 b.不受总体方差一致的限制不受总体方差一致的限制 c.可用于等级资料的统计分析可用于等级资料的统计分析 d.有些问题本身没有适当的参数检验方法,

4、有些问题本身没有适当的参数检验方法,而非参数检验则恰能处理而非参数检验则恰能处理第5页,共48页,编辑于2022年,星期一缺 点参数统计:易受使用条件的限制参数统计:易受使用条件的限制非参数统计:非参数统计:a.由于它没有充分利用原始数据中所提供的信息,由于它没有充分利用原始数据中所提供的信息,故检验效能低故检验效能低 b.很多非参数统计检验方法都采用一些近似估计作很多非参数统计检验方法都采用一些近似估计作 出推断结论。因此,其结果有一定的近似性。出推断结论。因此,其结果有一定的近似性。第6页,共48页,编辑于2022年,星期一 参数检验与非参数检验比较参数检验与非参数检验比较参数检验参数检验

5、 非参数检验非参数检验 资料服从正态分布资料服从正态分布 1 1、对资料没有特殊要求,总体为偏态、总体分布、对资料没有特殊要求,总体为偏态、总体分布未知的计量资料未知的计量资料2 2、等级资料、等级资料3 3、有过大、有过大/小值的数据,或数据某一端没有具体值小值的数据,或数据某一端没有具体值4 4、总体方差不齐、总体方差不齐 检验效率高检验效率高 检验效率低,容易犯第二类错误,原因信息丧失或信息检验效率低,容易犯第二类错误,原因信息丧失或信息利用不足利用不足。第7页,共48页,编辑于2022年,星期一秩和检验秩和检验第一节第一节 配对资料符号秩和检验配对资料符号秩和检验第二节第二节 两样本比

6、较的秩和检验两样本比较的秩和检验第三节第三节 多个样本比较的秩和检验多个样本比较的秩和检验第8页,共48页,编辑于2022年,星期一秩次:观察值由小到大排列后得到的秩序号,当几 个数据大小相同时,取平均秩次作为其秩次。秩和:用秩次代替原始数据求和得到。秩和检验:用秩和进行假设检验的方法。第9页,共48页,编辑于2022年,星期一一、配对资料秩和检验(Wilcoxon符号秩和检验法)当配对设计计量资料不具备参数检验的适用条件,可采用符号秩和检验法。它是将配对样本差值的中位数与0作比较第10页,共48页,编辑于2022年,星期一例:例:某研究者欲研究保健食品对小鼠抗疲劳作用,将同种属的小鼠按性别和

7、年龄相同、体重相近配成对子,共10对,并将每对中的两只小鼠随机分到保健食品两个不同的剂量组,过一定时期将小鼠杀死,测得其肝糖原含量(mg/100g),结果见表10-1,问不同剂量组的小鼠肝糖原含量有无差别?第11页,共48页,编辑于2022年,星期一表表10-1 不同剂量组小鼠肝糖原含量不同剂量组小鼠肝糖原含量(mg/100g)number中剂量高剂量1620.16958.472866.50838.423641.22788.904812.91815.205738.96783.176899.38910.927760.78758.498694.95870.809749.92862.2610793.

8、94805.48第12页,共48页,编辑于2022年,星期一 1、建立检验假设 H0:差值的总体中位数等于0,即Md0 H1:差值的总体中位数不等于0,即Md0 双侧=0.05 2、计算统计量T值检验步骤第13页,共48页,编辑于2022年,星期一(1 1)求差值:计算各对数据的差值)求差值:计算各对数据的差值(2 2)编秩:按差值绝对值由小到大编秩。编秩时差值为)编秩:按差值绝对值由小到大编秩。编秩时差值为0 0,则舍去,则舍去 不计;若差值的绝对值相等,称为相持,此时取平均秩次。不计;若差值的绝对值相等,称为相持,此时取平均秩次。3 3、求秩和并确定统计量、求秩和并确定统计量T T:将所有

9、的秩次冠以原差值的符号,分别求出正负差值秩次之和,分别以将所有的秩次冠以原差值的符号,分别求出正负差值秩次之和,分别以T+,T表示。表示。双侧双侧Tmin(T+,T);单侧任取其一为;单侧任取其一为T。本例本例T+=48.5;T=6.5第14页,共48页,编辑于2022年,星期一number中剂量高剂量差值秩次1620.16958.47338.31102866.50838.42-28.08-53641.22788.90147.6884812.91815.202.291.55738.96783.1744.2166899.38910.9211.543.57760.78758.49-2.29-1.5

10、8694.95870.80175.8599749.92862.26112.34710793.94805.4811.543.5第15页,共48页,编辑于2022年,星期一4、确定P值和作出推断结论第16页,共48页,编辑于2022年,星期一4 4、确定、确定P P值和作出推断结论值和作出推断结论 n表示差数不为表示差数不为0的对子数,本例:的对子数,本例:n=10。当当n50时,查附表时,查附表9确定确定P值,该表中列出的是一个范围:值,该表中列出的是一个范围:第17页,共48页,编辑于2022年,星期一 在n=10处,有范围:847;由于T=6.5在此范围之外,即有:P0.05,拒绝H0,接受

11、H1。认为差值的中位数 Md0。说明吃中剂量保健食品的小鼠的肝糖原与吃高剂量保健食品的小鼠的肝糖原不一样。第18页,共48页,编辑于2022年,星期一二、单样本资料的符号秩和检验二、单样本资料的符号秩和检验 用于不满足t检验条件的单样本定量变量资料的比较。目的:推断样本中位数与已知总体中位数是否相等。第19页,共48页,编辑于2022年,星期一例例10-1 已知某地正常人尿铅含量的中位数为已知某地正常人尿铅含量的中位数为2.50mol/Lmol/L。今在该地随机抽取今在该地随机抽取1616名工人,测得尿铅含量见表名工人,测得尿铅含量见表10-110-1第(第(1 1)栏。)栏。问该厂工人的尿铅

12、含量是否高于当地正常人?问该厂工人的尿铅含量是否高于当地正常人?表表10-1 10-1 某厂某厂1616名工人与当地正常人的尿铅含量(名工人与当地正常人的尿铅含量(mol/Lmol/L)的比较)的比较尿铅含量尿铅含量差值差值秩次秩次尿铅含量尿铅含量差值差值秩次秩次0.623.130.783.272.133.542.484.382.544.382.685.052.736.083.0111.27第20页,共48页,编辑于2022年,星期一1、建立假设检验,确定检验水准、建立假设检验,确定检验水准 H0:差值的总体中位数等于:差值的总体中位数等于0,即该厂工人的尿铅含量与正常人相同,即该厂工人的尿铅

13、含量与正常人相同 H1:差值的总体中位数不等于:差值的总体中位数不等于0,即该厂工人的尿铅含量高于正常人,即该厂工人的尿铅含量高于正常人 单侧单侧 a=0.052、计算检验统计量、计算检验统计量T值值(1)求差值)求差值(2)编秩:按照差值的绝对值由小到大编秩)编秩:按照差值的绝对值由小到大编秩(3)分别求正、负秩和,记为)分别求正、负秩和,记为T,T本例本例T=108,T=28(4)确定检验统计量:任取)确定检验统计量:任取T或或T为统计量为统计量T。第21页,共48页,编辑于2022年,星期一本例本例n=16,T=28或或T=108查附表查附表9,单侧,单侧0.05对应对应T临界值区间为临

14、界值区间为35-101所以所以P0.05 按照按照a=0.05检验水准,拒绝检验水准,拒绝H0,接受,接受H1,故可认为,故可认为该厂该厂工人的尿铅含量高于正常人。工人的尿铅含量高于正常人。第22页,共48页,编辑于2022年,星期一 表表10-1 10-1 某厂某厂1616名工人与当地正常人的尿铅含量(名工人与当地正常人的尿铅含量(mol/Lmol/L)的比较)的比较尿铅含量尿铅含量差值差值秩次秩次尿铅含量尿铅含量差值差值秩次秩次0.62-1.88-123.130.6370.78-1.72-103.270.7782.13-0.37-53.541.0492.48-0.02-14.381.881

15、22.54-0.0424.381.88122.680.1835.052.55142.730.2346.083.58153.010.51611.278.7716第23页,共48页,编辑于2022年,星期一 当两个样本的方差不齐或不服从正态分布时,可以采Wilcoxon符号秩和检验对两个样本的差别作比较。基本假设:1)两个样本分别来自互相独立的两个总体2)检验假设是两个总体分布相同二、两样本资料的秩和检验第24页,共48页,编辑于2022年,星期一定量变量两独立样本的秩和检验例:测量了甲乙两个河流断面亚硝酸盐氮的含量如下,问:两个河流断面亚硝酸盐氮含量的总体分布是否相同?第25页,共48页,编辑于

16、2022年,星期一1、建立检验假设 H0:甲乙两河流断面亚硝酸盐氮含量的总体分布相同 H1:甲乙两河流断面亚硝酸盐氮含量的总体分布不同 双侧=0.052、计算统计量T值第26页,共48页,编辑于2022年,星期一(1)编秩:将两组数据编秩:将两组数据混合混合,统一由小到大编秩,统一由小到大编秩,遇到相同数据取平均秩次。遇到相同数据取平均秩次。第27页,共48页,编辑于2022年,星期一(2)求秩和求秩和T T以以n n1 1表示样本含量较小的那个样本的例数;表示样本含量较小的那个样本的例数;n n2 2表示样本含量较大的那个样本的例数。表示样本含量较大的那个样本的例数。则本例:则本例:n n1

17、 1=10=10,n n2 2=15=15。秩和秩和:T:T1 1=136=136;T T2 2=189=189若若n1n2,则任取一组的秩和为统计量;,则任取一组的秩和为统计量;若若n1n2,则以样本例数较小者对应的秩和为统计量。,则以样本例数较小者对应的秩和为统计量。本例本例n=10,T=136第28页,共48页,编辑于2022年,星期一3 3、确定、确定P P值,作统计推断(附表值,作统计推断(附表1010)当当n110,n2-n110时,查附表得到时,查附表得到95%95%的的T T所在所在范围,当范围,当T T在此范围之中时,不拒绝在此范围之中时,不拒绝H H0 0;当;当T T在此

18、范围在此范围之外时,拒绝之外时,拒绝H H0 0 本例:n1=10,n2-n1=5,查附表,得范围:94166因为T=136在此范围之内,因而不拒绝H0,认为甲乙两个河流断面亚硝酸盐氮含量的总体分布相同。第29页,共48页,编辑于2022年,星期一有序分类变量两独立样本的秩和检验例:为了了解居民体内核黄素营养状况,于某年夏冬两个季节 收集成年居民口服5mg核黄素后4小时的尿负荷,测定体 内核黄素含量,结果见表10-3(1)、(2)、(3)栏,试比较该地居民夏冬两个季节体内核黄素含量有无差别?第30页,共48页,编辑于2022年,星期一表表10-3 某地居民夏冬两个季节体内核黄素营养状况比较某地

19、居民夏冬两个季节体内核黄素营养状况比较核黄素营养状况例数夏季冬季缺乏1022不足1418适宜164合计4044第31页,共48页,编辑于2022年,星期一表表10-3 某地居民夏冬两个季节体内核黄素营养状况比较某地居民夏冬两个季节体内核黄素营养状况比较核黄素营养状况例数合计秩次范围平均秩次夏季冬季缺乏10223213216.5不足141832336448.5适宜16420658474.5合计404484第32页,共48页,编辑于2022年,星期一1 1、建立假设检验,确定检验水准、建立假设检验,确定检验水准 H H0 0:夏冬两个季节居民体内核黄素含量的总体中位数相等 H H1 1:夏冬两个季

20、节居民体内核黄素含量的总体中位数不相等 a=0.05a=0.052 2、计算检验统计量、计算检验统计量T T值值(1)编秩:将两组数据按等级顺序由小到大统一编秩(2)求各组秩和本例本例n n1 1=40=40,n n2 2=44=44T T1 1=16.510=16.51048.51448.51474.516=203674.516=2036T T2 2=16.522=16.52248.51848.51874.54=153474.54=1534第33页,共48页,编辑于2022年,星期一(3 3)确定统计量:)确定统计量:T=T T=T1 1=2036=2036(4 4)确定)确定P P值,做出

21、统计推断值,做出统计推断 本例本例n=40n=40,超出,超出T T界值表可查范围,采用正态近似检验。界值表可查范围,采用正态近似检验。计算计算Z Z值。值。查查t t界值表得界值表得P P0.050.05,按,按a=0.05a=0.05检验水准,拒绝检验水准,拒绝H H0 0,接受,接受H H1 1,差异有统计学意义,可认为夏冬两个季,差异有统计学意义,可认为夏冬两个季节居民体内核黄素含量有差别。节居民体内核黄素含量有差别。第34页,共48页,编辑于2022年,星期一三、多组独立样本的秩和检验三、多组独立样本的秩和检验 完全随机设计多组样本比较的非参数方法是完全随机设计多组样本比较的非参数方

22、法是KruskalKruskal和和WallisWallis在在WilcoxonWilcoxon秩和检验的基础上发展而来的,故又称秩和检验的基础上发展而来的,故又称K-WK-W检验或检验或H H检验。检验。检验目的:推断多组样本分别代表的总体分布是否不同。检验目的:推断多组样本分别代表的总体分布是否不同。基本步骤和两组连续变量资料秩和检验大致相同,只是确定的统计基本步骤和两组连续变量资料秩和检验大致相同,只是确定的统计量不同。量不同。第35页,共48页,编辑于2022年,星期一检验步骤:1、建立假设检验 H0:三组总体的分布相同 H1:三组总体的分布不全相同 =0.052、计算统计量H(1)编

23、秩:三组混合编秩(2)求秩和:分别将各组秩次相加得到,记做R1,R2,R3第36页,共48页,编辑于2022年,星期一(3)计算统计量第37页,共48页,编辑于2022年,星期一3、确定P值,作出统计推断第38页,共48页,编辑于2022年,星期一 例例 研究白血病时,测定四组鼠脾研究白血病时,测定四组鼠脾DNADNA的含量,结果列于下表,的含量,结果列于下表,试分析各组试分析各组DNADNA含量有无差别?含量有无差别?第39页,共48页,编辑于2022年,星期一建立假设检验建立假设检验H H0 0:四组鼠脾:四组鼠脾DNADNA含量的总体分布相同含量的总体分布相同H H1 1:四组鼠脾:四组

24、鼠脾DNADNA含量的总体分布位置不全相同含量的总体分布位置不全相同 0.050.05计算统计量计算统计量假设检验步骤假设检验步骤第40页,共48页,编辑于2022年,星期一查表及结论查表及结论 现现k k=4=4,=k k-1=4-1=3-1=4-1=3查查界界值值表表 2 20.05(3)0.05(3)=7.81=7.81,2 2 2 20.05(3)0.05(3);0.050.05P0.05,暂不拒绝,暂不拒绝H H0 0,无统计学意义,暂不,无统计学意义,暂不能认为某药物对治疗组与对照组的疗效不同。能认为某药物对治疗组与对照组的疗效不同。请问:该方法合适吗?如不合适,请问:该方法合适吗

25、?如不合适,该使用何种方法?该使用何种方法?第44页,共48页,编辑于2022年,星期一正确的方法 由于该资料为由于该资料为单向有序单向有序列联表资料,欲比较两种药列联表资料,欲比较两种药物的疗效,如果采用物的疗效,如果采用RC表的表的 2 2检验,则反映不出两检验,则反映不出两种药物在疗效上的等级差别,因此正确的方法应该采种药物在疗效上的等级差别,因此正确的方法应该采用用秩和检验秩和检验进行统计推断。进行统计推断。第45页,共48页,编辑于2022年,星期一检验方法的选择检验方法的选择(1)一组样本资料)一组样本资料 (2)配对设计资料)配对设计资料 若来自正态总体,可用若来自正态总体,可用

26、t检验;检验;若来自非正态总体或总体分布无法确定,可用若来自非正态总体或总体分布无法确定,可用Wilcoxon符号秩和检验方法。符号秩和检验方法。二分类变量,可用二分类变量,可用McNemar检验;检验;连续型变量,若来自正态总体,可用配对连续型变量,若来自正态总体,可用配对t检验,否则检验,否则可用可用Wilcoxon符号秩和检验。符号秩和检验。第46页,共48页,编辑于2022年,星期一检验方法的选择(3)两组独立样本)两组独立样本 连续型变量,若来自正态总体,可用连续型变量,若来自正态总体,可用t检验,否则,可用检验,否则,可用 Wilcoxon秩和检验;秩和检验;二分类变量或无序多分类

27、变量,可用二分类变量或无序多分类变量,可用x2检验;检验;有序多分类变量,宜用有序多分类变量,宜用Wilcoxon秩和检验。秩和检验。第47页,共48页,编辑于2022年,星期一检验方法的选择(4)多组独立样本)多组独立样本 连续型变量值,来自正态总体且方差相等,可用方差分析;否则,进连续型变量值,来自正态总体且方差相等,可用方差分析;否则,进行数据变换使其满足正态性或方差齐的要求后,采用方差分析;数据变换行数据变换使其满足正态性或方差齐的要求后,采用方差分析;数据变换仍不能满足条件时,可用仍不能满足条件时,可用Kruskal-Wallis秩和检验。秩和检验。二分类变量或无序多分类变量,可用二分类变量或无序多分类变量,可用x2检验。检验。有序多分类变量宜用有序多分类变量宜用Kruskal-Wallis秩和检验。秩和检验。第48页,共48页,编辑于2022年,星期一

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com