第13章思考与练习.doc

上传人:豆**** 文档编号:24075539 上传时间:2022-07-03 格式:DOC 页数:11 大小:384.50KB
返回 下载 相关 举报
第13章思考与练习.doc_第1页
第1页 / 共11页
第13章思考与练习.doc_第2页
第2页 / 共11页
点击查看更多>>
资源描述

《第13章思考与练习.doc》由会员分享,可在线阅读,更多相关《第13章思考与练习.doc(11页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流第13章思考与练习.精品文档.第十三章 双变量关联性分析【思考与习题】 一、思考题1两变量间的关联性是否可解释为因果关系?222列联表的关联性分析与两样本率比较的检验有何不同?3相关系数r经假设检验有统计学意义,且得到的P值很小,是否表示两变量间一定有很强的直线关系?4简述Pearson积矩相关与Spearman秩相关的区别与联系。二、案例辨析题为研究年龄与牙齿AKP酶反应活性之间的关系,某医生在其接诊的患者中随机抽取281例,按年龄(岁)分为三组进行观测,测量各患者牙齿的AKP酶反应活性,如表13-1所示。问年龄与牙齿AKP酶反应活性之间有

2、无关系?表13-1 281例患者年龄与牙齿AKP酶反应活性的分布年龄AKP酶反应活性合计+31517365831234549051249712133合计31148102 281按照RC表的检验结果,得=84.533,故按=0.05水准,拒绝,可认为不同年龄患者的AKP酶反应活性不同,两者之间有关系。以上分析正确吗?三、最佳选择题1Pearson积矩相关系数的假设检验,其自由度为A B C D E 2积矩相关系数的计算公式是A B C D E 3. 直线相关分析中,若,则可认为两变量之间A. 有一定关系B. 不存在直线相关关系C. 有直线相关关系D. 有直线相关关系,且为正相关E. 有直线相关关

3、系,且为负相关4下列指标中可正可负的是AF统计量 B统计量 C D E 5研究18岁女大学生体重和肺活量的关系时,表达正确的无效假设是A体重与肺活量无关联B体重与肺活量有关联C体重与肺活量有直线关系D体重与肺活量有因果关系E体重与肺活量无因果关系6计算Pearson列联系数的公式为ABC DE7某放射科医师收集脑外伤患者30例,观察脑出血直径和病人昏迷的程度(轻度、中度、重度),欲分析昏迷程度是否与病灶大小有关,可进行APearson相关分析BSpearman秩相关分析C两小样本比较的t检验 D方差分析E检验8对两个分类变量的频数表资料作关联性分析,可用A积矩相关或等级相关B积矩相关或列联系数

4、C列联系数或等级相关 D积矩相关E等级相关9两组数据分别进行直线相关分析,对进行假设检验得到P0.05,对进行假设检验,得到P0.001,可以认为A第一组的两个变量关系比第二组密切 B第二组的两个变量关系比第一组密切C更有理由认为第一组的两个变量之间有直线关系 D更有理由认为第二组的两个变量之间有直线关系E两组变量关系同样密切四、综合分析题1为研究某病成年男性患者血浆清蛋白含量与血红蛋白含量的关系,某医生测得10名患者血浆清蛋白含量(g/L)及血红蛋白含量(g/L)见表13-2所示,试分析二者是否有关联。表13-2 10名某病成年男性患者的血浆清蛋白含量( x )及血红蛋白含量( y )编号血

5、浆清蛋白含量(g/L)血红蛋白含量(g/L)13611923712133912843812753612163511973411183410993510910341052某医院用两种方法对已确诊的50名乳腺癌患者进行检查,结果如表13-3所示。两种检查方法是否有关联?表13-3 50名乳腺癌患者的两种检查结果乙法甲法合计阳性阴性阳性18 927阴性 81523合计2624503为探讨流行性出血热的早期分度和最后定型之间的关系,某研究对404例该病患者的病情资料进行分析,如表13-4所示。据此回答:是否早期分度越高,最后定型越重?表13-4 404例流行性出血热患者的病情转化情况早期分度最后定型合

6、计轻型中型重型轻度98201119中度513621162重度12120123合计104158142404【习题解析】一、思考题1双变量关联性分析的目的在于推断从某一总体中随机抽取的同一份样本观测出的两个变量间是否存在关联性,以及这种关联性的密切程度如何。关联性只反映变量间数量上的关系,但数量上的关联并不表示专业上的因果关系,是否确为因果关系还需结合专业知识、因果逻辑上的时间先后顺序等作进一步判定。 222列联表的关联性分析与两样本率比较的检验的数据形式非常相似,检验的公式以及应用条件也完全相同。但区别在于:两样本率比较的检验是从两个总体中分别抽取样本,两样本有各自的频数分布,所检验的是两总体的

7、率是否相同;而22列联表的关联性分析是从同一个总体中进行随机抽样,对样本中的每个个体考察其两个变量的关系,检验两个分类变量之间是否存在关联性或者说是否独立。3P值越小,说明越有理由拒绝,犯I型错误的概率越小。相关系数r经假设检验有统计学意义且得到非常小的P值,表示有足够的理由认为两变量总体相关系数,只能定性回答两变量是否存在直线相关,并非意味着其直线相关的强度。若要定量回答相关性的强弱,需结合样本相关系数r的大小和总体相关系数的置信区间来说明。4区别:Pearson积矩相关适用于二元正态分布资料,Spearman秩相关适用于不服从正态分布、总体分布未知、存在极端值或原始数据用等级表示的资料。P

8、earson积矩相关是基于原始数据进行统计分析,而Spearman秩相关是将原始数据进行秩变换后进行统计分析。Pearson积矩相关是参数检验方法,而Spearman秩相关不以特定的总体分布为前提,为非参数检验的方法。联系:两种相关系数的取值都介于-1和1之间,无单位,小于 0 为负相关,大于0为正相关。用原始数据的秩次来计算Pearson相关系数,得到的即为Spearman秩相关系数。二、案例辨析题该案例是对同一样本的两个分类变量之间的关联性进行分析,检验的计算方式不变,结果仍为84.533,但下结论时最好不要从“不同年龄的AKP酶反应活性不同”演绎到“两变量有关系”,而应为“按=0.05水

9、准,拒绝,可认为年龄与AKP酶反应活性之间有关”。此外,可结合列联系数说明其关联强度,。由于年龄与AKP酶反应活性都是有序分类变量,可考虑进行Spearman秩相关分析,得,单侧,可认为随着年龄的增加,AKP酶反应活也降低。三、最佳选择题1. B 2. C 3. C 4.D 5.A 6.B 7.B 8.C 9. D四、综合分析题1解:(1) 由散点图(略)结合两个变量的正态性检验,可进行直线相关分析。由式(13.1)分别算出但需进行假设检验以推断总体上这种相关是否存在。(2) 检验相关是否具有统计学意义1) 建立检验假设,确定检验水准:,即血浆清蛋白含量及血红蛋白含量之间无直线相关关系 :,即

10、血浆清蛋白含量及血红蛋白含量之间有直线相关关系2) 计算检验统计量由式(13.4)和式(13.5)得3) 确定P值,作出统计推断查t界值表(附表3),得,按=0.05水准,拒绝,接受,可以认为该病成年男性患者血浆清蛋白含量与血红蛋白含量呈正相关关系。SPSS操作数据录入:打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量,no表示个体编号,x表示血浆清蛋白含量,y表示血红蛋白含量;再点击Data View标签,录入数据(见图13-1,图13-2)。图13-1 Variable View窗口内定义要输入的变量图13-2 Data View窗口内录入数据

11、分析:Graphs Scatter/Dot Simple ScatterDefineY Axis框:yX Axis框:xOKAnalyze Descriptive Statistics Explore Dependent list框:x yPlots Normality plots with testsContinueOKAnalyzeCorrelateBivariate Variables框:x yOK输出结果血红蛋白含量血浆清蛋白含量(3) 结果解释通过对血浆清蛋白和血红蛋白两变量的正态性检验可以看出:两者的P值分别为0.200,0. 200,可以认为两变量都服从正态分布,故进行Pears

12、on积矩相关分析。两者相关系数为0.916,按水准拒绝,可以认为该病成年男性患者血浆清蛋白和血红蛋白两变量呈正相关关系。 2解:此问题属于配对设计列联表的关联性分析。(1) 建立检验假设,确定检验水准:甲法和乙法之间互相独立:甲法和乙法之间互相关联(2) 计算检验统计量将表13-3中数据代入式(11.5)得:(3) 确定P值,作出统计推断查界值表(附表9),得,按水准,拒绝,接受,可以认为甲法和乙法之间互相关联。进一步计算Pearson列联系数,SPSS操作数据录入:打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量,f表示四格表每个格子的实际频数,

13、r表示“行变量”乙法检查结果(1为阳性,0为阴性),c表示“列变量”甲法检查结果(1为阳性,0为阴性);再点击Data View标签,录入数据(见图13-3,图13-4)。图13-3 Variable View窗口内定义要输入的变量图13-4 Data View窗口内录入数据分析:Data Weight Cases Weight cases by:Frequency Variable框:fOKAnalyze Descriptive Statistics CrosstabsRows框:rColumns框:cStatistics: Chi-square Nominal Contingency co

14、efficientContinueCells:Counts Observed Expected ContinueOK输出结果3解:(1) 本题为等级资料,应采用Spearman秩相关分析,并用单侧检验。表13-5 404例流行性出血热患者的病情转化情况早期分度x最后定型 y合计秩次范围平均秩次pi轻型中型重型轻度9820 1119111960中度513621162120281200.5重度12120123282404343合计104158142404秩次范围1104105262263404平均秩次qi52.5183.5333.5将n对实测值与(=1,2,3,)分别从小到大编秩(相同秩次取平均值

15、),以表示的秩次,表示的秩次,将、直接替换式(13.1)中的x和y,即用秩次作为分析变量值,直接计算Pearson积矩相关系数。但需进行假设检验以推断总体上这种相关是否存在。(2) 对总体秩相关系数作假设检验,本例中=0.891,采用式(13.4)和式(13.5)作t检验。1)建立检验假设,确定检验水准:,即流行性出血热的早期分度和最后定型无相关关系 :,即流行性出血热的早期分度和最后定型有正相关关系单侧2) 计算检验统计量由式(13.4)和式(13.5)得3) 确定P值,作出统计推断查t界值表(附表3),得,按水准,拒绝,接受,可以认为流行性出血热的早期分度和最后定型存在正相关关系,随着早期

16、分度的增高其最后定型加重。SPSS操作数据录入:打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量,f为每个格子实际例数,行变量r为早期分度(取值1、2、3分别表示轻度、中度、重度),列变量c为最后定型(取值1、2、3分别表示轻型、中型、重型)。再点击Data View标签,录入数据(见图13-5,图13-6)。图13-5 Variable View窗口内定义要输入的变量图13-6 Data View窗口内录入数据分析:Data Weight Cases Weight cases by:Frequency Variable框:fOKAnalyze Correlate Bivariate Variables框:r c Correlation Coefficients SpearmanTest of Significance One-tailedOK输出结果(3) 结果解释:Spearman秩相关系数,按水准,拒绝,接受,可以认为流行性出血热的早期分度和最后定型存在正相关关系,随着早期分度的增高其最后定型加重。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 小学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com