相关与偏相关.pptx

上传人:莉*** 文档编号:74453894 上传时间:2023-02-26 格式:PPTX 页数:42 大小:220.65KB
返回 下载 相关 举报
相关与偏相关.pptx_第1页
第1页 / 共42页
相关与偏相关.pptx_第2页
第2页 / 共42页
点击查看更多>>
资源描述

《相关与偏相关.pptx》由会员分享,可在线阅读,更多相关《相关与偏相关.pptx(42页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、会计学1相关与偏相关相关与偏相关相关与偏相关2主要内容主要内容n n第一节 直线相关n n第二节 偏相关n n第三节 小 结第1页/共42页第一节第一节 直线相关直线相关Linear CorrelationLinear Correlation第2页/共42页n n为了研究父亲与成年儿为了研究父亲与成年儿子身高之间的关系,卡子身高之间的关系,卡尔尔.皮尔逊测量了皮尔逊测量了10781078对对父子的身高。把父子的身高。把10781078对数对数字表示在坐标上,如图。字表示在坐标上,如图。用水平轴用水平轴X X上的数代表父上的数代表父亲身高,垂直轴亲身高,垂直轴Y Y上的数上的数代表儿子的身高,代

2、表儿子的身高,10781078个个点所形成的图形是一个点所形成的图形是一个散点图。它的形状象一散点图。它的形状象一块橄榄状的云,中间的块橄榄状的云,中间的点密集,边沿的点稀少,点密集,边沿的点稀少,其主要部分是一个椭圆。其主要部分是一个椭圆。第3页/共42页一、相关的类型一、相关的类型一、相关的类型一、相关的类型正相关正相关 负相关负相关 完全正相关完全正相关 完全负相关完全负相关 称零相关称零相关 第4页/共42页二、相关系数二、相关系数二、相关系数二、相关系数 n n样本的相关系数样本的相关系数用用r(correlation coefficient)r(correlation coeffi

3、cient)n n相关系数相关系数r r的值在的值在-1-1和和1 1之间,但可以是此范围内之间,但可以是此范围内的任何值。正相关时,的任何值。正相关时,r r值在值在0 0和和1 1之间,散点云之间,散点云图是斜向上的,这时一个变量增加,另一个变图是斜向上的,这时一个变量增加,另一个变量也增加;负相关时,量也增加;负相关时,r r值在值在-1-1和和0 0之间,散点云之间,散点云图是斜向下的,此时一个变量增加,另一个变图是斜向下的,此时一个变量增加,另一个变量将减少。量将减少。r r的绝对值越接近的绝对值越接近1 1,两变量的关联程,两变量的关联程度越强,度越强,r r的绝对值越接近的绝对值

4、越接近0 0,两变量的关联程度,两变量的关联程度越弱。越弱。第5页/共42页三、相关系数的计算公式三、相关系数的计算公式三、相关系数的计算公式三、相关系数的计算公式r的计算结果说明了两个变量的计算结果说明了两个变量X与与Y之间关联的密之间关联的密切程度(绝对值大小)与关联的性质(正负号)。切程度(绝对值大小)与关联的性质(正负号)。第6页/共42页n n一个产科医师发现孕妇尿中一个产科医师发现孕妇尿中雌三醇含量雌三醇含量与产儿与产儿的的体重体重有关。于是设想,通过测量待产妇尿中有关。于是设想,通过测量待产妇尿中雌三醇含量,可以预测产儿体重,以便对低出雌三醇含量,可以预测产儿体重,以便对低出生体

5、重进行预防。因此收集了生体重进行预防。因此收集了3131例待产妇例待产妇2424小小时的尿,测量其中的雌三醇含量,同时记录产时的尿,测量其中的雌三醇含量,同时记录产儿的体重。问尿中雌三醇含量与产儿体重之间儿的体重。问尿中雌三醇含量与产儿体重之间相关系数相关系数是多少?是正相关还是负相关?是多少?是正相关还是负相关?n n分析问题:目的、变量、关系分析问题:目的、变量、关系 第7页/共42页编号(1)尿雌三醇mg/24h(2产儿体重kg(3)编号(1)尿雌三醇mg/24h(2)产儿体重kg(3)172.517173.2292.518253.2392.519273.44122.720153.451

6、42.721153.46162.722153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2 待产妇尿雌三醇含量与产儿体重关系待产妇尿雌三醇含量与产儿体重关系待产妇尿雌三醇含量与产儿体重关系待产妇尿雌三醇含量与产儿体重关系 第8页/共42页相关与偏相关10计算结果计算结果计算结果计算结果从计算结果可以知道,31例待产妇尿中雌三醇含量与产儿体重之间程正相关,相关系数是0.61。第9页

7、/共42页问题:我们能否得出结问题:我们能否得出结论说明论说明待产妇尿中雌三待产妇尿中雌三醇含量与产儿体重之间醇含量与产儿体重之间程正相关,相关系数是程正相关,相关系数是0.61?为什么?为什么?第10页/共42页相关与偏相关12四、相关系数的假设检验四、相关系数的假设检验四、相关系数的假设检验四、相关系数的假设检验 n n上例中的相关系数上例中的相关系数r r等于等于0.610.61,说明了,说明了3131例样本中雌三醇例样本中雌三醇含量与出生体重之间存在相关关系。但是,这含量与出生体重之间存在相关关系。但是,这3131例只是例只是总体总体总体总体中的中的一个样本一个样本一个样本一个样本,由

8、此得到的相关系数会存在抽样误,由此得到的相关系数会存在抽样误差。因为,总体相关系数差。因为,总体相关系数()为零时,由于抽样为零时,由于抽样误差,从总体抽出的误差,从总体抽出的3131例,其例,其r r可能不等于零。所以,要可能不等于零。所以,要判断该样本的判断该样本的r r是否有意义,需与总体相关系数是否有意义,需与总体相关系数=0=0进行进行比较,看两者的差别有无统计学意义。这就要对比较,看两者的差别有无统计学意义。这就要对r r进行进行假设检验,判断假设检验,判断r r不等于零是由于抽样误差所致,还是不等于零是由于抽样误差所致,还是两个变量之间确实存在相关关系。两个变量之间确实存在相关关

9、系。第11页/共42页相关与偏相关13对相关系数的假设检验,常用t检验,选用统计量t的计算公式如下:=n-2 第12页/共42页zH0:=0 H1:0 =0.05 r=0.61,n=31,代入公式t=n-2=31-2=29 t=4.14t=4.14查t值表,=2.756,查t值表,=2.756,上述计算t=4.142.756,由t所推断的P值小于0.01,按=0.05水准拒绝,接受,认为临产妇24小时内尿中雌三醇浓度与产儿体重之间有正相关关系。第13页/共42页SPSS计算计算n n1.做散点图:标题、标目、散点GRAPHS-SCATTERT-SIMPLE-DEFIND双击TITLE加标题、标

10、目n n2.相关分析 ANALYZE-CORRELATION BIVARIATE-VARIABLES第14页/共42页相关与偏相关16第15页/共42页相关与偏相关17五、直线相关的应用五、直线相关的应用五、直线相关的应用五、直线相关的应用n n 前面我们已经讲过,相关是研究两个变量间的相互关前面我们已经讲过,相关是研究两个变量间的相互关系,而且这种相互关系是用相关系数反应的。在确实存系,而且这种相互关系是用相关系数反应的。在确实存在相关关系的前提下,如果在相关关系的前提下,如果r r的绝对值越大,说明两个的绝对值越大,说明两个变量之间的关联程度越强,那么,已知一个变量对预测变量之间的关联程度

11、越强,那么,已知一个变量对预测另一个变量越有帮助;如果另一个变量越有帮助;如果r r绝对值越小,则说明两个绝对值越小,则说明两个变量之间的关系越弱,一个变量的信息对猜测另一个变变量之间的关系越弱,一个变量的信息对猜测另一个变量的值无多大帮助。量的值无多大帮助。n n 一般说来,当样本量较大(一般说来,当样本量较大(n100n100),并对),并对r r进行假进行假设检验,有统计学意义时,设检验,有统计学意义时,r r的绝对值大于的绝对值大于0.70.7,则表示,则表示两个变量高度相关;两个变量高度相关;r r的绝对值大于的绝对值大于0.40.4,小于等于,小于等于0.70.7时,则表示两个变量

12、之间中度相关;时,则表示两个变量之间中度相关;r r的绝对值大于的绝对值大于0.20.2,小于等于,小于等于0.40.4时,则两个变量低度相关。时,则两个变量低度相关。第16页/共42页例题:某地例题:某地29名名13岁男童身高岁男童身高X1(cm)、)、体重体重X2(kg)和肺活量)和肺活量Y(ml),请用该请用该资料计算身高与肺活量,体重与肺活量的资料计算身高与肺活量,体重与肺活量的相关关系。相关关系。第17页/共42页第二节第二节 偏相关偏相关第18页/共42页一、概念一、概念 当有多个变量存在时,为了研究任何当有多个变量存在时,为了研究任何两个变量之间的关系,而使与这两个变两个变量之间

13、的关系,而使与这两个变量有联系的其它变量都保持不变。即控量有联系的其它变量都保持不变。即控制了其它一个或多个变量的影响下,计制了其它一个或多个变量的影响下,计算两个变量的相关性。算两个变量的相关性。二、偏相关系数二、偏相关系数 偏相关系数是用来衡量任何两个变量偏相关系数是用来衡量任何两个变量之间的关系的大小。之间的关系的大小。第19页/共42页相关与偏相关21三、选择不同的方法计算相关系数三、选择不同的方法计算相关系数三、选择不同的方法计算相关系数三、选择不同的方法计算相关系数Pearson:双变量正态分布资料:双变量正态分布资料,连续变量连续变量Kendall:资料不服从双变量正资料不服从双

14、变量正态分布或态分布或 总体分布未知,等级总体分布未知,等级资料。资料。Spearman:等级资料。:等级资料。第20页/共42页相关与偏相关22Analyze-Correlation-Partial把分析变量选入把分析变量选入 Variable 框框把控制变量选入把控制变量选入 Controlling for 框框点击点击 Options点击点击 Statistics:选择:选择 Mean and standard deviation Zero-order correlation Continue OK四、四、SPSS操作步骤操作步骤第21页/共42页相关与偏相关23Variable Mea

15、n Standard Dev CasesX1(身高身高 )152.5759 8.3622 29Y (肺活量)(肺活量)2206.8966 448.5541 29X2(体重体重)37.3069 5.6704 29结结 果:果:第22页/共42页相关与偏相关24身高与肺活量的简单相关系数身高与肺活量的简单相关系数1、身高与肺活量的简单相关系数、身高与肺活量的简单相关系数第23页/共42页相关与偏相关252 2、体重与肺活量的简单相关系数、体重与肺活量的简单相关系数、体重与肺活量的简单相关系数、体重与肺活量的简单相关系数第24页/共42页相关与偏相关263 3、身高与体重的简单相关系数、身高与体重的

16、简单相关系数、身高与体重的简单相关系数、身高与体重的简单相关系数第25页/共42页相关与偏相关274 4、体重为控制变量,身高与肺活量的偏、体重为控制变量,身高与肺活量的偏、体重为控制变量,身高与肺活量的偏、体重为控制变量,身高与肺活量的偏相关系数相关系数相关系数相关系数P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S Controlling for.X2 Controlling for.X2(体重)(体重

17、)(体重)(体重)Y Y(肺活量)(肺活量)(肺活量)(肺活量)X1X1(身高)(身高)(身高)(身高)Y Y(肺活量)(肺活量)(肺活量)(肺活量)1.0000 .23611.0000 .2361 (0)(26)(0)(26)P=.P=.226 P=.P=.226X1 X1(身高)(身高)(身高)(身高).2361 1.0000.2361 1.0000 (26)(0)(26)(0)P=.226 P=.P=.226 P=.第26页/共42页相关与偏相关28P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S P A R T I

18、A L C O R R E L A T I O N C O E F F I C I E N T S Controlling for.X1Controlling for.X1(身高)(身高)(身高)(身高)Y Y(肺活量)(肺活量)(肺活量)(肺活量)X2X2(体重)(体重)(体重)(体重)Y 1.0000 .4152Y 1.0000 .4152 (0)(26)(0)(26)P=.P=.028 P=.P=.028X2 .4152 1.0000X2 .4152 1.0000 (26)(0)(26)(0)P=.028 P=.P=.028 P=.5 5、身高作为控制变量,肺活量与体重的、身高作为控制变

19、量,肺活量与体重的、身高作为控制变量,肺活量与体重的、身高作为控制变量,肺活量与体重的偏相关系数偏相关系数偏相关系数偏相关系数第27页/共42页应用相关注意事项应用相关注意事项应用相关注意事项应用相关注意事项 1.1.实际意义实际意义实际意义实际意义 进行相关回归分析要有实际意义,不可把毫无关系进行相关回归分析要有实际意义,不可把毫无关系的两个事物或现象用来作相关回归分析。例如,有的两个事物或现象用来作相关回归分析。例如,有人说,孩子长,公园里的小树也在长。求孩子和小人说,孩子长,公园里的小树也在长。求孩子和小树之间的相关关系就毫无意义,用孩子的身高推测树之间的相关关系就毫无意义,用孩子的身高

20、推测小树的高度则更加慌谬。小树的高度则更加慌谬。2.2.相关关系相关关系相关关系相关关系 相关关系不一定是因果关系,也可能是伴随关系,相关关系不一定是因果关系,也可能是伴随关系,并不能证明事物间有内在联系,例如,有人发现,并不能证明事物间有内在联系,例如,有人发现,对于在校儿童,鞋的大小与阅读技能有很强的相关对于在校儿童,鞋的大小与阅读技能有很强的相关关系。然而,学会新词并不能使脚变大,而是涉及关系。然而,学会新词并不能使脚变大,而是涉及到第三个因素到第三个因素 年龄。当儿童长大一些,他们的年龄。当儿童长大一些,他们的阅读能力会提高而且由于长大也穿不下原来的鞋。阅读能力会提高而且由于长大也穿不

21、下原来的鞋。第28页/共42页3.利用散点图对于性质不明确的两组数据,可先做散点图,在图上看它们有无关系、关系的密切程度、是正相关还是负相关,然后再进行相关分析。4.变量范围相关分析和回归方程仅适用于样本的原始数据范围之内,出了这个范围,我们不能得出两变量的相关关系和原来的回归关系。第29页/共42页相关与偏相关31第三节第三节 小结小结 n n一、基本概念一、基本概念n n二、分析计算二、分析计算第30页/共42页1.为了了解某地2029岁健康女性血红蛋白的正常值范围,现随机调查了该地2000名2029岁的健康女性,并对其血红蛋白进行测量,请问本次调查的总体是 A该地所有2029的健康女性

22、B该地所有2029的健康女性的血红蛋白测量值 C抽取的这2000名2029岁女性 D抽取的这2000名2029岁女性的血红蛋白测量值选择最佳答案选择最佳答案第31页/共42页2.各观察值加同一数后:A.均数不变,标准差改变 B.均数改变,标准差不变C.二者均不变 D.均改变3.用均数和标准差可全面描述:A.正偏态资料 B.负偏态资料 C.正态分布和近似正态分布 D.任何分布4.正态分布曲线下,从均数u 到u+1.96的面积为;A.95%B.45%C.97.5%D.47.5%第32页/共42页5.按=0.10水准做t检验,P0.10,不能认为两总体均数不相等,此时若推断有错,其错误的概率为()。

23、A大于0.10B,而未知C小于0.10D1-,而未知6某地正常成年男子红细胞的普查结果,均数为480万/mm3,标准差为41.0万/mm3,后者反映()A个体变异B抽样误差C总体均数不同D均数间变异第33页/共42页7.两个样本均数比较,经t检验,差异有显著性,p越小,说明()A两样本均数差别越大B两总体差别越大C越有理由认为两总体均数不同D越有理由认为两样本均数不同第34页/共42页是非判断:1标准误是一种特殊的标准差,其表示抽样误差的大小。2N一定时,测量值的离散程度越小,用样本均数估计总体均数的抽样误差就越小。3假设检验的目的是要判断两个样本均数的差别有多大。第35页/共42页思考:1.

24、标准差和标准误有何区别和联系?2.可信区间和参考值范围有何不同?3.一类错误和二类错误的区别4.方差分析的基本思想是什么?第36页/共42页相关与偏相关38分析计算要求:1.注意应用条件,选择合 适的计算程序2.在计算机上计算出结果3.会看结果4.完整的书写出来第37页/共42页相关与偏相关391.1976年美国8岁男孩的平均身高为146厘米,标准差为8厘米,估计在该研究中有%多少的男孩平均身高在138与154之间?又有多少在130到162之间?第38页/共42页相关与偏相关402.随机将20只雌性中年大鼠均分为甲、乙两组,甲组大鼠不接受任何处理(即空白对照),乙组中的每只大鼠接受3mg/kg

25、的内毒素,分别测得两组大鼠的肌酐(mol/L)数据,请问肌酐水平与内毒素有无关系?甲组:55,33,51,24,34,54,59,69,34,61乙组:75,60,100,83,82,65,50,70,64,72 第39页/共42页相关与偏相关41n n3.3.某职业病防治所对某职业病防治所对3131例石棉矿工中的石棉肺患者、可疑患者和非例石棉矿工中的石棉肺患者、可疑患者和非患者进行了用力肺活量测定。问三组石棉矿工的用力肺活量有无患者进行了用力肺活量测定。问三组石棉矿工的用力肺活量有无差别?(肺活量差别?(肺活量.SAV.SAV)n n4.4.某厂医务室测定了某厂医务室测定了1010名氟作业工人工前、工中和工后名氟作业工人工前、工中和工后4 4小时的尿小时的尿氟浓度氟浓度(umol/L)(umol/L),问氟作业工人在三个不同时间的尿氟浓度有无差,问氟作业工人在三个不同时间的尿氟浓度有无差别?别?第40页/共42页相关与偏相关42 祝大家成功!祝大家成功!第41页/共42页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com