logistic回归分析ppt课件 .ppt

上传人:飞****2 文档编号:69871566 上传时间:2023-01-10 格式:PPT 页数:43 大小:1.06MB
返回 下载 相关 举报
logistic回归分析ppt课件 .ppt_第1页
第1页 / 共43页
logistic回归分析ppt课件 .ppt_第2页
第2页 / 共43页
点击查看更多>>
资源描述

《logistic回归分析ppt课件 .ppt》由会员分享,可在线阅读,更多相关《logistic回归分析ppt课件 .ppt(43页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、391 第十六章第十六章 logistic回归分析回归分析 (LogisticRegression)392ContentLogisticregressionConditionallogisticregressionApplication 393讲述内容讲述内容:第一第一节节logistic回回归归第二第二节节条件条件logistic回回归归第三第三节节logistic回回归归的的应应用用及其注意事及其注意事项项问题提出:问题提出:医医学学研研究究中中常常研研究究某某因因素素存存在在条条件件下下某某结结果果是是否否发生?以及之间的关系如何?发生?以及之间的关系如何?因素(因素(X)疾病结果(疾病

2、结果(Y)x1,x2,x3XK 发生发生 Y=1 不发生不发生 Y=0 例:暴露因素例:暴露因素 冠心病结果冠心病结果 高血压史高血压史(x1):有:有 或无或无 有有 或或 无无 高血脂史高血脂史(x2):有有 或或 无无 吸烟吸烟(x3):有或无有或无研究问题可否用多元线性回归方法研究问题可否用多元线性回归方法?1.多元线性回归方法要求多元线性回归方法要求 Y 的取值为计量的取值为计量的连续性随机变量。的连续性随机变量。2.多元线性回归方程要求多元线性回归方程要求Y与与X间关系为线间关系为线性关系。性关系。3.多元线性回归结果多元线性回归结果 不能回答不能回答“发生与发生与否否”logis

3、tic回归方法补充多元线性回归的不足回归方法补充多元线性回归的不足 一、基本概念一、基本概念 logistic回归要求应变量(回归要求应变量(Y)取值为分类变量)取值为分类变量(两分类或多个分类)(两分类或多个分类)自自变变量(量(Xi)称)称为为危危险险因素或暴露因素,可因素或暴露因素,可为连续为连续变变量、等量、等级变级变量、分量、分类变类变量。量。可有可有m个自个自变变量量X1,X2,Xm 目的:目的:作出以多个自变量(危险因素)估计作出以多个自变量(危险因素)估计应变量(应变量(结果因素)结果因素)的的logistic回归方程。回归方程。属于概率型非线性回归。属于概率型非线性回归。资料

4、:资料:1.应变量为反映某现象发生与不发生的应变量为反映某现象发生与不发生的二值变量;二值变量;2.自变量宜全部或大部分为分类自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量变量,可有少数数值变量。分类变量要数量化。化。用途:用途:研究某种疾病或现象发生和多个危研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系。险因素(或保护因子)的数量关系。用用检验(或检验(或u检验)的检验)的局限性局限性:1.只能研究只能研究1个危险因素;个危险因素;2.只能得出定性结论。只能得出定性结论。种类种类:1.成组(非条件)成组(非条件)logistic回归方程。回归方程。2.配对(条

5、件)配对(条件)logistic回归方程。回归方程。第一节第一节 logistic回归回归(非条件(非条件logistic回归回归)一、基本概念一、基本概念,在m个自变量的作用下阳性结果发生的概率记作个自变量的作用下阳性结果发生的概率记作:图图16-1logistic函数的图形函数的图形模模型型参参数数的的意意义义常数常数项项表示暴露剂量为表示暴露剂量为0时个体发病时个体发病与不发病概率之比的自然对数。与不发病概率之比的自然对数。回归系数回归系数表示自变量表示自变量改变一个单位时改变一个单位时logitP 的改变量。的改变量。取值范围取值范围 概率概率P:01,logitP:。流行病学衡量危险

6、因素作用大小的流行病学衡量危险因素作用大小的比数比例比数比例指标。指标。计算公式为:计算公式为:优势比优势比OR(oddsratio)与与logisticP 的关系的关系:二、logistic回归模型的参数估计回归模型的参数估计 1.参数估计参数估计 原理:最大似然原理:最大似然(likelihood)估计估计 2.优势比估计优势比估计 可反映某一因素两个不同水平(c1,c0)的优势比。例16-1 表16-1是一个研究吸烟、饮酒与食道癌关系的病例对照资料,试作logistic回归分析。确确定定各各变变量量编编码码 表表16-1吸烟与食道癌关系的病例对照调查资料吸烟与食道癌关系的病例对照调查资料

7、经logistic回归计算后得:的95可信区间:三、三、logistic回归模型的假设检验回归模型的假设检验 1.似然比检验(likelihood ratio test)Logistic模型中估计一般采用最大似然法,即使模型的似然函数L达到最大值。-2lnL被称为Deviance,记为D。模型预测效果越好,则L越大,D值也越大。3.计分检验(score test)上述三种假设检验中,似然比检验是基于中个模型的拟合情况进行的,结果最为可靠;比分检验结果一般和似然比检验一致。Walds检验考虑各因素的综合作用,当因素间存在共线性的时候,结果不可靠。方法:方法:前进法、后退法和逐步法前进法、后退法和

8、逐步法。检验统计量:检验统计量:不是不是F统计量,而是似然比统计量、统计量,而是似然比统计量、Wald统计量和计分统计量之一。统计量和计分统计量之一。四、变量筛选四、变量筛选例16-2 为了探讨冠心病发生的有关危险因素,对为了探讨冠心病发生的有关危险因素,对26例冠心病病人和例冠心病病人和28例对照者进行病例例对照者进行病例 对照研究,各对照研究,各因素的说明及资料见表因素的说明及资料见表16-2和表和表16-3。试用。试用logistic逐逐步回归分析方法筛选危险因素。步回归分析方法筛选危险因素。表表16-2冠心病冠心病8个可能的危险因素与赋值个可能的危险因素与赋值表表16-3冠心病危险因素

9、的病例冠心病危险因素的病例 对照调查资料对照调查资料 表表16-4例例16-2进入方程中的自变量及有关参数的估计值进入方程中的自变量及有关参数的估计值学会看结果!学会看结果!一、原理 第二节 条件logistic回归 表表16-51:M 条件条件logistic回归数据的格式回归数据的格式*t=0 为病例,其他为对照 条件 logistic 模型二、应用实例表表16-7喉癌喉癌1:2配对病例配对病例 对照调查资料整理表对照调查资料整理表P286:表16-8 例16-3进入方程中的自变量及有关参数的估计值 采用逐步法 6个危险因素 变量筛选 4个进方程,结果见表16-9。一、logistic回归

10、的应用1流行病学危险因素分析 logistic回归分析的特点之一是参数意义清楚,即得到某一因素的回归系数后,可以很快估计出这一因素在不同水平下的优势比或近似相对危险度,因此非常适合于流行病学研究。logistic回归既适合于队列研究(cohort study),也适合于病例-对照研究(case-control study),同样还可以用于断面研究(cross-sectional study)第三节 logistic回归的应用及其注意事项2临床试验数据分析 临床试验的目的大多是为了评价某种药物或治疗方法的效果,如果有其他影响效果的非处理因素(如年龄、病情等)在试验组和对照组中分布不均衡,就有可能

11、夸大或掩盖试验组的治疗效果。尽管在分组时要求按随机化原则分配,但由于样本含量有限,非处理因素在试验组和对照组内的分布仍有可能不均衡,需要在分析阶段对构成混杂的非处理因素进行调整。当评价指标为二值变量时(如有效和无效),可以利用logistic回归分析得到调整后的药物评价结果。对于按分层设计的临床试验可以用相同的方法对分层因素进行调整和分析。3分析药物或毒物的剂量反应 在一些药物或毒物效价的剂量-反应实验研究中,每一只动物药物耐受量可能有很大的不同,不同剂量使动物发生“阳性反应”的概率分布常呈正偏态,将剂量取对数后则概率分布接近正态分布。由于正态分布函数与logistic分布函数十分接近,如果用

12、P表示在剂量为X时的阳性率,可用下述模型表示它们之间的关系用这一模型可以求出任一剂量的阳性反应率用这一模型可以求出任一剂量的阳性反应率传传统统的的一一些些方方法法往往往往对对实实验验设设计计有有严严格格的的要要求求,如如剂剂量量按按等等比比级级数数排排列列,各各剂剂量量组组的的例例数数必必须须相相同同等等,采采用用logistic回回归归的的方方法法则则没有这些限制。没有这些限制。4预测与判别 logistic回归是一个概率型模型,因此可以利用它预测某事件发生的概率。例如在临床上可以根据患者的一些检查指标,判断患某种疾病的概率有多大。关于判别问题见第十八章。二、logistic回归应用的注意事

13、项本章小结:本章小结:本章小结:本章小结:目的:目的:作出以多个自变量(危险因素)估计应变量(结果作出以多个自变量(危险因素)估计应变量(结果因素)的因素)的logistic回归方程。属于概率型非线性回归。回归方程。属于概率型非线性回归。资料:资料:1.应变量为反映某现象发生与不发生的二值变量;应变量为反映某现象发生与不发生的二值变量;2.自变量宜全部或大部分为分类变量,可有少数数自变量宜全部或大部分为分类变量,可有少数数值值变量。分类变量要数量化。变量。分类变量要数量化。用途:用途:研究某种疾病或现象发生和多个危险因素(或保护研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系。因子

14、)的数量关系。种类种类:1.成组(非条件)成组(非条件)logistic回归方程。回归方程。2.配对(条件)配对(条件)logistic回归方程。回归方程。课后应用思考题:课后应用思考题:课后应用思考题:课后应用思考题:为了分析影响为了分析影响为了分析影响为了分析影响医院抢救急性心肌梗死(医院抢救急性心肌梗死(医院抢救急性心肌梗死(医院抢救急性心肌梗死(AMIAMIAMIAMI)患者能否成)患者能否成)患者能否成)患者能否成功的因素,某医院收集了功的因素,某医院收集了功的因素,某医院收集了功的因素,某医院收集了5 5 5 5年中所有的年中所有的年中所有的年中所有的AMIAMIAMIAMI患者的

15、抢救病史患者的抢救病史患者的抢救病史患者的抢救病史(有关因素很多,由于篇幅有限,本例仅列出(有关因素很多,由于篇幅有限,本例仅列出(有关因素很多,由于篇幅有限,本例仅列出(有关因素很多,由于篇幅有限,本例仅列出3 3 3 3个),共个),共个),共个),共200200200200例见下表。其中例见下表。其中例见下表。其中例见下表。其中P=0P=0P=0P=0表示抢救成功,表示抢救成功,表示抢救成功,表示抢救成功,P=1P=1P=1P=1表示抢救未成功而死表示抢救未成功而死表示抢救未成功而死表示抢救未成功而死亡;亡;亡;亡;X1=1X1=1X1=1X1=1表示抢救前已发生休克,表示抢救前已发生休

16、克,表示抢救前已发生休克,表示抢救前已发生休克,X1=0X1=0X1=0X1=0表示抢救前未发生休表示抢救前未发生休表示抢救前未发生休表示抢救前未发生休克;克;克;克;X2=1X2=1X2=1X2=1表示抢救前已发生心衰,表示抢救前已发生心衰,表示抢救前已发生心衰,表示抢救前已发生心衰,X2=0X2=0X2=0X2=0表示抢救前未发生表示抢救前未发生表示抢救前未发生表示抢救前未发生心衰;心衰;心衰;心衰;X3=1X3=1X3=1X3=1表示患者从开始表示患者从开始表示患者从开始表示患者从开始AMIAMIAMIAMI症状到抢救时已超过症状到抢救时已超过症状到抢救时已超过症状到抢救时已超过1212

17、1212小时,小时,小时,小时,X3=0X3=0X3=0X3=0表示患者从开始表示患者从开始表示患者从开始表示患者从开始AMIAMIAMIAMI症状到抢救时未超过症状到抢救时未超过症状到抢救时未超过症状到抢救时未超过12121212小时。小时。小时。小时。请问最好采用哪种分析方法?为什么?请问最好采用哪种分析方法?为什么?请问最好采用哪种分析方法?为什么?请问最好采用哪种分析方法?为什么?分析结果有哪些?分析结果有哪些?分析结果有哪些?分析结果有哪些?AMI AMI患者的抢救危险因素资料患者的抢救危险因素资料患者的抢救危险因素资料患者的抢救危险因素资料P=0(在医院抢救成功)P=1(在医院抢救未成功而死亡)X1X2X3NX1X2X3N00035000400134001100101701040111901115100171006101610191106110611161116

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com