Ch10 Logistic回归分析.ppt

上传人:qwe****56 文档编号:69507038 上传时间:2023-01-05 格式:PPT 页数:22 大小:255KB
返回 下载 相关 举报
Ch10 Logistic回归分析.ppt_第1页
第1页 / 共22页
Ch10 Logistic回归分析.ppt_第2页
第2页 / 共22页
点击查看更多>>
资源描述

《Ch10 Logistic回归分析.ppt》由会员分享,可在线阅读,更多相关《Ch10 Logistic回归分析.ppt(22页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、Slide 1彭斌Logistic回归分析回归分析 Logistic Regression Slide 2彭斌一、概述一、概述前面介绍的线性回归模型(一元和多元)均要求应变量Y连续型随机变量,并呈正态分布。医学上常常碰到应变量是分类变量的情况,如发病与未发病、死亡与未死亡等。如果需要分析多个自变量对此类应变量的影响情况,则不能建立自变量与应变量的一般回归分析模型。Slide 3彭斌Logit变换变换对于应变量Y是二值的情况,始终可以用“阳性”与“阴性”来表达。如果令应变量Y=“阳性”的概率为,则其对立面Y=“阴性”的概率为1-。很显然,及1-的取值范围均在01之间,二者经过下面的变换,变换后的

2、取值范围均在(-,+)之间。的这种变换称为Logit变换,记为Logit()Slide 4彭斌Logistic回归模型回归模型既然Logit()的取值是(-,+),因此可以将Logit()当作“应变量”,从而建立该“应变量”与相应自变量的线性回归模型,如下:这种“阳性阳性”概率概率与自变量自变量之间的回归关系就是Logistic回归模型回归模型。非条件Logistic回归:用于成组资料;条件Logistic回归:用于配对资料。Slide 5彭斌二、二、Logistic回归过程回归过程SAS中可以实现Logistic回归分析的过程有:LOGISTIC过程、CATMOD过程以及PHREG过程。本节

3、重点介绍LOGISTIC过程的用法,通过实例说明如何实现简单的Logistic回归分析。Slide 6彭斌Logistic常用语句常用语句PROCLOGISTIC;BYvariables;FREQvariable;MODELresponse=;STRATAeffects;其中,下划线部分是必需的,其它都是可选的。Slide 7彭斌1、PROCLOGISTIC;过程选项过程选项options:OUTEST=数据集名数据集名将结果存储到指定的数据集中。将结果存储到指定的数据集中。NOPRINT不显示统计结果。不显示统计结果。ORDER=DATA|FORMATTED|INTERNAL规定模型中反应变

4、量的水平顺序规定模型中反应变量的水平顺序DATA:应变量的顺序与数据集中出现的顺序一致应变量的顺序与数据集中出现的顺序一致FORMATTED:按照格式化值的顺序,相当于应变按照格式化值的顺序,相当于应变量所赋值的大小顺序,从小到大的顺序,默认值量所赋值的大小顺序,从小到大的顺序,默认值。INTERNAL:按照非格式化值的顺序按照非格式化值的顺序Slide 8彭斌DESCENDING|DES应变量按从大到小顺序排列应变量按从大到小顺序排列注意,如果应变量的赋值为:注意,如果应变量的赋值为:未转移未转移=0,转移,转移=1要考查危险因素要考查危险因素中中转移转移相对于相对于未未转移转移的风险的风险

5、:Logit(P(转移转移),应选择,应选择DES选项选项(即要求从大到小即要求从大到小排列排列),否则得到的结果是,否则得到的结果是未转移未转移相对于相对于转移转移的风的风险险:Logit(P(未转移未转移)(默认按从小到大顺序默认按从小到大顺序)。Slide 9彭斌2、MODEL语句MODELresponse=;MODEL语句指定模型的反应变量(response)、考查因素(effects)及有关建立模型的选项、控制结果输出的选项。Model语句中模型的指定与多元线性回归中模型的指定是相似的。Slide 10彭斌常用的选项有:SELECTION=FORWARD(或F)|BACKWARD(或

6、B)|STEPWISE|SCORE规定变量筛选的方法,分别为向前:FORWARD向后:BACKWARD逐步:STEPWISE最优子集法:SCORE缺省时为NONE,拟合全回归模型。如:Modely=x1x2x3x4;Modely=x1x2x3x4/selection=stepwise;Modely=x1x2x3x4/selection=forward;SLE=概率值,指定变量进入模型的显著水平,缺省为0.05SLS=概率值,指定变量保留在模型的显著水平,缺省为0.05Slide 11彭斌STRATAid-variable;用于指定分层或者匹配变量,进行条件Logistic回归分析。用于二值反应

7、变量数据资料。id-variable可以是数值型也可以是字符型。3、STRATA语句Slide 12彭斌实例实例例9-1前列腺癌细胞是否扩散到邻近的淋巴结,是选择治疗方案的重要依据。为了了解淋巴组织中有无癌转移,通常的做法是对病人实施剖腹探查。为了不手术而又能弄清淋巴结的转移情况,Brown(1980)在术前检查了53例前列腺癌患者,分别记录了年龄、酸性磷酸酯酶、X射线、术前探针活检病理分级、直肠指检肿瘤大小位置等五个变量,还有手术探查淋巴结转移结果变量,资料见下表。(医学统计学余松林主编,人民卫生出版社,p204)Slide 13彭斌变量赋值变量赋值变量名 含义赋值X_rayX射线0=未做1

8、=已做Grade活检病理分级0=0级(较轻)1=1级(较重)Stage直肠指检结果0=0级(较轻)1=1级(较重)Age年龄Acid酸性磷酸酯酶Nodes淋巴结转移结果 0=未转移1=转移注意赋值的一般规则是注意赋值的一般规则是:1、按危险因素取值危险性的大小从低到高进行,危险性、按危险因素取值危险性的大小从低到高进行,危险性小的赋值小,危险性大的赋值大。小的赋值小,危险性大的赋值大。2、结果变量的赋值阴性结果赋较小的值,阳性结果赋较、结果变量的赋值阴性结果赋较小的值,阳性结果赋较大的值。如,对照大的值。如,对照=0,病例,病例=1;未转移;未转移=0,转移,转移=1等。等。Slide 14彭

9、斌原始数据原始数据Slide 15彭斌建立建立SAS数据集数据集dataex91;inputnox_raygradestageageacidnodes;cards;101164400200163400.52 11168126153 100611361;Run;Slide 16彭斌调用调用Logistic过程过程1)全模型全模型PROCLOGISTICDATA=ex91DES;MODELnodes=x_raygradestageageacid;RUN;2)逐步筛选模型逐步筛选模型PROCLOGISTICDATA=ex91DES;MODELnodes=x_raygradestageageacid/

10、selection=stepwise;RUN;如果去掉上面程序中的如果去掉上面程序中的“DES”选项,有什么变化?选项,有什么变化?Slide 17彭斌Logistic过程输出结果过程输出结果The LOGISTIC ProcedureModelInformationDataSet分析所用的数据集分析所用的数据集WORK.EX91ResponseVariable反应变量反应变量nodesNumberofResponseLevels反应变量的水平数反应变量的水平数2NumberofObservations观察例数观察例数53LinkFunction联系函数联系函数LogitOptimizatio

11、nTechnique优化措施优化措施Fishers scoringModelConvergenceStatusConvergence criterion(GCONV=1E-8)satisfied.这里对结果的判读很重要!这里对结果的判读很重要!根据过程选项ORDER和DES对反应变量进行排序,给出排序后的值,并给出每个水平的例数。注意:Logistic过程拟合排序值(OrderedValue)为“1 1”所对应的反应变量水平的概率,这里,OrderedValue1所对应的水平是所对应的水平是1,因此,拟合的模型是,因此,拟合的模型是:模型收敛的水平ResponseProfileOrderedV

12、aluenodesTotalFrequency11202033Slide 18彭斌ModelFitStatisticsCriterionInterceptOnlyInterceptandCovariatesAIC72.25260.126SC74.22271.948-2LogL70.25248.126TestingGlobalNullHypothesis:BETA=0TestChi-SquareDFPrChiSqLikelihoodRatio22.126450.0005Score19.451450.0016Wald13.140650.0221AnalysisofMaximumLikelihood

13、EstimatesParameter参数(因素)参数(因素)DF自由度自由度Estimate回归系数回归系数StandardError标准误标准误Chi-Square卡方值卡方值PrChiSqP值值Intercept10.06183.45990.00030.9857x_ray12.04530.80726.42080.0113grade10.76140.77080.97590.3232stage11.56410.77404.08350.0433age1-0.06930.05791.43200.2314acid10.02430.01323.42300.0643模型拟合的统计量对模型的总的检验,无效

14、假设为总体的=0经检验pChiSqEnteredRemoved1x_ray1111.2831.0.00082stage125.6394.0.0176AnalysisofMaximumLikelihoodEstimatesParameterDFEstimateStandardErrorChi-SquarePrChiSqIntercept1-2.04460.610011.23600.0008x_ray12.11940.74688.05370.0045stage11.58830.70005.14790.0233OddsRatioEstimatesEffectPointEstimate95%WaldC

15、onfidenceLimitsx_ray8.3261.92635.989stage4.8951.24119.304逐步回归概要变量筛选过程参数估计及检验OR值Slide 21彭斌结果简单解释结果简单解释根据参数估计结果:在a=0.05水平上,只有x_ray和stage两个查考因素具有统计学意义,对应的p值分别是0.0113,0.0433,所对应的OR值分别为7.732,4.778。结合赋值表及拟合模型的方向(是Logit(p(0)还是Logit(p(1))可以对结果作出评价。首先,这里拟合的是Logit(p(1)模型,即“有淋巴结转移”相对于“无淋巴结转移”的模型。因此,x_ray的OR=7.732就说明“做X线检查”的患者被发现“有淋巴结转移”的机率是“未做X线检查”患者的7.732倍,故X线检查有助于发现淋巴结转移。其余类推。根据逐步回归的结果写出Logistic回归方程:Slide 22彭斌SAS命令框中输入:命令框中输入:HelpLogistic寻求帮助寻求帮助

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com