统计学(第一章) 绪论.ppt

上传人:s****8 文档编号:77391082 上传时间:2023-03-14 格式:PPT 页数:43 大小:2.89MB
返回 下载 相关 举报
统计学(第一章) 绪论.ppt_第1页
第1页 / 共43页
统计学(第一章) 绪论.ppt_第2页
第2页 / 共43页
点击查看更多>>
资源描述

《统计学(第一章) 绪论.ppt》由会员分享,可在线阅读,更多相关《统计学(第一章) 绪论.ppt(43页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、卫生统计学卫生统计学王秀琴王秀琴u如何判断药物的疗效?如何判断药物的疗效?(假设检验假设检验)u体育彩票能否中奖?体育彩票能否中奖?(概率论概率论)u子女为什么象父母,其强度有多大子女为什么象父母,其强度有多大?(相关与回归相关与回归)工作生活中常见的统计学问题工作生活中常见的统计学问题 第一章第一章 绪论绪论一、学习卫生统计学的意义一、学习卫生统计学的意义 卫生统计学:卫生统计学:是数理统计学的基本原理和方法在是数理统计学的基本原理和方法在医学医学领域领域中的应用,是关于中的应用,是关于医学研究医学研究中中资料资料的收集、整理、分的收集、整理、分析、解释和表述的一门科学。析、解释和表述的一门

2、科学。统计学:统计学:是关于是关于数据数据的收集、整理、分析、解释和表述的科学。的收集、整理、分析、解释和表述的科学。概念概念 数理统计学数理统计学应用统计学应用统计学例例1.11.1 资料分析表明在全球范围内人类的乳腺癌、男资料分析表明在全球范围内人类的乳腺癌、男性生殖系统癌症有明显上升的趋势,同时,男性性生殖系统癌症有明显上升的趋势,同时,男性的精子数量和浓度有明显减少的倾向。的精子数量和浓度有明显减少的倾向。一、学习卫生统计学的意义一、学习卫生统计学的意义 有学者提出了有学者提出了“环境激素环境激素”学说,即学说,即人类越来越多的暴露于环境中有人体人类越来越多的暴露于环境中有人体激素样作

3、用、对人体内分泌起干扰作激素样作用、对人体内分泌起干扰作用的化学污染物质。用的化学污染物质。例例1.11.1 北京大学一个课题组欲研究人们经常食用的北京大学一个课题组欲研究人们经常食用的一种食品是否含有雌激素,是否对小鼠有一种食品是否含有雌激素,是否对小鼠有雌激素作用。雌激素作用。一、学习卫生统计学的意义一、学习卫生统计学的意义 统计学设计:统计学设计:1.1.需要多少大鼠?需要多少大鼠?2.2.如何分组?如何分组?3.3.如何设立对照?如何设立对照?4.4.是否使用盲法?是否使用盲法?5.5.选用何种指标表示雌激素作用?选用何种指标表示雌激素作用?6.6.选用何种统计方法?选用何种统计方法?

4、德国(德国(19601960年代初),年代初),药物酞胺哌啶酮(又称反应停)药物酞胺哌啶酮(又称反应停)事件(事件(曾引起一次胎儿畸形(四肢体短缺)的暴发,经过曾引起一次胎儿畸形(四肢体短缺)的暴发,经过研究发现危险因素是研究发现危险因素是反应停)。反应停)。一、学习卫生统计学的意义一、学习卫生统计学的意义 例例1.2 1.2:例例1.3:1.3:某地某地19861986年年120120名名8 8岁男孩身高均数为岁男孩身高均数为=123.02cm=123.02cm,标准差为标准差为=4.79cm=4.79cm,试估计试估计该地该地8 8岁男孩身高在岁男孩身高在130cm130cm以上者占该地以

5、上者占该地8 8岁男孩总岁男孩总数的百分比?数的百分比?一、学习卫生统计学的意义一、学习卫生统计学的意义 例例1.4 1.4 某医师研究用某医师研究用兰芩口服液兰芩口服液与与银黄口服液银黄口服液治治疗疗慢性咽炎慢性咽炎疗效有无差别,将病情相似的疗效有无差别,将病情相似的8080名患名患者随机分成两组,分别用两种药物治疗。者随机分成两组,分别用两种药物治疗。问题:这两种药物的疗效是否相同?问题:这两种药物的疗效是否相同?药药物物疗疗效效合合计计有效有效无效无效兰兰芩口服液芩口服液41 4 45银银黄口服液黄口服液24 11 35合合计计 65 15 80一、学习卫生统计学的意义一、学习卫生统计学

6、的意义 例例1.51.5 某某研研究究者者欲欲评评价价新新药药按按摩摩乐乐口口服服液液治治疗疗高高甘甘油油三三脂脂血血症症的的疗疗效效,将将高高甘甘油油三三脂脂血血症症患患者者189189例例随随机机分分为为两两组组,分分别别用用按按摩摩乐乐口口服服液液和和山山楂楂精精降降脂脂片片治治疗疗,数数据据见见表表10-410-4,问问两两种种药药物物治治疗疗高高甘甘油油三脂血症的疗效有无不同?三脂血症的疗效有无不同?表表 两种药物治疗高甘油三脂血症的疗效两种药物治疗高甘油三脂血症的疗效一、学习卫生统计学的意义一、学习卫生统计学的意义 二、统计学的若干概念二、统计学的若干概念总体与样本总体与样本 同质

7、与变异同质与变异 变量的类型变量的类型 观察单位与变量观察单位与变量 误差误差 概率与频率概率与频率 观察单位:观察单位:某地某地20002000年每个年每个7 7岁正常儿童岁正常儿童 被观察或测量对象的最基本单位,也称被观察或测量对象的最基本单位,也称个体个体,可以是一,可以是一个人、一个动物或一个采样点等。个人、一个动物或一个采样点等。观察单位与变量观察单位与变量 二、统计学的若干概念二、统计学的若干概念例例:欲观察某地:欲观察某地20002000年年7 7岁正常儿童的身高。岁正常儿童的身高。变量:变量:身高身高 对每个观察单位的对每个观察单位的某项特征某项特征进行测量或观察,该项特进行测

8、量或观察,该项特征就称为征就称为变量变量。被观察单位的该项特征值为。被观察单位的该项特征值为变量值变量值变量值变量值。分类变量:分类变量:通过确定每个观察单位的某项特征的通过确定每个观察单位的某项特征的性性性性质或类别质或类别质或类别质或类别得到的数据,得到的数据,例如例如,职业、性别等职业、性别等包括:包括:无序分类变量:无序分类变量:多分类变量多分类变量(血型血型)二分类变量二分类变量(性别性别)有序分类变量:有序分类变量:疗效疗效(好、中、差好、中、差)数值变量:数值变量:通过通过测定测定测定测定每个观察单位的某项特每个观察单位的某项特征的大小得到的数据。有征的大小得到的数据。有度量衡单

9、位度量衡单位。连续型变量连续型变量:如,血压、身高、体重等。如,血压、身高、体重等。离散型变量离散型变量:如,一月中的手术病人数,如,一月中的手术病人数,一年里的新生儿数等。一年里的新生儿数等。变量的类型变量的类型 分类变量分类变量 数值变量数值变量 二、统计学的若干概念二、统计学的若干概念 离散型变量离散型变量常常通过适当的变换或连续性校常常通过适当的变换或连续性校正后借用连续型变量或有序变量的方法来分析。正后借用连续型变量或有序变量的方法来分析。连续型连续型有序有序 分类分类 二分类二分类 变量的类型变量的类型 变量转化:变量只能由高级向低级转化:变量转化:变量只能由高级向低级转化:二、统

10、计学的若干概念二、统计学的若干概念 例:一组例:一组2020 4040岁成年人的血压(舒张压)岁成年人的血压(舒张压)以以12kPa12kPa(90mmHg90mmHg)为界分为正常与为界分为正常与异常两组,统计每组例数。异常两组,统计每组例数。8 8 低血压低血压 8 8 正常血压正常血压 1212 轻度高血压轻度高血压 1515 中度高血压中度高血压 1717 重度高血压重度高血压计量资料计量资料 等等级级资资料料计数资料计数资料 变量的类型变量的类型 二、统计学的若干概念二、统计学的若干概念变量的类型变量的类型 二、统计学的若干概念二、统计学的若干概念数值变量数值变量数值变量数值变量分类

11、变量分类变量分类变量分类变量无序分类变量无序分类变量无序分类变量无序分类变量有序分类变量有序分类变量有序分类变量有序分类变量资料类型资料类型统计资料类型:统计资料类型:资料类型资料类型变量类型变量类型示例示例统计指标统计指标统计分析方法统计分析方法计量资料计量资料数值变量数值变量人体身高人体身高170cm170cm168cm168cm171cm171cm平均数,平均数,标准差标准差t,Z,Ft,Z,F,直线相直线相关与回归关与回归计数资料计数资料无序分类无序分类变量变量性别性别男男女女率,比,率,比,构成比构成比卡方检验,卡方检验,Z Z检验检验等级资料等级资料有序分类有序分类变量变量治疗效果

12、治疗效果痊愈痊愈好转好转无效无效构成比构成比秩和检验秩和检验二、统计学的若干概念二、统计学的若干概念同质与变异同质与变异 同质性:同质性:研究对象具有研究对象具有相同相同的状况或属性等共性。的状况或属性等共性。变异:变异:同一总体内的同质的各观察单位其某变量值之间的同一总体内的同质的各观察单位其某变量值之间的差异差异。例如:研究某新药治疗胃溃疡的效果?例如:研究某新药治疗胃溃疡的效果?二、统计学的若干概念二、统计学的若干概念例例:研究某地:研究某地20052005年活产婴儿的出生体重。年活产婴儿的出生体重。二、统计学的若干概念二、统计学的若干概念总体与样本总体与样本 如:欲研究如:欲研究200

13、92009年厦门市成年人高血压患病率情况年厦门市成年人高血压患病率情况 。总体总体:根据研究目的确定的同质观察单位的全体。:根据研究目的确定的同质观察单位的全体。根据总体中观察单位数是否已知,分为:根据总体中观察单位数是否已知,分为:有限总体有限总体:有确定的时间、空间和有限个观察单位。有确定的时间、空间和有限个观察单位。无限总体:无限总体:没有确定的时间、空间限制,观察单位数为无限。没有确定的时间、空间限制,观察单位数为无限。总体总体 样本样本 抽取部分观察单位抽取部分观察单位?统计推断统计推断总体与样本总体与样本 为了保证样本的可靠性和代为了保证样本的可靠性和代表性,需要采用表性,需要采用

14、随机随机的抽样方的抽样方法(法(在总体中每个个体具有相在总体中每个个体具有相同的机会被抽到同的机会被抽到)。)。二、统计学的若干概念二、统计学的若干概念样本:样本:是指总体中的一部分观察单位的某项变量是指总体中的一部分观察单位的某项变量值的集合,必须对总体具有代表性。值的集合,必须对总体具有代表性。如:欲调查某地如:欲调查某地20052005年活产婴儿的出生体重年活产婴儿的出生体重 欲研究某药治疗胃溃疡的效果欲研究某药治疗胃溃疡的效果泛指测量值与真值之差泛指测量值与真值之差.误差误差 二、统计学的若干概念二、统计学的若干概念u系统误差系统误差u随机测量误差随机测量误差 u抽样误差抽样误差 包括

15、:包括:指数据搜集和测量过程中指数据搜集和测量过程中由于仪器不准确、标准不规范由于仪器不准确、标准不规范等原因,造成观察结果呈倾向等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称性的偏大或偏小,这种误差称为为系统误差。系统误差。误差误差 二、统计学的若干概念二、统计学的若干概念系统误差:系统误差:特点:特点:可避免可避免,不可估计其大小。不可估计其大小。误差误差 二、统计学的若干概念二、统计学的若干概念随机测量误差:随机测量误差:在消除了系统误差的前提下,由于非人为的偶然因素,在消除了系统误差的前提下,由于非人为的偶然因素,对于同一样本多次测定结果不完全一样,结果有时偏大有对于同一样本多次

16、测定结果不完全一样,结果有时偏大有时偏小,没有倾向性,这种误差叫时偏小,没有倾向性,这种误差叫随机测量误差随机测量误差。特点:特点:不可避免不可避免,不可估计其大小。不可估计其大小。误差误差 二、统计学的若干概念二、统计学的若干概念抽样误差:抽样误差:由于由于抽样抽样原因造成的原因造成的样本指标与总体指标样本指标与总体指标之间的之间的差别,可以通过增大样本使其减小。差别,可以通过增大样本使其减小。特点:特点:不可避免不可避免,但可用统计学方法估计其大小。但可用统计学方法估计其大小。总体总体 样本样本 抽取部分观察单位抽取部分观察单位 系统误差系统误差随机测量误差随机测量误差 抽样误差抽样误差

17、二、统计学的若干概念二、统计学的若干概念 指数据搜集和测量过程指数据搜集和测量过程指数据搜集和测量过程指数据搜集和测量过程中由于仪器不准确、标准中由于仪器不准确、标准中由于仪器不准确、标准中由于仪器不准确、标准不规范等原因,造成观察不规范等原因,造成观察不规范等原因,造成观察不规范等原因,造成观察结果呈倾向性的偏大或偏结果呈倾向性的偏大或偏结果呈倾向性的偏大或偏结果呈倾向性的偏大或偏小。小。小。小。在消除了系统误差的在消除了系统误差的在消除了系统误差的在消除了系统误差的前提下,由于非人为的前提下,由于非人为的前提下,由于非人为的前提下,由于非人为的偶然因素,对于同一样偶然因素,对于同一样偶然因

18、素,对于同一样偶然因素,对于同一样本多次测定结果不完全本多次测定结果不完全本多次测定结果不完全本多次测定结果不完全一样,结果有时偏大有一样,结果有时偏大有一样,结果有时偏大有一样,结果有时偏大有时偏小,没有倾向性。时偏小,没有倾向性。时偏小,没有倾向性。时偏小,没有倾向性。由于抽样原因造由于抽样原因造由于抽样原因造由于抽样原因造成的样本指标与总成的样本指标与总成的样本指标与总成的样本指标与总体指标之间的差别。体指标之间的差别。体指标之间的差别。体指标之间的差别。特点:特点:特点:特点:可避免可避免可避免可避免,不可不可不可不可估计其大小。估计其大小。估计其大小。估计其大小。特点:特点:特点:特

19、点:不可避免不可避免不可避免不可避免,不不不不可估计其大小。可估计其大小。可估计其大小。可估计其大小。特点:特点:特点:特点:不可避免不可避免不可避免不可避免,但可用统计学方但可用统计学方但可用统计学方但可用统计学方法估计其大小。法估计其大小。法估计其大小。法估计其大小。频率与概率频率与概率 二、统计学的若干概念二、统计学的若干概念频率和概率均频率和概率均表示随机事件发生可能性的大小,表示随机事件发生可能性的大小,记作记作P P,p p。如:如:某药治疗某药治疗200200个病人,其治愈率为个病人,其治愈率为80%80%。统计分析中的很多结论都是带有概率性的。统计分析中的很多结论都是带有概率性

20、的。习惯习惯上将上将 P0.05P0.05或或P P 0.01 0.01 ,称为小概率事件,称为小概率事件,表示在表示在一次实验或观察中该事件发生的可能性很小,可以视为一次实验或观察中该事件发生的可能性很小,可以视为很可能不发生。很可能不发生。频率与概率频率与概率 CertainCertainImpossibleImpossible0.50.50 01 1u必然事件必然事件 P P=1=1u随机事件随机事件 0 0 P P 1 1u不可能事件不可能事件 P P=0=0 二、统计学的若干概念二、统计学的若干概念参数:参数:是统计模型的特征指标,是对总体而言,是统计模型的特征指标,是对总体而言,其

21、其大小是客观存在的,然而往往是未知的大小是客观存在的,然而往往是未知的,如总体均如总体均数和总体方差;数和总体方差;统计量:统计量:由观察资料计算出来的量由观察资料计算出来的量,如计算观察样,如计算观察样本中的个体得到的样本均数,样本方差。本中的个体得到的样本均数,样本方差。参数与统计量参数与统计量 二、统计学的若干概念二、统计学的若干概念总体总体 样本样本 抽样研究抽样研究描述和统计推断描述和统计推断参数与统计量参数与统计量 参数参数 统计量统计量 二、统计学的若干概念二、统计学的若干概念三、统计工作的步骤三、统计工作的步骤 第第第第1 1 1 1步步步步第第第第2 2 2 2步步步步第第第

22、第3 3 3 3步步步步第第第第4 4 4 4步步步步设设设设 计计计计 收集资料收集资料收集资料收集资料 整理资料整理资料整理资料整理资料 分析资料分析资料分析资料分析资料 制定计划,对整个过程进行安排。制定计划,对整个过程进行安排。制定计划,对整个过程进行安排。制定计划,对整个过程进行安排。是整个工作是整个工作是整个工作是整个工作的关键。的关键。的关键。的关键。如何进行设计?举例。背景如何进行设计?举例。背景如何进行设计?举例。背景如何进行设计?举例。背景-目的目的目的目的-方方方方法法法法-内容内容内容内容-经费预算经费预算经费预算经费预算根据计划取得可靠、完整的资料。收集资料的根据计划

23、取得可靠、完整的资料。收集资料的根据计划取得可靠、完整的资料。收集资料的根据计划取得可靠、完整的资料。收集资料的方法有三种:统计报表、日常性工作、专题调方法有三种:统计报表、日常性工作、专题调方法有三种:统计报表、日常性工作、专题调方法有三种:统计报表、日常性工作、专题调查。注重资料的真实性。查。注重资料的真实性。查。注重资料的真实性。查。注重资料的真实性。原始资料的整理、清理、核实、查对,使其条原始资料的整理、清理、核实、查对,使其条原始资料的整理、清理、核实、查对,使其条原始资料的整理、清理、核实、查对,使其条理化、系统化便于计算和分析。可借助于计算理化、系统化便于计算和分析。可借助于计算

24、理化、系统化便于计算和分析。可借助于计算理化、系统化便于计算和分析。可借助于计算机(常用软件:机(常用软件:机(常用软件:机(常用软件:EPIEPIEPIEPI、SPSSSPSSSPSSSPSS、SASSASSASSAS)。)。)。)。统计学的关键所在。运用统计学的基本原理和统计学的关键所在。运用统计学的基本原理和统计学的关键所在。运用统计学的基本原理和统计学的关键所在。运用统计学的基本原理和方法,分析计算有关的指标和数据,揭示事物方法,分析计算有关的指标和数据,揭示事物方法,分析计算有关的指标和数据,揭示事物方法,分析计算有关的指标和数据,揭示事物内部的规律。包括内部的规律。包括内部的规律。

25、包括内部的规律。包括统计描述和统计推断。统计描述和统计推断。统计描述和统计推断。统计描述和统计推断。练习练习1.1.统计学中所说的有代表性的样统计学中所说的有代表性的样本指的是(本指的是()A.随意抽取的总体中任意个体随意抽取的总体中任意个体B.有意识地选择总体中有典型个体有意识地选择总体中有典型个体C.依照研究者要求选取总体中有意义的个体依照研究者要求选取总体中有意义的个体D.最方便获取的部分个体最方便获取的部分个体E.依照随机原则抽取总体中的个体依照随机原则抽取总体中的个体E练习:练习:2.2.下列变量的观测结果属于等级下列变量的观测结果属于等级资料的是(资料的是()A.白细胞计数白细胞计

26、数B.住院天数住院天数C.门诊就诊人数门诊就诊人数D.患者病情分级患者病情分级E.各临床科室的患者数各临床科室的患者数D练习:练习:3.3.抽样的目的是(抽样的目的是()A.研究样本统计量研究样本统计量B.由样本统计量推断总体参数由样本统计量推断总体参数C.研究典型案例研究典型案例D.研究总体统计量研究总体统计量E.研究特殊个体特征研究特殊个体特征B练习:练习:4.4.关于随机抽样,下列哪一项说法关于随机抽样,下列哪一项说法是正确的(是正确的()A.抽样时应使得总体中的每一个个体都有同抽样时应使得总体中的每一个个体都有同等的机会被抽取等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样研究者

27、在抽样时应精心挑选个体,以使样本更能代表总体本更能代表总体C.随机抽样即随意抽取个体随机抽样即随意抽取个体D.为确保样本具有很好的代表性,样本量应为确保样本具有很好的代表性,样本量应越大越好越大越好E.选择符合研究者意愿的样本选择符合研究者意愿的样本A练习:练习:5 5、对某地、对某地200200名名1616岁中学生口腔岁中学生口腔检查,发现龋齿的人数检查,发现龋齿的人数5454人,人,该资料属于(该资料属于()A.计量资料B.计数资料C.等级资料D.经变量转换也可以作为计量资料B练习:练习:6 6、下面的变量中,属于分类变量、下面的变量中,属于分类变量的是(的是()A.脉搏 B.血型 C.肺

28、活量 D.红细胞计数 E.血压B练习:练习:7 7、某人记录了、某人记录了5050名病人体重的测定结果:小于名病人体重的测定结果:小于50Kg50Kg的的1313人,介于人,介于50Kg50Kg和和70 Kg70 Kg间的间的2020人,人,大于大于70 Kg70 Kg的的1717人人 ,此种资料属于(,此种资料属于()A.计量资料 B.计数资料 C.等级资料 D.无序分类的计数资料 E.名义变量资料C练习:练习:8 8、下面的变量中,属于数值变量、下面的变量中,属于数值变量的是(的是()nA.性别 nB.体重 nC.血型 nD.职业 nE.民族B练习:练习:9 9、调查某单位科研人员论文发表

29、的情况,、调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于(统计每人每年的论文发表数应属于()A.计量资料 B.计数资料C.总体D.个体A练习:练习:1.在研究工作中 误差是不可避免的,误差是可以而且应该避免的,统计方法能处理的是 误差。2.统计工作的四个步骤是:,。随机测量随机测量 系统系统抽样抽样 设计设计 收集资料收集资料 整理资料整理资料 分析资料分析资料 练习:练习:某年级甲班、乙班各有某年级甲班、乙班各有5050人。从人。从两个班各抽取两个班各抽取1010人测量身高,并求其人测量身高,并求其平均身高,如果甲班的平均身高高于平均身高,如果甲班的平均身高高于乙班,乙班,能否推论甲班所有同学的平均能否推论甲班所有同学的平均身高高于乙班?身高高于乙班?为什么?为什么?练习:练习:

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 保健医疗策划

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com