基本概念与基本知识.ppt

上传人:wuy****n92 文档编号:90748433 上传时间:2023-05-17 格式:PPT 页数:63 大小:1.53MB
返回 下载 相关 举报
基本概念与基本知识.ppt_第1页
第1页 / 共63页
基本概念与基本知识.ppt_第2页
第2页 / 共63页
点击查看更多>>
资源描述

《基本概念与基本知识.ppt》由会员分享,可在线阅读,更多相关《基本概念与基本知识.ppt(63页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、医学统计与计算医学统计与计算授课对象授课对象:研究生各专业研究生各专业 使用教材使用教材:SPSSSPSS统计软件统计软件参考教材参考教材:医药数理统计医药数理统计总学时数总学时数:54 54 学时学时(理论理论:33:33学时学时 实验实验:21:21学时学时)贵阳中医学院数学微机教研室贵阳中医学院数学微机教研室 范薪生范薪生序序 言言医学统计与计算医学统计与计算是医学统计方法结合计算是医学统计方法结合计算机应用,在医药科研中处理数据、分析数据着重机应用,在医药科研中处理数据、分析数据着重实用性的课程。主要是针对我院医学、药学各专实用性的课程。主要是针对我院医学、药学各专业的硕士研究生(已学

2、过数理、或医学统计和计业的硕士研究生(已学过数理、或医学统计和计算机的医药学各专业的学生),开设的一门以实算机的医药学各专业的学生),开设的一门以实践为主、以提高科研能力为目的的素质课程。践为主、以提高科研能力为目的的素质课程。本课程主要介绍本课程主要介绍EXCEL中的统计分析工具,和中的统计分析工具,和SPSS统计软件中常用的分析方法。为今后的进统计软件中常用的分析方法。为今后的进一步学习打好基础,为开展教学实验、毕业实习、一步学习打好基础,为开展教学实验、毕业实习、科研提供基本技能,更为学生毕业后在用人单位科研提供基本技能,更为学生毕业后在用人单位大显身手培养良好基本素质。大显身手培养良好

3、基本素质。本课程主要讲授的内容本课程主要讲授的内容第一部分第一部分 基本医学统计方法基本医学统计方法v 基本概念与基本知识基本概念与基本知识v 总体参数的区间估计总体参数的区间估计v 假设检验的基本方法假设检验的基本方法第二部分第二部分 统计分析工具的应用统计分析工具的应用v EXCELEXCEL中的数据分析工具中的数据分析工具v SPSSSPSS统计软件的应用统计软件的应用实验教学的内容实验教学的内容实验实验1 1:EXCEL中的中的T检验检验(均数比较均数比较)实验实验2 2:EXCEL中的方差分析中的方差分析实验实验3 3:EXCEL中计数资料分析的计算中计数资料分析的计算实验实验4 4

4、:EXCEL中秩和检验的计算中秩和检验的计算实验实验5 5:EXCEL中的回归分析中的回归分析一、一、EXCELEXCEL中的数据分析工具中的数据分析工具实验实验1 1:Descriptive Statistics(描述统计描述统计)实验实验2 2:Compare Means(均数比较均数比较)实验实验3 3:General Linear Model(方差分析方差分析)实验实验4 4:Crosstabs(列联表的独立性检验列联表的独立性检验)实验实验5 5:Nonparametric Tests(非参数检验非参数检验)实验实验6 6:Regression(回归分析回归分析)二、二、SPSSSP

5、SS统计软件中的分析工具统计软件中的分析工具教学内容目录教学内容目录第第1 1章章 基本概念与基本知识基本概念与基本知识第第2 2章章 计量资料的分析方法与计算计量资料的分析方法与计算第第3 3章章 分类资料的分析方法与计算分类资料的分析方法与计算第第4 4章章 秩和检验的分析方法与计算秩和检验的分析方法与计算第第5 5章章 回归分析方法与计算回归分析方法与计算第第6 6章章 医学统计方法的应用医学统计方法的应用第第1 1章章 基本概念与基本知识基本概念与基本知识1.1 1.1 事件及事件的概率事件及事件的概率1.2 1.2 总体与样本总体与样本1.3 1.3 总体参数的估计总体参数的估计1.

6、1 1.1 事件及其事件的概率事件及其事件的概率l 事件的基本概念与运算事件的基本概念与运算 l 概率与统计概率定义概率与统计概率定义l 互斥事件与对立事件的概率互斥事件与对立事件的概率本节的重点本节的重点1.1-11.1-1 事件的概念与运算事件的概念与运算 一、一、随机实验随机实验(2)(2)随机实验的特征:随机实验的特征:在相同条件下,实验可重复进行;在相同条件下,实验可重复进行;至少有两种不同的结果,且各种结至少有两种不同的结果,且各种结果是预先可以明确的;果是预先可以明确的;每次实验至少有一个结果出现,且每次实验至少有一个结果出现,且出现哪个结果带有偶然出现哪个结果带有偶然(随机随机

7、)性。性。1.1.统计学研究的对象:统计学研究的对象:随机现象随机现象2.2.随机实验及其特征随机实验及其特征 (1)(1)随机实验:随机实验:对随机现象的观察对随机现象的观察。参看前例参看前例例如例如1.1.在平面上投掷一个硬币,观察其在平面上投掷一个硬币,观察其出现的结果(正面、反面)。出现的结果(正面、反面)。2.2.用某药治疗某病患者,观察其治用某药治疗某病患者,观察其治疗的结果疗的结果(无效、有效、痊愈无效、有效、痊愈)。3.3.袋中有袋中有5 5个球,从中抽出个球,从中抽出1 1球。在球。在不同条件下,观察抽到红球、白球不同条件下,观察抽到红球、白球的结果。的结果。2 2个白球和个

8、白球和3 3个红球个红球 ;5 5个球都是红球个球都是红球 ;返回 5 5个球都是白球个球都是白球 。在一定条件下,一次实验中:在一定条件下,一次实验中:1.1.随机事件:可能出现、可能不出现的随机事件:可能出现、可能不出现的结果,用大写的结果,用大写的A A、B B等表示。等表示。2.2.必然事件:一定出现的结果,记为必然事件:一定出现的结果,记为 (读音:读音:omegaomegaoumigaoumiga)。3.3.不可能事件:一定不出现的结果,记不可能事件:一定不出现的结果,记为为(读音:读音:omicronoumaikranomicronoumaikran)。二、二、事件的概念事件的概

9、念1.1-11.1-1 事件的概念与运算事件的概念与运算 三、三、事件的并与交运算事件的并与交运算(1)(1)两个事件两个事件 A A 与与 B B 的并事件的并事件(记为记为 A+B)A+B):A+BA+B =A=A与与B B中中至少至少有一个发生有一个发生 1.1.事件的并运算事件的并运算(并事件并事件):=A A1 1、A A2 2、A An n中中至少至少有一个发生有一个发生(2)n(2)n个事件个事件 A A1 1、A A2 2、A An n 的并事件的并事件 :注:希腊字母注:希腊字母 (读音读音sigmasigma)的数学含义的数学含义 =A1 +A2 +An (n n个事件的并

10、事件)个事件的并事件)=12 +31 +28 (n n个数的和)个数的和)(1)(1)两个事件两个事件 A A 与与 B B 的交事件的交事件(记为记为 A A B)B)A A B B =A A 与与 B B 同时同时发生发生 2.2.事件的交运算事件的交运算(交事件交事件):=A A1 1、A A2 2、A An n同时同时发生发生 注:希腊字母注:希腊字母 (读音读音 pi pai)pi pai)的数学含义的数学含义 =A1 A2 An (n n个事件的交事件)个事件的交事件)=23 35 42=23 35 42(n n个数的乘积)个数的乘积)(2)n(2)n个事件个事件 A A1 1、A

11、 A2 2、A An n 的交事件的交事件 :例题例题 四个秀才同时进京考进士四个秀才同时进京考进士1.1.可能出现的结果可能出现的结果:A A0 0=四人一个都不中四人一个都不中 A A1 1=只有一个考中只有一个考中 A A2 2=只有一半考中只有一半考中 A A3 3=只有一个考不中只有一个考不中 A A4 4=四人一起考中四人一起考中 2.2.事件满足的关系事件满足的关系:a)a)任意两个事件不可能任意两个事件不可能同时发生;同时发生;b)b)在一次观察中,五个在一次观察中,五个事件至少有一个事件事件至少有一个事件一定会发生。即一定会发生。即A A0 0+A+A1 1+A+A2 2+A

12、+A3 3+A+A4 4+A+A5 5 一定会发生。一定会发生。四、互斥事件及对立事件四、互斥事件及对立事件2.2.若事件若事件 A A、B B 满足下面两个条件:满足下面两个条件:1.1.事件的互斥事件的互斥(互不相容互不相容)性性(1)(1)若两事件若两事件 A A 和和 B B 满足满足:A A B=B=称事件称事件 A A 与与 B B 为互斥事件为互斥事件(或互不相容事件或互不相容事件)。(2)(2)多个事件的两两互斥性:多个事件的两两互斥性:若若 A A1 1、A A2 2、A An n 中任意两事件中任意两事件 A Ai i、A Aj j 满足满足A Ai i A Aj j=(i

13、 i j j)称称 A A1 1、A A2 2、A An n满足两两互斥性。满足两两互斥性。(1)(1)A A B B =(2)(2)A A +B B =称称 A A 与与 B B 为对立事件,记为对立事件,记 A A 的对立事件为的对立事件为 。例例1-1 1-1 对甲、乙、丙三人进行某项检对甲、乙、丙三人进行某项检查,令查,令A=A=甲正常甲正常 、B=B=乙正常乙正常、C=C=丙正常丙正常。2.2.判断事件判断事件与事件与事件是否为对立事件。是否为对立事件。1.1.用用 A A、B B、C C 表示下列各个事件:表示下列各个事件:只有甲正常;只有甲正常;只有甲乙正常;只有甲乙正常;三人都

14、正常;三人都正常;至少两人不正常;至少两人不正常;至多一人正常;至多一人正常;至少一人不正常。至少一人不正常。只有甲正常只有甲正常=因为因为所以所以事件事件与事件与事件为对立事件。为对立事件。只有甲乙正常只有甲乙正常=三人都正常三人都正常=至少二人不正常至少二人不正常=至多一人正常至多一人正常=至少一人不正常至少一人不正常=2.2.判断事件判断事件与事件与事件是否为对立事件是否为对立事件解解 1.1.用用 A A、B B、C C 表示下列各个事件表示下列各个事件 至少甲乙不正常至少甲乙不正常 或或 至少甲丙不正常至少甲丙不正常 或或 至少乙丙不正常至少乙丙不正常 三人不正常三人不正常 或或 只

15、有甲正常只有甲正常 或或 只有乙正常只有乙正常 或或 只有丙正常只有丙正常 至少甲不正常至少甲不正常 或或 至少乙不正常至少乙不正常 或或 至少丙不正常至少丙不正常 1.1-2 1.1-2 概率的定义与运算概率的定义与运算一、概率与频率一、概率与频率1.1.概率:概率:一次实验中,描述随机事件发生可能一次实验中,描述随机事件发生可能性大小的数量性大小的数量(用用 P(A)P(A)表示事件表示事件 A A 的概率的概率)。2.2.频率:频率:在在 n n 次相同的实验中,事件次相同的实验中,事件 A A 出现的出现的次数次数 m mA A与实验次数与实验次数 n n 的比值的比值 m mA A/

16、n/n。(1)(1)其中事件其中事件 A A 出现的次数出现的次数 m mA A,叫,叫频数频数;(2)(2)频率频率 m mA A/n/n记为记为 ,即,即 。试验者试验者抛币次数抛币次数n n正面向上正面向上 次次 数数 频率频率 De Morgan208410610.5181Bufen404020480.5069费费 勒勒1000049790.4979Pearson24000120120.5005罗曼诺夫斯基罗曼诺夫斯基80640396990.4923钱钱掷掷抛抛币币 实实 验验例如例如 用某药治疗某疾病用某药治疗某疾病400400例,有例,有260260例痊愈。例痊愈。则该药的痊愈率则

17、该药的痊愈率 。1.1.定义定义 在在 n n 次相同的试验中,随着次相同的试验中,随着 n n 的增大,的增大,事件事件 A A 的频率的频率 则称此常数则称此常数 a a 为事件为事件 A A 的概率,即的概率,即 。二、统计定义及其应用二、统计定义及其应用稳定在某个常数稳定在某个常数 a a 附近摆动。附近摆动。2.2.统计定义的应用:统计定义的应用:当实验次数当实验次数 n n 足够大时足够大时,3.3.概率的基本性质概率的基本性质(1)(1)(2)P(2)P()=1 1,P(P()=0 0。三、并事件的概率三、并事件的概率(加法定理加法定理)1.1.互斥事件的加法定理互斥事件的加法定

18、理(1)(1)若事件若事件A A、B B互斥互斥(即即 ABAB =),),则则P(A+B)=P(A)P(A+B)=P(A)+P(B)+P(B)。(2)(2)若若n n个事件个事件A A1 1、A A2 2、A An n两两互斥,则两两互斥,则2.2.对立事件的概率:对立事件的概率:(对立事件满足对立事件满足 )(多个事件的并事件多个事件的并事件 )例例1-21-2 同时投掷两颗色子,事件同时投掷两颗色子,事件A Ai i=掷出掷出i i点点。已知已知解解 P(B)=P(AP(B)=P(A2 2+A+A3 3)=P(A)=P(A2 2)+P(A)+P(A3 3)=1/36+2/36=1/12)

19、=1/36+2/36=1/12因为因为 B B、D D 满足满足 B B D D =,B B +D D =,为对立事件。为对立事件。P(D)=1P(D)=1P(B)=1P(B)=11/12=11/121/12=11/12事件事件B=B=掷出小于掷出小于4 4的点的点、事件、事件C=C=掷出大于掷出大于9 9的点的点,事件事件D=D=掷出大于掷出大于3 3的点的点,求,求P(B)P(B)、P(C)P(C)、P(D)P(D)。P(C)=P(AP(C)=P(A1010+A+A1111+A+A1212)=P(A)=P(A1010)+P(A)+P(A1111)+P(A)+P(A1212)=3/36+2/

20、36+1/36=1/6=3/36+2/36+1/36=1/61.1.事件的独立性事件的独立性(1)(1)定义定义 若事件若事件 A A 的发生与否对事件的发生与否对事件 B B 不产生不产生任何影响,称事件任何影响,称事件 A A 与事件与事件 B B 独立独立。(2)(2)若事件若事件 A A 与与 B B 独立,下面各事件间也独立:独立,下面各事件间也独立:四、四、事件的独立性及其应用事件的独立性及其应用 2.2.事件事件 A A 与与 B B 独立的充分必要条件独立的充分必要条件P(B|A)P(B|A)=P(B)P(B)。(1)(1)P(B|A)P(B|A)=P(=P(在在 A A 发生

21、的条件下发生的条件下 B B 发生发生),称称 P(B|A)P(B|A)为事件为事件 B B 的条件概率;的条件概率;(2)(2)相对地称相对地称 P(B)P(B)为为 无条件概率无条件概率。例例1-3 1-3 为研究某方剂对风热外感证的疗效,为研究某方剂对风热外感证的疗效,随机选取随机选取400400名患者,有的服药、有的不服名患者,有的服药、有的不服药,一段时间后得治疗结果如表,试判断此药,一段时间后得治疗结果如表,试判断此方剂对风热外感证是否有效。方剂对风热外感证是否有效。治疗结果治疗结果(A)(A)治疗方法(治疗方法(B B)合合 计计B B1 1(服药)服药)B B2 2(不服药不服

22、药)A A1 1(有效)(有效)127127190190317317A A2 2(无效)(无效)333350508383合合 计计160160240240400400解解 无条件概率无条件概率 P(AP(A1 1)=317/400317/400 79.3%79.3%条件概率条件概率 P(AP(A1 1|B|B1 1)=)=127/160127/160 79.4%79.4%因为因为 P(AP(A1 1)79.3%79.3%P(AP(A1 1|B|B1 1)79.4%79.4%,治疗结果与治疗方法治疗结果与治疗方法独立独立,此方剂无效。,此方剂无效。1.1.对甲、乙、丙三人同时进行对甲、乙、丙三人

23、同时进行 X X 光检查,令光检查,令A=A=甲正常甲正常、B=B=乙正常乙正常、C=C=丙正常丙正常。用用A A、B B、C C表示下列各个事件:表示下列各个事件:只有甲不正常;只有甲不正常;只有一人正常;只有一人正常;只有两人正常;只有两人正常;至少一人不正常。至少一人不正常。课堂练习课堂练习1 1 2023年5月16日2.2.经调查经调查950950个非聋耳人中有个非聋耳人中有7676人色盲,人色盲,5050个聋耳人中有个聋耳人中有4 4人色盲。试分析,聋耳与色人色盲。试分析,聋耳与色盲是否有关。盲是否有关。课堂练习课堂练习1 1答案答案1.1.;。2.2.令令 A A =聋耳聋耳、B

24、B =色盲色盲 。色盲的条件概率色盲的条件概率 P(B|A)P(B|A)=4/504/50 =8 8%色盲的无条件概率色盲的无条件概率 P(B)P(B)=(76+4)/(950+50)(76+4)/(950+50)=8 8%因因 P(B|A)P(B|A)=P(B),P(B),所以色盲与聋耳无关。所以色盲与聋耳无关。1.21.2 总体与样本总体与样本1.2-1 1.2-1 总体的分布与数字特征总体的分布与数字特征l 概率函数、概率密度函数和分布函数概率函数、概率密度函数和分布函数l 总体均数、总体方差及标准差总体均数、总体方差及标准差1.2-2 1.2-2 样本与样本的描述统计量样本与样本的描述

25、统计量l 简单随机样本简单随机样本样本样本l 样本均数、样本方差及标准差样本均数、样本方差及标准差1.2-3 1.2-3 几个重要的几个重要的(抽样抽样)概率分布概率分布一、一、总体与个体总体与个体 1 1.随机变量及其分类随机变量及其分类(1)(1)随机变量随机变量:用一个变量的不同取值表示随机用一个变量的不同取值表示随机实验中可能出现的各个基本事件得到的变量,实验中可能出现的各个基本事件得到的变量,通常用大写的英文字母通常用大写的英文字母 X X、Y Y、Z Z 等表示。等表示。(2)(2)随机变量的分类:随机变量的分类:1)1)离散型随机变量:变量取值为离散型随机变量:变量取值为有限多有

26、限多个或个或可可列列(取值可依次从小到大排列取值可依次从小到大排列)个的变量。个的变量。2)2)连续型随机变量:变量取值充满一个区间的连续型随机变量:变量取值充满一个区间的随机变量。随机变量。例如例如1.2-1 1.2-1 总体的分布与数字特征总体的分布与数字特征3.3.总体与个体概念总体与个体概念(1)(1)个体:满足随机实验条件的个体:满足随机实验条件的每一个对象每一个对象。(2)(2)总体:满足随机实验条件的总体:满足随机实验条件的全体对象全体对象,用,用观察指标观察指标(随机变量随机变量)X X 或或 Y Y 等表示。等表示。2.2.基本事件基本事件(满足下面两条的事件满足下面两条的事

27、件):(1)(1)每次随机实验至少有一个事件发生;每次随机实验至少有一个事件发生;(2)(2)每次随机实验只有一个事件发生。每次随机实验只有一个事件发生。例如例如 在临床中,研究某药治疗高血压病的效果。在临床中,研究某药治疗高血压病的效果。1.1.每一个高血压患者,即为研究的个体;每一个高血压患者,即为研究的个体;2.2.全体高血压患者,即为研究的总体;全体高血压患者,即为研究的总体;3.3.可用舒张压的降压值可用舒张压的降压值 X X 来表示。来表示。(2)(2)概率函数的性质:概率函数的性质:1)1)函数值在函数值在 0 0 到到 1 1 之间,即之间,即 00 p pi i 1 1;若用

28、若用X=iX=i来表示来表示 掷出掷出i i点点,则可表示成,则可表示成例如例如 同时投掷两颗色子,用同时投掷两颗色子,用 A Ai i 表示表示 掷出掷出i i点点,则,则(1)(1)定义定义 若离散型变量若离散型变量 X X 的一切可能取值为,的一切可能取值为,x x1 1,x x2 2,x xi i,x xn n 称称 p pi i=P(=P(X X =x xi i )(i=1,2,n)(i=1,2,n)。为变量为变量 X X 的的 概率函数概率函数。二、总体的概率分布二、总体的概率分布1.1.离散型变量的概率函数及性质离散型变量的概率函数及性质2)2)所有函数值的和等于所有函数值的和等

29、于 1 1,即,即 。2.2.连续型变量的概率密度函数连续型变量的概率密度函数(1)(1)概率密度函数定义及其几何意义概率密度函数定义及其几何意义1)1)定义定义 若定义在区域若定义在区域(,)上的非负上的非负函数函数f(x)f(x),对任意的区间,对任意的区间 a,a,b b 都有都有 2)2)定积分定积分 的几何意义:的几何意义:为曲线为曲线y=f(x)y=f(x)在区间在区间 a,a,b b 上上,与与 x x 轴所夹曲边梯形的面积。轴所夹曲边梯形的面积。称变量称变量 X X 为连续型随机变量为连续型随机变量;称函数称函数f(xf(x)为为 X X 的的概率密度函数概率密度函数。其中其中

30、 是函数曲线在是函数曲线在aa,bb上与上与 x x 轴围成的面积。轴围成的面积。(2)(2)连续型随机变量的特点连续型随机变量的特点1)1)在任意点在任意点 x x 处的概率值为处的概率值为 0 0,即,即 P(XP(X =x)x)=0 0;2)P(2)P(a a X X b b )=P(P(a a X X b b )。P(P(x x X X x x )=0 0;(3)(3)概率密度函数概率密度函数f(x)f(x)的性质的性质1)1)非负性:非负性:f(x)0f(x)0;2)2)曲线曲线y=f(x)y=f(x)与与 x x 轴所夹轴所夹 平面图形的面积值恒为平面图形的面积值恒为 1 1。即广

31、义积分即广义积分 。(1)(1)分布函数的定义分布函数的定义定义定义 对任意实数对任意实数 x x (,),令,令F(x)F(x)=P P (X X x x )称称 F(x)F(x)为变量为变量 X X 的的 分布函数分布函数。(注:(注:XX xx 表示事件表示事件XX取值不超过取值不超过xx)(2)(2)分布函数的性质:分布函数的性质:1)0 1)0 F(x)1 F(x)1;2)F(2)F()=0)=0、F(F()=1)=1;3)3)若若 a a b b,则,则 P(aP(a X X b)=b)=F(b)F(b)F(a)F(a)。3.3.随机变量的分布函数随机变量的分布函数P(XP(X2)

32、+P(X=3)=2)+P(X=3)=1 1 +0 0 =1 1 P(X=0)+P(X=1)+P(X=2)=P(X=0)+P(X=1)+P(X=2)=1 1例例1-41-4 用用 X X 的取值的取值 0 0、1 1、2 2分别表示某药治疗某分别表示某药治疗某疾病的疾病的“无效无效”、“有效有效”和和“痊愈痊愈”。已知。已知解解F(0)=P(XF(0)=P(X0)=P(X=0)=0.30)=P(X=0)=0.3F(1)=P(XF(1)=P(X1)=1)=F(2)=P(XF(2)=P(X2)=2)=F(3)=P(XF(3)=P(X3)=3)=P(0XP(0X3)3)=F(3)-F(0)=F(3)-

33、F(0)=1-1-0.30.3 =0.70.7P(X=0)+P(X=1)=P(X=0)+P(X=1)=0.80.8P(X=0+X=1)P(X=0+X=1)P(X=0+X=1+X=2)P(X=0+X=1+X=2)P(XP(X2+X=3)2+X=3)求求 F(0)F(0)、F(1)F(1)、F(2)F(2)、F(3)F(3)、P(0XP(0X3)3)。变量变量 x x i i0 01 12 2概率概率 p p i i0.30.30.50.50.20.2(1)(1)总体均数总体均数:全部个体数值指标的平均:全部个体数值指标的平均值,是以总体分布有关的值,是以总体分布有关的 常数值常数值;三、总体的数

34、字特征三、总体的数字特征1.1.统计学中几个重要的数字特征统计学中几个重要的数字特征2.2.总体均数、总体方差的意义总体均数、总体方差的意义(1)(1)均数描述变量均数描述变量 X X 取值的平均水平;取值的平均水平;(2)(2)方差描述变量方差描述变量 X X 取值的差异取值的差异(变异性变异性)。(2)(2)总体方差总体方差2 2:全部个体数值指标与:全部个体数值指标与的的差的平方和的平均值,是确定的差的平方和的平均值,是确定的 常数值常数值;(3)(3)总体标准差总体标准差:总体方差的算术平方根。:总体方差的算术平方根。(4)(4)总体率总体率p p:观察结果事件:观察结果事件A A的概

35、率的概率P(A)P(A)。一、简单随机样本一、简单随机样本(简称简称 样本样本)2.2.统计学中对样本的要求:统计学中对样本的要求:(1)(1)随机抽样随机抽样随机性;随机性;(2)(2)样本中个体间相互独立样本中个体间相互独立独立性。独立性。1.1.定义定义 称从总体称从总体 X X 中抽取的部份个体中抽取的部份个体X X1 1,X X2 2,X Xi i,X Xn n 为样本为样本(用观察指标用观察指标 X Xi i 来表示来表示)。(1)(1)样本容量:样本中所含个体的样本容量:样本中所含个体的个数个数 n n。(2)(2)样本值:样本中个体的样本值:样本中个体的具体数值指标值具体数值指

36、标值:1.2-2 1.2-2 样本与样本的描述统计量样本与样本的描述统计量2.2.分类分类(或或计数计数)资料:资料:按观察结果的不同分类计数按观察结果的不同分类计数(个体的个数个体的个数)所所得到的数据资料。得到的数据资料。(1)(1)两分类资料:只有两个分类结果的资料。两分类资料:只有两个分类结果的资料。(2)(2)多分类资料:多于两个分类结果的资料。多分类资料:多于两个分类结果的资料。1)1)等级资料:分类结果有顺序、等级;等级资料:分类结果有顺序、等级;2)2)非等级资料:分类非等级资料:分类结果结果无顺序、等级。无顺序、等级。1.1.计量计量(或定量或定量)资料:资料:用定量的方法测

37、得每个个体的数值指标值,用定量的方法测得每个个体的数值指标值,所得的数据资料。所得的数据资料。例如例如二、样本资料的分类二、样本资料的分类三、三、重要的样本特征统计量重要的样本特征统计量1.1.统计量的概念和特点统计量的概念和特点读音i:ta(2)(2)统计量的特点:统计量的特点:1)1)统计量是由样本构成的随机变量;统计量是由样本构成的随机变量;2)2)样本值确定后,统计量有确定的值。样本值确定后,统计量有确定的值。不含任何未知参数,称不含任何未知参数,称 为统计量。为统计量。(1)(1)定义定义 若由样本若由样本 X X1 1,X,X2 2,X,Xn n 构成的变量构成的变量 ,设设 X

38、X1 1,X,X2 2,X,Xn n 是容量为是容量为 n n 的一个样本的一个样本(1)(1)称统计量称统计量 为样本均数。为样本均数。2.2.计量资料重要特征的统计量计量资料重要特征的统计量(2)(2)记记 、,称,称 SSSS为离均差平方和,简称离差平方和;为离均差平方和,简称离差平方和;S S2 2 为样本方差;为样本方差;S S 为样本标准差,为样本标准差,。3.3.两分类计数资料特征的重要统计量两分类计数资料特征的重要统计量 在在 n n 次相同的实验中,次相同的实验中,X X 为事件为事件A A出现的次数。出现的次数。(1)(1)样本率样本率(事件事件A A的频率的频率):。4.

39、4.样本均数、样本率的抽样误差样本均数、样本率的抽样误差 (1)(1)样本均数的标准误样本均数的标准误 :。(2)(2)样本率的标准误样本率的标准误 :。5.5.样本均数、样本方差的意义样本均数、样本方差的意义(1)(1)样本均数:又叫算术均数,描述样本中个体指样本均数:又叫算术均数,描述样本中个体指标值的平均水平和取值的集中趋势;标值的平均水平和取值的集中趋势;(2)(2)离差平方和离差平方和 SSSS、方差、方差 S S2 2 和标准差和标准差 S S:描述样本描述样本中个体指标值的偏差程度中个体指标值的偏差程度(变异性变异性)。2.2.伯努利定理伯努利定理 在在 n n 次相同的伯努利试

40、验中,次相同的伯努利试验中,用变量用变量 X X 事表示件事表示件 A A 出现的次数,则变量出现的次数,则变量 X X 服服从参数为从参数为 n n 和和 p p 的二项分布的二项分布 B(B(n,n,p p )。即。即称称 X X 服从参数服从参数 n n,p p(00 p p 1 30%30%,判断验方是有效的。,判断验方是有效的。若确实无效,则若确实无效,则判断错误的判断错误的(显著性显著性)概率概率 P P :P P =P(X15)=P(X15)=1P(XP(X14)14)=0.016940.01694由于判断错误的概率很小,可认为判断正确。由于判断错误的概率很小,可认为判断正确。“

41、=BINOMDIST(14,30,0.3,1)”0.98306=BINOMDIST(14,30,0.3,1)”0.98306 曲线曲线y=y=f(xf(x)关于直线关于直线 x=x=对称,且对称,且f()最大。最大。的值越大,曲线的形状越矮胖。的值越大,曲线的形状越矮胖。(1)(1)正态分布:若变量正态分布:若变量 X X 的概率密度函数为的概率密度函数为 称变量称变量 X X 服从参数为服从参数为和和(0)(0)的正态分的正态分布,记为布,记为 X XN(N(,2 2 )。1.1.正态分布及其密度函数的几何特点正态分布及其密度函数的几何特点曲线曲线y=y=f(xf(x)关于直线关于直线 x=

42、x=对称,且对称,且f()最大;最大;的值越大,曲线的形状越矮胖。的值越大,曲线的形状越矮胖。二、正态分布二、正态分布N(,N(,2 2)(2)(2)密度函数密度函数f(x)f(x)的几何特点的几何特点2.2.正态总体的均数和方差正态总体的均数和方差若总体若总体 X X 服从正态分布服从正态分布 ,则,则(1)(1)总体的均数就是参数总体的均数就是参数 ;(2)(2)总体的标准差就是参数总体的标准差就是参数 。?0.025例例1-61-6 随机变量随机变量 X XN(,N(,2 2),已知,已知 P(P(X X +1.96)=+1.96)=0.0250.025 (1)(1)求求 F(F(1.9

43、61.96)和和 F(F(+1.961.96);(2)(2)求求 P(|XP(|X|1.96)|1.96)。解解 (1)(1)(2 2)95%0.0253.3.标准正态分布标准正态分布N(0,1)(2)(2)概率密度函数:概率密度函数:;密度函数特点密度函数特点:;(3)(3)分布函数分布函数:。(1)(1)变量记为变量记为 u(u(或或z)z),即,即u uN(0N(0,1)1)。1.1.卡方分布卡方分布(3)(3)密度函数的几何特点密度函数的几何特点 1)1)偏态的峰状曲线;偏态的峰状曲线;2)2)在在n-2n-2处取得最大值。处取得最大值。定义定义 设设 n n 个相互独立变量个相互独立

44、变量 X X1 1、X X2 2、X Xn n ,均服从标准正态分布均服从标准正态分布 N(0,1)N(0,1)。(1)(1)称变量称变量2 2服从自由度为服从自由度为 n n 的卡方分布,的卡方分布,(2)(2)自由度自由度 n n ,用,用 df(df(或或f)f)表示。表示。三、其它几个重要的抽样分布三、其它几个重要的抽样分布记为记为2.t2.t 分布的定义和几何特点分布的定义和几何特点(2)t(2)t分布密度函数的几何特点分布密度函数的几何特点:1)1)关于纵轴对称的峰状曲线;关于纵轴对称的峰状曲线;2)2)当当n n时,时,f(t)f(t)(t)(t)。(3)(3)函数函数f(t)f

45、(t)为偶函数,即为偶函数,即f(-t)f(-t)=f(t)f(t)。(1)t(1)t 分布分布(又叫学生分布又叫学生分布)设两独立的变量设两独立的变量 U UN N(0,1)(0,1)、V V2 2(n)(n)。1)1)称变量称变量 t t 的分布为的分布为 t t 分布,记为分布,记为 t tt(n)t(n)。2)2)其中参数其中参数 n n 为自由度,用为自由度,用 dfdf 表示。表示。3.F3.F分布的定义和几何特点分布的定义和几何特点(2)(2)密度函数的几何特点密度函数的几何特点 1)1)偏态的峰状曲线;偏态的峰状曲线;2)2)在在x=1x=1附近取得最大值。附近取得最大值。(1

46、)F(1)F方分布的方分布的定义定义 设两个相互独立的变量设两个相互独立的变量 ,。1)1)称变量称变量 F F 的分布为的分布为 F F分布,记为分布,记为F FF(nF(n1 1,n,n2 2)。2)2)其中参数其中参数 n n1 1、n n2 2为第一、第二自由度。为第一、第二自由度。(3)(3)性质:性质:1/F1/FF(nF(n2 2,n,n1 1)。语法语法 FDIST(xFDIST(x ,df1,df1,df2)df2);应用:计算应用:计算概率概率 P(P(X X x)x)。四、四、ExcelExcel中常用的概率分布函数中常用的概率分布函数1.1.标准正态分布的分布函数标准正

47、态分布的分布函数2.2.卡方分布的分布函数卡方分布的分布函数语法语法 NORMSDIST(NORMSDIST(x x );应用:应用:“=NORMSDIST(“=NORMSDIST(x x )”)”,计算,计算概率概率 P(P(X X x)x)。3.3.t t 分布的分布函数分布的分布函数4.4.F F分布的分布函数分布的分布函数Excel语法语法 CHIDIST(xCHIDIST(x ,df),df);应用:计算;应用:计算概率概率 P(P(X X x)x)。语法语法 TDIST(xTDIST(x ,df,tails),df,tails);应用:计算应用:计算概率概率 P(P(X X x)x

48、)、P(|X|P(|X|x)x)。tails=1(tails=1(单单)、2(2(双双)变量取值变量取值deg_freedom deg_freedom 自由度自由度变量取值变量取值df1df1、df2df2 第第1 1、2 2自由度自由度课堂练习课堂练习2 2 20232023年年5 5月月1616日日 已知用某民间验方治疗某疾病的痊愈率已知用某民间验方治疗某疾病的痊愈率p p=0.3=0.3,用,用 X X 表示治疗表示治疗 2020 人中的痊愈人数。人中的痊愈人数。1.1.求变量求变量 X X 的概率函数的概率函数 P(P(X X =k k);2.2.求下列各事件的概率:求下列各事件的概率

49、:有两人痊愈的概率有两人痊愈的概率 P(X=2)P(X=2);不少于不少于6 6人痊愈的概率人痊愈的概率 P(X6)P(X6);不多于不多于3 3人痊愈的概率人痊愈的概率 P(X3)P(X3)。提示提示:伯努利定理、二项分布的概率函数。:伯努利定理、二项分布的概率函数。1.3 1.3 总体参数的区间估计总体参数的区间估计l 总体均数、方差的好估计量总体均数、方差的好估计量 l 总体率的好估计量总体率的好估计量l 正态总体均数的区间估计正态总体均数的区间估计本节的重点本节的重点l 总体率的区间估计总体率的区间估计(1)(1)无偏性:无偏性:与与 无系统无系统(本质上的本质上的)偏差;偏差;一、总

50、体参数的点估计一、总体参数的点估计1.1.定义定义:设设 是总体的未知参数,用样本是总体的未知参数,用样本 X X1 1、X X2 2、X Xn n 构成的统计量构成的统计量 来描述总体参数来描述总体参数 ,(1)(1)称称 为总体参数为总体参数 的点估计量;的点估计量;(2)(2)称估计量的值为估计值,仍记称估计量的值为估计值,仍记 。2.2.点估计量的评价标准点估计量的评价标准(2)(2)有效性:无偏估计量中偏差最小的估计量。有效性:无偏估计量中偏差最小的估计量。3.3.总体均数、方差和总体率的好估计量总体均数、方差和总体率的好估计量(1)(1),(2)(2),(3)(3)。(2)(2)双

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com