2019版高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案 新人教A版选修2-3.doc

上传人:随风 文档编号:709612 上传时间:2019-06-06 格式:DOC 页数:17 大小:698.60KB
返回 下载 相关 举报
2019版高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案 新人教A版选修2-3.doc_第1页
第1页 / 共17页
2019版高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案 新人教A版选修2-3.doc_第2页
第2页 / 共17页
点击查看更多>>
资源描述

《2019版高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案 新人教A版选修2-3.doc》由会员分享,可在线阅读,更多相关《2019版高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案 新人教A版选修2-3.doc(17页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、13.23.2 独立性检验的基本思想及其初步应用独立性检验的基本思想及其初步应用学习目标 1.了解分类变量的意义.2.了解 22 列联表的意义.3.了解随机变量K2的意义.4.通过对典型案例分析,了解独立性检验的基本思想和方法知识点一 分类变量及 22 列联表思考 山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:体育文娱合计男生210230440女生60290350合计270520790如何判定“喜欢体育还是文娱与性别是否有联系”?答案 可通过表格与图形进行直观分析,也可通过统计分析定量判断梳理 (1)分类变量变量的不同“值”表示个体所属

2、的不同类别,像这样的变量称为分类变量(2)列联表定义:列出的两个分类变量的频数表,称为列联表22 列联表一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(也称为 22 列联表)为下表.y1y2总计x1ababx2cdcd总计acbdabcd知识点二 等高条形图1与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征22如果通过直接计算或等高条形图发现和相差很大,就判断两个分类变量之间有a abc cd关系知识点三 独立性检验1定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验2K2,其中n

3、abcd为样本容量nadbc2abcdacbd3独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定临界值k0.(2)利用公式计算随机变量K2的观测值k.(3)如果kk0,就推断“X与Y有关系” ,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系” ,或者在样本数据中没有发现足够证据支持结论“X与Y有关系” 1列联表中的数据是两个分类变量的频数( )2事件A与B的独立性检验无关,即两个事件互不影响( )3K2的大小是判断事件A与B是否相关的统计量( )类型一 等高条形图的应用例 1 为了解铅中毒病

4、人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?考点 定性分析的两类方法题点 利用图形定性分析解 等高条形图如图所示:3其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系反思与感悟 在等高条形图中,可以估计满足条件Xx1的个体中具有Yy1的个体所占的

5、比例,也可以估计满足条件Xx2的个体中具有Yy1的个体所占的比例.两个比例a abc cd的值相差越大,X与Y有关系成立的可能性就越大跟踪训练 1 网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了 1 000 人调查,发现其中经常上网的有 200 人,这 200 人中有 80 人期末考试不及格,而另外 800 人中有 120 人不及格利用图形判断学生经常上网与学习成绩有关吗?考点 定性分析的两类方法题点 利用图形定性分析解 根据题目所给的数据得到如下 22 列联表:经常上网不经常上网总计不及格80120200及格12068

6、0800总计2008001 000得出等高条形图如图所示:比较图中阴影部分的高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为经常上网与学习成绩有关类型二 独立性检验例 2 某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:4喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100根据表中数据,问是否在犯错误的概率不超过 0.05 的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异” 考点 独立性检验及其基本思想题点 独立性检验的方法解 将 22 列联表中的数据代入公式计算,得K2的观测值knadb

7、c2abcdacbd100 60 1020 10270 30 80 204.762.100 21因为 4.7623.841,所以在犯错误的概率不超过 0.05 的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异” 反思与感悟 (1)独立性检验的关注点在 22 列联表中,如果两个分类变量没有关系,则应满足adbc0,因此|adbc|越小,关系越弱;|adbc|越大,关系越强(2)独立性检验的具体做法根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界,然后查表确定临界值k0.利用公式K2计算随机变量K2的观测值k.nadbc2abcdacbd如果kk0,推断“X与Y

8、有关系”这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系” ,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系” 跟踪训练 2 某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了 50 人,其中有老教师 20 人,青年教师 30 人老教师对新课程教学模式赞同的有 10 人,不赞同的有 10 人;青年教师对新课程教学模式赞同的有 24 人,不赞同的有 6 人(1)根据以上数据建立一个 22 列联表;(2)判断是否有 99%的把握说明对新课程教学模式

9、的赞同情况与教师年龄有关系5考点 独立性检验及其基本思想题点 独立性检验的方法解 (1)22 列联表如下所示:赞同不赞同总计老教师101020青年教师24630总计341650(2)假设“对新课程教学模式的赞同情况与教师年龄无关” 由公式得K24.9636.635,故有 99%的把握认为箱产量与养殖方法有关7反思与感悟 两个分类变量相关关系的判断(1)等高条形图法:在等高条形图中,可以估计满足条件Xx1的个体中具有Yy1的个体所占的比例,也可以估计满足条件Xx2的个体中具有Yy1的个体所占的比例.两个a abc cd比例的值相差越大,X与Y有关系成立的可能性就越大(2)观测值法:通过 22 列

10、联表,先计算K2的观测值k,然后借助k的含义判断“两个分类变量有关系”这一结论成立的可信程度跟踪训练 3 为了解某班学生喜爱打篮球是否与性别有关,对本班 48 人进行了问卷调查得到了如下的 22 列联表:喜爱打篮球不喜爱打篮球合计男生6女生10合计48已知在全班 48 人中随机抽取 1 人,抽到喜爱打篮球的学生的概率为 .2 3(1)请将上面的 22 列联表补充完整(不用写计算过程);(2)能否在犯错误的概率不超过 0.05 的前提下认为喜爱打篮球与性别有关?说明你的理由;(3)现从女生中抽取 2 人进一步调查,设其中喜爱打篮球的女生人数为X,求X的分布列与均值考点 独立性检验思想的应用题点

11、分类变量与统计、概率的综合性问题解 (1)列联表补充如下:喜爱打篮球不喜爱打篮球合计男生22628女生101020合计321648(2)由K24.286.48 22060228 20 32 16因为 4.2863.841,所以,能在犯错误的概率不超过 0.05 的前提下认为喜爱打篮球与性别有关(3)喜爱打篮球的女生人数X的可能取值为 0,1,2.其概率分别为8P(X0),C 2 10 C 2 209 38P(X1),C 1 10C 1 10 C 2 2010 19P(X2),C 2 10 C 2 209 38故X的分布列为X012P9 3810 199 38X的均值为E(X)01.10 199

12、 191某机构调查中学生的近视情况,了解到某校 150 名男生中有 80 名近视,140 名女生中有70 名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )A平均数 B方差 C回归分析 D独立性检验考点 独立性检验及其基本思想题点 独立性检验的思想答案 D2对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是( )Ak越大, “X与Y有关系”的可信程度越小Bk越小, “X与Y有关系”的可信程度越小Ck越接近于 0, “X与Y没有关系”的可信程度越小Dk越大, “X与Y没有关系”的可信程度越大考点 独立性检验及其基本思想题点 独立性检验的思想答案 B解析 k越大,

13、 “X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,k越小, “X与Y有关系”的可信程度越小3用等高条形图粗略估计两个分类变量是否相关,观察下列各图,其中两个分类变量关系最强的是( )9考点 定性分析的两类方法题点 利用图形定性分析答案 D解析 由等高条形图易知,D 选项两个分类变量关系最强4若在研究吸烟与患肺癌的关系中,通过收集、整理分析数据得“吸烟与患肺癌有关”的结论,并且有 99%以上的把握认为这个结论是成立的,则下列说法中正确的是( )A100 个吸烟者中至少有 99 人患有肺癌B1 个人吸烟,那么这个人有 99%的概率患有肺癌C在 100 个吸烟者中一定有患肺癌的人

14、D在 100 个吸烟者中可能一个患肺癌的人也没有考点 独立性检验及其基本思想题点 独立性检验的方法答案 D解析 独立性检验的结论是一个统计量,统计的结果只是说明事件发生的可能性的大小,具体到一个个体,则不一定发生5高中流行这样一句话“文科就怕数学不好,理科就怕英语不好” 下表是一次针对高三文科学生的调查所得的数据.总成绩好总成绩不好总计数学成绩好478a490数学成绩不好39924423总计bc913(1)计算a,b,c的值;(2)文科学生总成绩不好与数学成绩不好有关系吗?10考点 独立性检验及其基本思想题点 独立性检验的方法解 (1)由 478a490,得a12.由a24c,得c122436

15、.由bc913,得b91336877.(2)计算随机变量K2的观测值k6.2335.024,913 478 24399 122490 423 877 36因为P(K25.024)0.025,所以在犯错误的概率不超过 0.025 的前提下,认为文科学生总成绩不好与数学成绩不好有关系1列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有相关关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有相关关系2对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法先假设“两个分类变量没有关系”成立,计算随机变量K2的值,如果K2的值很大,说明假设不

16、合理K2越大,两个分类变量有关系的可能性越大一、选择题1下面是一个 22 列联表:y1y2总计x1a2173x282533总计b46106则表中a,b的值分别为( )A94,96 B52,50C52,60 D54,52考点 分类变量与列联表题点 求列联表中的数据11答案 C2为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用 22列联表进行独立性检验,经计算得K27.01,则认为“喜欢乡村音乐与性别有关系”的把握约为( )A0.1% B1% C99% D99.9%考点 独立性检验及其基本思想题点 独立性检验的方法答案 C解析 易知K27.016.635,对照临界值表知,

17、有 99%的把握认为喜欢乡村音乐与性别有关系3在独立性检验中,两个分类变量“X与Y有关系”的可信度为 99%,则随机变量K2的观测值k的取值范围是( )A3.841,5.024) B5.024,6.635)C6.635,7.879) D7.879,10.828)考点 分类变量与列联表题点 求观测值答案 C4高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:优秀及格总计甲班113445乙班83745总计197190则随机变量K2的观测值约为( )A0.600 B0.828C2.712 D6.004考点 分类变量与列联表题点 求观测值答案 A解析 根据列联表

18、中的数据,可得随机变量K2的观测值k0.600.故选 A.90 11 3734 8245 45 19 715在 22 列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么这两12个比值为( )A.与 B.与a abc cda cdc abC.与 D.与a adc bca bdc ac考点 定性分析的两类方法题点 利用图形定性分析答案 A解析 由题意,因为|adbc|的值越大,|a abc cd|acadacbcabcd| |adbcabcd|两个分类变量有关系的可能性就越大,故选 A.6有两个分类变量X,Y,其列联表如下所示,Y1Y2X1a20aX215a30a其中a,15a均为

19、大于 5 的整数,若在犯错误的概率不超过 0.05 的前提下认为X,Y有关,则a的值为( )A8 B9C8 或 9 D6 或 8考点 分类变量与列联表题点 求列联表中的数据答案 C解析 根据公式,得K2的观测值k65 a30a15a20a220 45 15 503.841,根据a5 且 15a5,13 13a60220 45 3 2aZ Z,求得当a8 或 9 时满足题意7某班主任对全班 50 名学生进行了作业量的调查,数据如下表:认为作业量大认为作业量不大合计男生18927女生81523合计26245013则推断“学生的性别与认为作业量大有关”这种推断犯错误的概率不超过( )A0.01 B0

20、.025 C0.005 D0.001考点 独立性检验及其基本思想题点 独立性检验的方法答案 B解析 由公式得K2的观测值k5.0595.024.P(K25.024)50 18 158 9226 24 27 230.025,犯错误的概率不超过 0.025.二、填空题8在吸烟与患肺病是否相关的判断中,有下面的说法:若K2的观测值k6.635,则在犯错误的概率不超过 0.01 的前提下,认为吸烟与患肺病有关系,那么在 100 个吸烟的人中必有 99 人患有肺病;从独立性检验可知在犯错误的概率不超过 0.01 的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有 99%的可能患有肺病;从独立性检验可

21、知在犯错误的概率不超过 0.05 的前提下,认为吸烟与患肺病有关系时,是指有 5%的可能性使得推断错误其中说法正确的是_考点 独立性检验及其基本思想题点 独立性检验的思想答案 解析 K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法不正确;说法中对“确定容许推断犯错误概率的上界”理解错误;说法正确9某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:专业性别 非统计专业统计专业男1310女720为了判断主修统计专业是否与性别有关系,根据表中的数据,得到K24.844,因为K23.841,所以判定主修统计专业与性别有关50 1

22、3 2010 7223 27 20 30系,那么这种判断出错的可能性最大为_14考点 独立性检验及其基本思想题点 独立性检验的方法答案 5%解析 因为K23.841,所以有 95%的把握认为主修统计专业与性别有关,出错的可能性为5%.102014 年世界杯期间,某一电视台对年龄高于 40 岁和不高于 40 岁的人是否喜欢西班牙队进行调查,对高于 40 岁的调查了 50 人,不高于 40 岁的调查了 50 人,所得数据制成如下列联表:不喜欢西班牙队喜欢西班牙队总计高于 40 岁pq50不高于 40 岁153550总计ab100若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为 ,则

23、有超过3 5_的把握认为年龄与西班牙队的被喜欢程度有关附:K2.nadbc2abcdacbdP(K2k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828考点 独立性检验及其基本思想题点 独立性检验的方法答案 95%解析 设“从所有人中任意抽取一个,取到喜欢西班牙队的人”为事件A,由已知得P(A) ,q35 1003 5 所以q25,p25,a40,b60.K24.1673.841.100 25 3525 15240 60 50 5025 6故有超过 95%的把握认为年龄与西班牙队的被喜欢程度有关三、解

24、答题11研究人员选取 170 名青年男女大学生的样本,对他们进行一种心理测验发现有 60 名女生对该心理测验中的最后一个题目的反应是:作肯定的有 22 名,否定的有 38 名;男生110 名在相同的项目上作肯定的有 22 名,否定的有 88 名问:性别与态度之间是否存在某15种关系?分别用条形图和独立性检验的方法判断考点 定性分析的两类方法题点 利用图形定性分析解 建立性别与态度的 22 列联表如下:肯定否定总计男生2288110女生223860总计44126170根据列联表中所给的数据,可求出男生中作肯定态度的频率为0.2,女生中作肯定态度22 110的频率为0.37.作等高条形图如图,其中

25、两个深色条形的高分别表示男生和女生中作肯22 60定态度的频率,比较图中深色条形的高可以发现,女生中作肯定态度的频率明显高于男生中作肯定态度的频率,因此可以认为性别与态度有关系根据列联表中的数据得到K2的观测值k5.6225.024.170 22 3822 882110 60 44 126因此,在犯错误的概率不超过 0.025 的前提下认为性别和态度有关系12某旅行社为调查市民喜欢“人文景观”景点是否与年龄有关,随机抽取了 55 名市民,得到数据如下表所示:喜欢不喜欢合计大于 40 岁2052520 岁至 40 岁102030合计302555(1)判断是否有 99.5%的把握认为喜欢“人文景观

26、”景点与年龄有关?(2)用分层抽样的方法从喜欢“人文景观”景点的市民中随机抽取 6 人作进一步调查,将这6 名市民作为一个样本,从中任选 2 人,求恰有 1 位大于 40 岁的市民和 1 位 20 岁至 40 岁的市民的概率考点 独立性检验思想的应用16题点 分类变量与统计、概率的综合性问题解 (1)由公式K2得,观测值k11.9787.879,所以有 99.5%以nadbc2abcdacbd上的把握认为喜欢“人文景观”景点与年龄有关(2)由题意知抽取的 6 人中大于 40 岁的市民有 4 个,20 岁至 40 岁的市民有 2 个,分别记为B1,B2,B3,B4,C1,C2,从中任选 2 人的

27、基本事件有(B1,B2),(B1,B3),(B1,B4),(B1,C1),(B1,C2),(B2,B3),(B2,B4),(B2,C1),(B2,C2),(B3,B4),(B3,C1),(B3,C2),(B4,C1),(B4,C2),(C1,C2),共 15 个,其中恰有 1 位大于 40 岁的市民和 1 位 20 岁至 40 岁的市民的事件有(B1,C1),(B1,C2),(B2,C1),(B2,C2),(B3,C1),(B3,C2),(B4,C1),(B4,C2),共 8个,所以恰有 1 位大于 40 岁的市民和 1 位 20 岁至 40 岁的市民的概率为.8 15四、探究与拓展13假设有

28、两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,其中 22 列联表为:y1y2总计x1ababx2cdcd总计acbdabcd对同一样本,以下数据能说明X与Y有关的可能性最大的一组是( )Aa5,b4,c3,d2 Ba5,b3,c4,d2Ca2,b3,c4,d5 Da3,b2,c4,d5考点 分类变量与列联表题点 求列联表中的数据答案 D解析 对于同一样本,|adbc|越小,说明x与y相关性越弱,而|adbc|越大,说明x与y相关性越强,通过计算知,对于 A,B,C 都有|adbc|1012|2.对于选项 D,有|adbc|158|7,显然 72.142017 年世界第一届轮滑运动

29、会(the first edtion of Roller Games)在南京举行,为了搞好接待工作,组委会招募了 16 名男志愿者和 14 名女志愿者调查发现,男、女志愿者分别有 10 人和 6 人喜爱轮滑,其余不喜爱得到 22 列联表如下.喜爱轮滑不喜爱轮滑总计男1061617女6814总计161430(1)根据 22 列联表,判断能否在犯错误的概率不超过 0.10 的前提下认为性别与喜爱轮滑有关?(2)从女志愿者中抽取 2 人参加接待工作,若其中喜爱轮滑的人数为,求的分布列和均值考点 独立性检验思想的应用题点 独立性检验与线性回归方程、均值的综合应用解 (1)假设:是否喜爱轮滑与性别无关由已知数据可求得K2的观测值为k1.157 52.706.30 10 86 6216 14 16 14因此不能在犯错误的概率不超过 0.10 的前提下认为喜爱轮滑与性别有关(2)喜爱轮滑的人数的可能取值为 0,1,2,则P(0),C0 6C2 8 C 2 1428 914 13P(1),C1 6C1 8 C 2 1448 91P(2).C2 6C0 8 C 2 1415 91所以喜爱轮滑的人数的分布列为012P4 1348 9115 91所以喜爱轮滑的人数的均值为 E()012 .4134891159167

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高中资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com