2019高中数学 第1章 统计案例 1.2 独立性检验的基本思想及其初步应用学案 新人教A版选修1-2.doc

上传人:随风 文档编号:719897 上传时间:2019-06-06 格式:DOC 页数:8 大小:322.28KB
返回 下载 相关 举报
2019高中数学 第1章 统计案例 1.2 独立性检验的基本思想及其初步应用学案 新人教A版选修1-2.doc_第1页
第1页 / 共8页
2019高中数学 第1章 统计案例 1.2 独立性检验的基本思想及其初步应用学案 新人教A版选修1-2.doc_第2页
第2页 / 共8页
点击查看更多>>
资源描述

《2019高中数学 第1章 统计案例 1.2 独立性检验的基本思想及其初步应用学案 新人教A版选修1-2.doc》由会员分享,可在线阅读,更多相关《2019高中数学 第1章 统计案例 1.2 独立性检验的基本思想及其初步应用学案 新人教A版选修1-2.doc(8页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、11.21.2 独立性检验的基本思想及其初步应用独立性检验的基本思想及其初步应用学习目标:1.理解独立性检验的基本思想及其实施步骤(重点)2.能利用条形图、列联表探讨两个分类变量的关系(易混点)3.了解K2的含义及其应用(重点)4.通过对数据的处理,来提高解决实际问题的能力(难点)自 主 预 习探 新 知1分类变量及 22 列联表(1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量(2)列联表定义:列出的两个分类变量的频数表,称为列联表22 列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为 22 列联表)为:y1

2、y2总计x1ababx2cdcd总计acbdabcd2.等高条形图(1)与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征(2)观察等高条形图发现和相差很大,就判断两个分类变量之间有关系a abc cd3独立性检验(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验(2)K2,其中nabcd.nadbc2 abcdacbd(3)独立性检验的具体做法根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定临界值k0.利用公式计算随机变量K2的观测值k.如果kk0,就推断“X与Y有关系” ,这种推断犯

3、错误的概率不超过,否则就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系” ,或者在样本数据中没有发现足够证据支持结论“X与Y有关系” 思考:有人说:“我们有 99%的把握认为吸烟和患肺癌有关,是指每 100 个吸烟者中就会有 99 个患肺癌的 ”你认为这种观点正确吗?为什么?2提示观点不正确.99%的把握说明的是吸烟与患肺癌有关的程度,不是患肺癌的百分数基础自测1思考辨析(1)在独立性检验中,若K2越大,则两个分类变量有关系的可能性越大( )(2)22 列联表是借助两个分类变量之间频率大小差异说明两个变量之间是否有关联关系( )(3)应用独立性检验的基本思想对两个变量间的关系作出的推断

4、一定是正确的( )答案 (1) (2) (3)2下列变量中不属于分类变量的是( )【导学号:48662013】A性别 B吸烟C宗教信仰 D国籍B B “吸烟”不是分类变量, “是否吸烟”才是分类变量故选 B.3下面是一个 22 列联表:y1y2总计x1a2173x282533总计b46则表中a,b处的值分别为_52,60 a2173,a52.ba852860.4根据下表计算:不看电视看电视男3785女35143K2的观测值k_(保留 3 位小数). 【导学号:48662014】4.514 k4.514.300 37 14385 352 122 178 72 228合 作 探 究攻 重 难用 2

5、2 列联表分析两变量间的关系3在对人们饮食习惯的一次调查中,共调查了 124 人,其中六十岁以上的 70 人,六十岁以下的 54 人六十岁以上的人中有 43 人的饮食以蔬菜为主,另外 27 人则以肉类为主;六十岁以下的人中有 21 人饮食以蔬菜为主,另外 33 人则以肉类为主请根据以上数据作出饮食习惯与年龄的列联表,并利用与判断二者是否有关系a abc cd解 22 列联表如下:年龄在六十岁以上年龄在六十岁以下总计饮食以蔬菜为主432164饮食以肉类为主273360总计7054124将表中数据代入公式得0.671 875.a ab43 640.45.c cd27 60显然二者数据具有较为明显的

6、差距,据此可以在某种程度上认为饮食习惯与年龄有关系规律方法 1.作 22 列联表时,关键是对涉及的变量分清类别注意应该是 4 行 4列,计算时要准确无误2利用 22 列联表分析两变量间的关系时,首先要根据题中数据获得 22 列联表,然后根据频率特征,即将与的值相比,直观地反映出两个分类变a abc cd(或b ab与d cd)量间是否相互影响,但方法较粗劣跟踪训练1假设有两个分类变量X与Y,它们的可能取值分别为x1,x2和y1,y2,其 22列联表为:y1y2x11018x2m26则当m取下面何值时,X与Y的关系最弱( )A8 B9C14 D19C C 由 102618m,解得m14.4,所以

7、当m14 时,X与Y的关系最弱用等高条形图分析两变量间的关系为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的4尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系? 【导学号:48662015】解 等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系规律方法 利用等高条形

8、图判断两个分类变量是否相关的步骤:跟踪训练2为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:药物效果试验列联表患病未患病总计服用药104555没有服用药203050总计3075105试用图形判断服用药与患病之间是否有关系?解 相应的等高条形图如下:5从图形可以看出,服用药的样本中患病的比例明显低于没有服用药的样本中患病的比例,因此可以认为:服用药和患病之间有关系用K2进行独立性检验探究问题1在K2运算后,得到K2的值为 29.78,在判断变量相关时,P(K26.635)0.01 和P(K27.879)0.005,哪种说法是正确的?提示:两种说法均正确P(K26.635)0.01

9、的含义是在犯错误的概率不超过 0.01的前提下认为两个变量相关;而P(K27.879)0.005 的含义是在犯错误的概率不超过0.005 的前提下认为两个变量相关2你能说一下用K2进行独立性检验的依据吗?提示:独立性检验的基本思想类似于数学中的反证法先假设“两个分类变量没有关系”成立,计算随机变量K2的值,如果K2值很大,说明假设不合理K2越大,两个分类变量有关系的可能性越大随着生活水平的提高,人们的休闲方式也发生了变化某机构随机调查了n个人,其中男性占调查人数的 .已知男性中有一半的人的休闲方式是运动,而女性中只有2 5的人的休闲方式是运动1 3 (1)完成下列 22 列联表:运动非运动总计

10、男生女生总计n(2)若在犯错误的概率不超过 0.05 的前提下,可认为“性别与休闲方式有关” ,那么本次被调查的人数至少有多少?【导学号:48662016】思路探究:(1)依据 22 列联表的定义填表;(2)计算K2,利用临界值建立不等关系,求n的值6解 (1)补全 22 列联表如下:运动非运动总计男性n1 5n1 5n2 5女性n1 5n2 5n3 5总计n2 5n3 5n(2)若在犯错误的概率不超过 0.05 的前提下,可认为“性别与休闲方式有关” ,则P(K2k0)3.841.由于K2的观测值k,n 36故3.841,即n138.276.n 36又由nZ Z,故n140.1 5故若在犯错

11、误的概率不超过 0.05 的前提下,可认为“性别与休闲方式有关” ,那么本次被调查的至少有 140 人母题探究:1.(变结论)根据(2)的结论,本次被调查的人中,至少有多少人的休闲方式是运动?解 根据(2)的结论,本次被调查的人中,至少有 14056(人)的休闲方式是运2 5动2(变条件)若增加条件n100,问能否在犯错误不超过 0.1 的前提下,可认为“性别与休闲方式有关”?解 由(2)可知,当n100 时,K2的观测值k2.782.706.故在犯错误不超100 36过 0.1 的前提下,我们可以认为性别与休闲方式有关规律方法 解决一般的独立性检验问题的步骤7当 堂 达 标固 双 基1某科研

12、机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据如表:心脏病无心脏病秃发20300不秃发5450根据表中数据得到k15.968,因为k6.635,775 20 4505 3002 25 750 320 455则断定秃发与心脏病有关系,那么这种判断出错的可能性为( )A0.1 B0.05C0.025 D0.01D D P(k6.635)0.01,故选 D.2在一项中学生近视情况的调查中,某校男生 150 名中有 80 名近视,女生 140 名中有 70 名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) 【导学号:48662017】A平均数与方

13、差 B回归分析C独立性检验 D概率C C 判断两个分类变量是否有关的最有效方法是进行独立性检验,故选 C.3在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过 0.01 的前提下认为这个结论是成立的下列说法中正确的是( )A100 个心脏病患者中至少有 99 人打鼾B1 个人患心脏病,则这个人有 99%的概率打鼾C100 个心脏病患者中一定有打鼾的人D100 个心脏病患者中可能一个打鼾的人都没有D D 这是独立性检验,在犯错误的概率不超过 0.01 的前提下认为“打鼾与患心脏病有关” 这只是一个概率,即打鼾与患心脏病有关的可能

14、性为 99%.根据概率的意义可知答案8应选 D.4观察下列各图,其中两个分类变量x,y之间关系最强的是_图 121(4) 在四幅图中图(4)中两个深色条的高相差最明显,说明两个分类变量之间关系最强,故选(4)5某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品总计南方学生602080北方学生101020总计7030100根据表中数据,问是否有 95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”. 【导学号:48662018】解 将 22 列联表中的数据代入公式计算,得knadbc2 abcdacbd4.762.100 60 1020 102 70 30 80 20100 21因为 4.7623.841,所以有 95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯 方面有差异”

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高中资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com