数据模型与决策统计模型.ppt

上传人:石*** 文档编号:84131251 上传时间:2023-04-02 格式:PPT 页数:79 大小:3.26MB
返回 下载 相关 举报
数据模型与决策统计模型.ppt_第1页
第1页 / 共79页
数据模型与决策统计模型.ppt_第2页
第2页 / 共79页
点击查看更多>>
资源描述

《数据模型与决策统计模型.ppt》由会员分享,可在线阅读,更多相关《数据模型与决策统计模型.ppt(79页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、数据模型与决策统计模型现在学习的是第1页,共79页针对的主要问题(1)参数估计(包括点估计和区间估计)(2)假设检验(3)类别判断(4)群体特征识别现在学习的是第2页,共79页(1)一个很熟悉的问题某种产品的合格率为p,检测了100 件产品,合格88件,试用统计的方法估计该产品的合格率。合格率:88%是否可信?现在学习的是第3页,共79页(2)常见的买卖纠纷有消费者投诉某企业的某种产品有欺诈行为(缺斤短两、内质成分结构与标准不符),工商质检部门如何处理?现在学习的是第4页,共79页(3)复杂事物的分类以人的血液中各种指标值为基础,可以把人群分成多种类型。材料也是如此。组织是否也可如此?现在学习

2、的是第5页,共79页(4)内隐特征识别70后、80后、90后行为特征清华、北大、东北大学大学毕业生的知识与行为特征。中性特征;优势特征;劣势特征现在学习的是第6页,共79页概率论的有关概念和知识复习现在学习的是第7页,共79页2.1 参数估计模型(1)点估计的矩法 1)原理 2)估计质量(2)区间估计现在学习的是第8页,共79页(1)点估计的矩法矩估计依据:大数定律 结论:对于简单随机子样,样本数量趋向于无穷时,均值以概率1保证趋近于数学期望。现在学习的是第9页,共79页随机变量的k阶原点矩含参数的表达式现在学习的是第10页,共79页例如:在 上均匀分布随机变量现在学习的是第11页,共79页由

3、大数定律,有依此,矩法直接令右侧是含待定参数的表达式左侧是实测数据的表达式现在学习的是第12页,共79页据此,可以得到矩估计的一般过程0)选择适合具体问题的随机变量1)确定具体问题所包含的待估计参数的数量2)依据问题的特点及大数定律构造含待估参数的等式方程组3)求解方程组的估计器4)分析估计器的可信程度5)采样、测试并计算现在学习的是第13页,共79页现有一批某种产品,如何依据相关的质量标准。估计其合格率为p。前面熟悉的问题应该是现在学习的是第14页,共79页统计方法分析:用表示群体产品中单件产品的合格与不合格的状态,则是随机的,可表述为产品状态不合格合格01概率(不合格率)1-p(合格率)p

4、实际上,0-1是人为规定的,也可另行规定现在学习的是第15页,共79页合格产品的数量 用容量为n的子样估计产品合格率,即估计p。由于随机变量的数学期望为p,因此,估计产品的合格率p就是估计随机变量的参数数学期望。现在学习的是第16页,共79页由于单个随机变量的方差其最大值为0.25,而均值的方差为构造估计器现在学习的是第17页,共79页因此,有对于容量为100样本,最保守的考虑,估计器的误差方差也不会超过现在学习的是第18页,共79页如果比照正态分布的情形,就是以99.9999%的把握保证,实际的合格率在即:现在学习的是第19页,共79页另行规定的尝试:用表示群体产品中单件产品的合格与不合格的

5、状态,则是随机的,可表述为产品状态不合格合格ab概率(不合格率)1-p(合格率)p现在学习的是第20页,共79页依照相应的处理过程,有因此,有矩估计方程现在学习的是第21页,共79页解方程,得即因此,选a=0,b=1是最简练,也是最直接的。现在学习的是第22页,共79页再如:正态分布母体的均值与方差的估计由正态分布的一阶矩和二阶矩现在学习的是第23页,共79页求解方程组得现在学习的是第24页,共79页以后记称为样本方差。现在学习的是第25页,共79页可应用的背景很多,例:若从自动车床加工的一批零件中随机抽取10件,测得尺寸与规定尺寸的偏差分别为2,1,-2,3,2,4,-2,5,3,4。设偏差

6、应服从正态分布N(,2),试估计,2。现在学习的是第26页,共79页解:由有现在学习的是第27页,共79页关于a,b均匀分布随机变量的参数估计由分布函数,可得现在学习的是第28页,共79页令解方程组,可得现在学习的是第29页,共79页还有其它方法构造估计器,比如最大似然估计,而且所得估计器的结构不尽相同。现在学习的是第30页,共79页(2)可信程度估计的质量1)无偏估计2)一致估计现在学习的是第31页,共79页均值的估计质量定理:设母体服从分布F(x),(x1,x2,xn)是来自母体的容量为n的简单子样,如果F(x)存在二阶矩,则有现在学习的是第32页,共79页证明现在学习的是第33页,共79

7、页定理:如果F(x)存在四阶矩,则有其中现在学习的是第34页,共79页因此,用估计方差是不合适的!现在学习的是第35页,共79页但可依此得到方差的无偏估计:有时直接记须留意规定!现在学习的是第36页,共79页由此,前面例子若从自动车床加工的一批零件中随机抽取10件,测得尺寸与规定尺寸的偏差分别为2,1,-2,3,2,4,-2,5,3,4。设偏差应服从正态分布N(,2),试估计,2。现在学习的是第37页,共79页(2)参数的区间估计区间估计例1 某制造厂质量管理部门的负责人确信包装后的原材料总体标准差为15千克。希望以95的把握(置信度)估计移交给接受部门的5500包原材料的平均重量的区间。现在

8、学习的是第38页,共79页准备知识:正态母体的重要抽样(统计量)分布设母体的分布为N(,2),则1)2)3)两者是独立随机变量现在学习的是第39页,共79页参数的区间估计显著水平、置信度1)方差已知的正态母体均值估计现在学习的是第40页,共79页例1 某制造厂质量管理部门的负责人确信包装后的原材料总体服从标准差为15千克的正态分布。希望以95的把握(置信度)估计移交给接受部门的5500包原材料的平均重量的区间。现在学习的是第41页,共79页模型的设计如果有容量为n的简单随机子样,由均值的无偏估计,应该考虑下面统计量的分布现在学习的是第42页,共79页由正态分布的抽样分布结论由于标准状态分布的有

9、关结果可查表得到,故转变成标准正态分布现在学习的是第43页,共79页几何解释针对正态分布随机变量,选择怎样的区间?现在学习的是第44页,共79页几何解释针对正态分布随机变量,选择怎样的区间?现在学习的是第45页,共79页因此,应选与纵轴对称区间现在学习的是第46页,共79页查数学用表临界值为1.96。即至此,模型构建完毕。现在学习的是第47页,共79页模型的使用:1)确定随机子样的容量n;(由要求的精度决定)2)实现随机子样值的获取;3)计算统计量(均值)的值;4)带入数学模型,即有结论:以95%的把握说现在学习的是第48页,共79页选择简单子样的容量为250。通过随机检测250包原材料,得到

10、一个样本,其平均值为65千克。续前例现在学习的是第49页,共79页由估计准则,有现在学习的是第50页,共79页参数区间估计模型的构造过程1)针对关心的参数,并依据所拥有的条件构建统计量;2)分析统计量的概率分布规律;3)依据概率分布及置信水平,确定区间模型;4)确定子样容量;)确定子样容量;5)获得简单随机子样;)获得简单随机子样;6)统计判断)统计判断现在学习的是第51页,共79页2)方差未知的正态母体均值估计对于前一个问题,如果负责人并不知道母体的方差,如何进行参数的区间估计?即:某制造厂质量管理部门的负责人希望以95的把握(置信度)估计移交给接受部门的5500包原材料的重量的区间。现在学

11、习的是第52页,共79页参照前面,首先考虑子样均值但是,由于未知,原区间估计的表述中含有未知参量!现在学习的是第53页,共79页改进标准正态分布自由度为n-1的分布现在学习的是第54页,共79页由t-分布的定义现在学习的是第55页,共79页由此,可以建立对应背景的区间估计数学模型即:现在学习的是第56页,共79页例:某制造厂质量管理部门的负责人希望以95的把握(置信度)估计移交给接受部门的5500包原材料的重量的区间。现在学习的是第57页,共79页选择简单子样的容量为45。通过随机检测45包原材料,得到一个子样,其平均值为65千克,标准差为14千克。现在学习的是第58页,共79页由有现在学习的

12、是第59页,共79页3)两个总体平均数之差的区间估计教育部某部门想了解两所学校在某专业的教育质量的差距。置信度为95%。现在学习的是第60页,共79页两种考虑A 经询问两校教务处,可知各自学生成绩的方差。B 经询问两校教务处,未知各自学生成绩的方差。现在学习的是第61页,共79页A.方差已知现在学习的是第62页,共79页即现在学习的是第63页,共79页经询问两校教务处,未知各自学生成绩的方差。B 正态母体,方差未知但相同t-分布现在学习的是第64页,共79页现在学习的是第65页,共79页因此,当 时,现在学习的是第66页,共79页4)方差的区间估计借助抽样分布的结论:现在学习的是第67页,共7

13、9页4)方差的区间估计某企业技术质量部门想掌握产品加工中的质量波动情况。借助抽样分布的结论:现在学习的是第68页,共79页如加工贸易中的贴牌生产 我国某知名企业想通过OEM的方式扩大市场占有率,在美国寻找伙伴。如何了解美国企业的加工水平与该企业的异同情况。两母体方差比的区间估计现在学习的是第69页,共79页已知该企业25个随机样本的方差为64;经检测,美国某企业30个样本的方差为81。两企业的加工精度的差异如何?现在学习的是第70页,共79页2.2 假设检验模型重要的抽样分布结论复习假设检验所依据的公设现在学习的是第71页,共79页2.3 聚类分析模型 现在学习的是第72页,共79页2.4 主

14、成分分析模型现在学习的是第73页,共79页重要的结论正态分布的随机变量的代数和还是正态分布随机变量。现在学习的是第74页,共79页几个重要的分布 分布设有n个独立的标准正态分布的随机变量的平方和为自由度为n的 分布。现在学习的是第75页,共79页几个重要的分布 t-分布标准正态分布与自由度为n的 分布独立,它们的特殊比的形式,为自由度为n的t-分布。现在学习的是第76页,共79页几个重要的分布 F-分布两个自由度为分别为n和m的 独立分布的随机变量的某种比的形式,为自由度为(m,n)的F-分布。现在学习的是第77页,共79页子样容量即:随机样本个数。现在学习的是第78页,共79页简单随机子样独立、同分布的随机子样。现在学习的是第79页,共79页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com