六西格玛统计学入门初步.pptx

上传人:修**** 文档编号:5706175 上传时间:2022-01-15 格式:PPTX 页数:74 大小:909.53KB
返回 下载 相关 举报
六西格玛统计学入门初步.pptx_第1页
第1页 / 共74页
六西格玛统计学入门初步.pptx_第2页
第2页 / 共74页
点击查看更多>>
资源描述

《六西格玛统计学入门初步.pptx》由会员分享,可在线阅读,更多相关《六西格玛统计学入门初步.pptx(74页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、6个西格码运用之所需统计手法的统计学之十大概念 通过对数据的统计分析,掌握数据分布及变化规律,运用各类模型分析和把握各类过程中各种因变量特点,可以大大提高过程改进、新产品新工艺开发的效率统计学概要经验、勇气、直觉统计学契合如下科学的思维方式统计学契合如下科学的思维方式模型模型演绎演绎数据数据归纳归纳专业专业专业专业MINITAB介绍统计软件包统计软件包 1972 1972年诞生于美国年诞生于美国 不断升级不断升级 ( (最新最新1616版版) )MINITAB:运用广泛,数据分析能力强,且具有相当好的处理固定因子和随机因子的实验分析能力Design-Expert:侧重实验设计的软件包MINTA

2、B介绍十大统计学基本概念十大统计学基本概念数据类型数据类型自由度自由度置信区间置信区间试验误差试验误差重复性重复性&再现性再现性中心极限定理中心极限定理位置效应位置效应散度效应散度效应分布分布概率概率 基本概念基本概念:试验试验 、 随机事件随机事件 、 随机变量随机变量 、 概率概率概念导入朝上还是朝下?朝上还是朝下?X=0,1P(x)=50%随机样本随机样本:等可能抽样出来的样本等可能抽样出来的样本,可以用来说明总体可以用来说明总体(代表代表)表达随机变量所用数据的两种形式表达随机变量所用数据的两种形式数据数据时间、温度、距离、重量、等可连续分割的数据,要求数据准确,但对数据量要求不大好/

3、坏、正面/反面、等不可分割的数据,要求数据准确度不高,但要求数据量大数据连续数据连续数据离散数据离散数据基本概念基本概念:母集团母集团(总体总体)、样本、样本容量、样本函数、统计量、样本、样本容量、样本函数、统计量母集团母集团样本样本统计量:统计量:样本均值、样本中位数、众数样本均值、样本中位数、众数样本极差、样本方差、样本标准差样本极差、样本方差、样本标准差等等等等概念导入随机抽样随机抽样随机抽样产生简单随机样本随机抽样产生简单随机样本,并产生抽样分布并产生抽样分布,它是假设检验理论的它是假设检验理论的基础。基础。抽样随机样本:随机样本:1. 1.等可能性等可能性 2. 2.独立性独立性自相

4、关样本由于不自相关样本由于不具备独立性而不具有代表性具备独立性而不具有代表性如天气温度如天气温度,CPI数据等数据等随机样本:随机样本:1. 1.样本均值分布样本均值分布-标准正态或标准正态或 t t分布分布2. 2.方差分布方差分布-卡方分布卡方分布3. 3.两个方差之比的分布两个方差之比的分布-F F分布分布简单随机样本抽样方式分两种,都要求抽样的随机化简单随机样本抽样方式分两种,都要求抽样的随机化简单型简单型分层型分层型iiiiiiiiiiiiii抽样随机样本随机样本:等可能抽样出来的样本等可能抽样出来的样本,可以用来说明总体可以用来说明总体(代表代表)统计一下全国所有统计一下全国所有1

5、2岁女性身高岁女性身高样本样本浙江XXX新疆沈阳随机随机抽样抽样母集团母集团实例导入NO身高身高(CM)(CM)1142.82155.13161.34144.85148.26162.47158.38149.69151.310158.211149.612160.313162.114146.615171.316158.717153.918159.319142.120149.2直方图随机样本随机样本:等可能抽样出来的样本等可能抽样出来的样本,可以用来说明总体可以用来说明总体(代表代表)全国所有全国所有12岁女性身高直方图表达岁女性身高直方图表达1701651601551501451409876543

6、210身身高高频频率率均值154.3标准差7.691N20直直方方图图正态 1701651601551501451409876543210身身高高频频率率均值154.3标准差7.691N20直直方方图图正态 位置效应随机样本随机样本:等可能抽样出来的样本等可能抽样出来的样本,可以用来说明总体可以用来说明总体(代表代表)统计量统计量:反映总体不同特征的、不含有未知参数的样本函数反映总体不同特征的、不含有未知参数的样本函数(1)描述中心位置描述中心位置 的统计量的统计量- 1.样本均值样本均值位置效应位置效应位置效应位置效应位置效应位置效应 X= Xinni=1S S位置效应随机样本随机样本:等可

7、能抽样出来的样本等可能抽样出来的样本,可以用来说明总体可以用来说明总体(代表代表)统计学对事件的描述统计学对事件的描述-位置效应位置效应 1801701601501401300.050.040.030.020.010.00X X密密度度分分布布图图正态, 均值=154.3, 标准差=7.6911801701601501401300.050.040.030.020.010.00X X密密度度分分布布图图正态, 均值=154.3, 标准差=7.691均值均值=120.2均值均值=154.3矮个矮个高个高个随机样本随机样本:等可能抽样出来的样本等可能抽样出来的样本,可以用来说明总体可以用来说明总体(

8、代表代表)统计学处理的对象:数据统计学处理的对象:数据统计量(散度效应)(2)描述波动情况描述波动情况 的统计量的统计量- 1.样本方差样本方差 2.样本标准偏差样本标准偏差散度效应散度效应统计量统计量:反映总体不同特征的、不含有未知参数的样本函数反映总体不同特征的、不含有未知参数的样本函数nS S2 2 = =1)(21- - - = =nXXii 1)(21- - - = =nXXniiS S = =散度效应随机样本随机样本:等可能抽样出来的样本等可能抽样出来的样本,可以用来说明总体可以用来说明总体(代表代表)统计学对事件的描述统计学对事件的描述-散度效应散度效应1801701601501

9、401300.050.040.030.020.010.00X X密密度度分分布布图图正态, 均值=154.3, 标准差=7.6911 8 01 7 01 6 01 5 01 4 01 3 00 . 0 50 . 0 40 . 0 30 . 0 20 . 0 10 . 0 0X X密密度度分分 布布 图图正 态 , 均 值 = 1 5 4 . 3 , 标 准 差 = 7 . 6 9 1标准差标准差=7.691标准差标准差=0.821个头匀称个头匀称个头差别大个头差别大位置和散度效应的工程指导意义543210- 1- 2- 3- 4- 51. 00. 50. 0X v alD is t W i d

10、eUSL1 0 05 00543210- 1- 2- 3- 4- 5USLL SLt i meBlackLSL(白体白体)(白(白体体)过程过程与与 的均值相同但离散程度大的均值相同但离散程度大。 。:缩小过程的波动缩小过程的波动。 。过程散度的幅度与过程散度的幅度与 相同,但均值不同。相同,但均值不同。 :将过程的均值移近目标值将过程的均值移近目标值( (为实现正确性为实现正确性)。)。543210- 1- 2- 3- 4- 51 . 00 . 50 . 0Xv alDistRighLSLUSL1 0 05 00543210- 1- 2- 3- 4- 5US LL S Lt i meBlac

11、k 位置和散度效应工程指导意义21 0 05 00543210- 1- 2- 3- 4- 5US LL S Lt i meBlack543210- 1- 2- 3- 4- 51 . 00 . 50 . 0USLL SLXv alBlackB1、B2、B3的的工程能力工程能力比比A的小的小过程比过程比 过程的幅度宽,均值也不同。过程的幅度宽,均值也不同。 Action: :将均值移近目标值,同时也要缩小波动将均值移近目标值,同时也要缩小波动。 。位置和散度效应工程指导意义3实际工作中的例子新产品开发时过程能力的计算新产品开发时过程能力的计算品質保証部門行作成日【初物品質確認記録】会社名承認調査担

12、当測定箇所21222324252627282930供試品No1.6Z 1.6Z 12.5Z 8.218.148.07M5X0.86.90.70.711.2090.7844.5688.2008.1408.070OK6.910.6890.71521.1030.7163.2148.2108.1408.075OK6.920.6880.71930.6530.8574.5218.2108.1308.065OK6.90.680.7240.7690.8293.8428.2008.1408.070OK6.910.6850.71450.6830.9216.2548.2108.1358.070OK6.910.685

13、0.71160.8410.8813.5148.2008.1308.075OK6.920.6840.71970.7411.0245.2848.2058.1408.065OK6.920.690.7280.6240.7653.6548.2008.1308.070OK6.920.6880.7190.5590.7594.8518.2008.1308.060OK6.90.6840.716100.5180.8093.3608.2108.1408.075OK6.910.6830.7151112131415161718192021222324252627282930規上 限1.61.612.58.228.158

14、.085 M5X0.86.9500.7000.730格下 限8.208.138.055 M5X0.86.8500.6700.700粗糙度仪 粗糙度仪 粗糙度仪 千分尺千分尺千分尺硬度计両側Pp片側上片側下 判定2011.4.14宁波精益创诚轴业有限公司检测工具部品名称部品番号8x138.05M A X M I N R 平均値X 標準値S(n-1)規上 限7.915.00.32512.0格下 限7.714.60.27511.5二次元二次元7.80014.8120.31011.8407.76014.7940.30011.6300.0400.0180.0100.2107.77914.8030.302

15、11.7850.0110.0040.0040.055両側3.1518.281.941.51Pp片側上3.8218.011.761.30片側下2.4718.542.121.73 2.4718.011.761.30判定OKOKOKNG检测工具M A X M I N R 平均値X 標準値S(n-1)总体和样本的联系和区别“母集团分布函数母集团分布函数”= = 母集团均值母集团均值s s = 母集团的标准母集团的标准( (偏偏) )差差s s2 2 = 母集团的方差母集团的方差“样本分布函数样本分布函数” s = 样本标准样本标准( (偏偏) )差差X = 样本均值样本均值 s2 = 样本方差样本方差

16、两者间的统计量表达是不一样的两者间的统计量表达是不一样的总体和样本的联系和区别“母集团分布函数母集团分布函数”= = 母集团均值母集团均值s s = 母集团的标准母集团的标准( (偏偏) )差差s s2 2 = 母集团的方差母集团的方差“样本分布函数样本分布函数” s = 样本标准样本标准( (偏偏) )差差X = 样本均值样本均值 s2 = 样本方差样本方差X )= E( s2)= )= s s2 2E( E( s)= )= s s无偏估计量无偏估计量:由样本推测总体的长期数学期望值由样本推测总体的长期数学期望值,且具有最小方差且具有最小方差数学数学期望期望? ?S S样本样本nS S2 2

17、 = =1)(21- - - = =nXXii总体总体X = Xinni=1 = S SXiNs s2 2 = =)(2- - XiNs s = =)(2- - NXi 1)(21- - - = =nXXniiS S = =总体和样本的联系和区别在计算样本方差在计算样本方差(标准差标准差)时使用的自由度不同时使用的自由度不同,自由度自由度=n-1S S均值和方差的性质设设X X为随机变量为随机变量, ,a a与与b b为任意实数为任意实数, ,则则 E(aE(a* *X+b)=aX+b)=a* *E(X)+bE(X)+b对任意两个随机变量对任意两个随机变量X X1 1和和X X2 2 则则 E

18、(XE(X1 1+X+X2 2)= E(X)= E(X1 1)+ E(X)+ E(X2 2) )对任意两个独立的随机变量对任意两个独立的随机变量X X1 1和和X X2 2 则则 Var(XVar(X1 1X X2 2)= Var(X)= Var(X1 1)+Var(X)+Var(X2 2) )特别对于方差的性质要注意特别对于方差的性质要注意!X X0 0X X1 1X X2 2Y=XY=X0 0-X-X1 1-X-X2 2X0X0、X1X1、X2X2只要只要做的大小符合一做的大小符合一般公差大小就行般公差大小就行了,反正有正负了,反正有正负误差抵消的可能。误差抵消的可能。这样理解可以吗?这样

19、理解可以吗?偏差平方和及自由度在暗箱中任意摸出六个珠子后在暗箱中任意摸出六个珠子后,未被摸出的第未被摸出的第7个珠子个珠子 的状态就已知了。所以自由度数的状态就已知了。所以自由度数DOF=6这也是样本方差(标准偏差)和总体方差(样本)方这也是样本方差(标准偏差)和总体方差(样本)方 差公式不一样的原因(差公式不一样的原因(什么地方不一样?什么地方不一样?)SS=(1-4)2+(2-4) 2 +(3-4) 2 +(4-4) 2 +(5-4) 2 +(6-4) 2 +(7-4) 2偏差平方和统计量偏差平方和统计量(SS):每个数值与平均值的差的平方和每个数值与平均值的差的平方和自由度自由度:偏差平

20、方和中独立元素的个数偏差平方和中独立元素的个数残差和自由度n个观测的残差之和个观测的残差之和 0 ,为一个线性约束,因为它们中的任,为一个线性约束,因为它们中的任 何何n-1个残差完全确定剩下的一个残差,因此残差和样本方差个残差完全确定剩下的一个残差,因此残差和样本方差(标准差)一样有(标准差)一样有n-1个自由度个自由度一个模型中要计算几个样本特征量时有必要在残差上加载若一个模型中要计算几个样本特征量时有必要在残差上加载若 干个约束。若有干个约束。若有p个加在个加在n个残差上的线性约束,则残差只有个残差上的线性约束,则残差只有np个自由度个自由度观测与样本均值的偏差称为残差(观测与样本均值的

21、偏差称为残差(residuals)一个计算自由度的实例重复试验的个处理观测值每个观测与总均值之差每个处理均值与总均值之差每个观测与每个处理均值之差NOABCD16262606861-1.8-1.8-3.84.2-2.8-0.920.98-5.826.98-1.22-0.9-2.82.0-2.8-1.626168586660-2.84.2-5.82.2-3.8-0.920.98-5.826.98-1.22-1.93.20.0-4.8-2.6364735373620.29.2-10.89.2-1.8-0.920.98-5.826.98-1.221.18.2-5.02.2-0.64586061716

22、1-5.8-3.8-2.87.2-2.8-0.920.98-5.826.98-1.22-4.9-4.83.00.2-1.6568636769664.2-0.83.25.22.2-0.920.98-5.826.98-1.225.1-1.89.0-1.83.466161596864-2.8-2.8-4.84.20.2-0.920.98-5.826.98-1.22-1.9-3.81.0-2.81.476266537060-1.82.2-10.86.2-3.8-0.920.98-5.826.98-1.22-0.91.2-5.0-0.8-2.6865605771621.2-3.8-6.87.2-1.8-

23、0.920.98-5.826.98-1.222.1-4.8-1.00.2-0.6969675473645.23.2-9.89.20.2-0.920.98-5.826.98-1.226.12.2-4.02.21.4105968587966-4.84.2-5.815.22.2-0.920.98-5.826.98-1.22-3.93.20.08.23.4处理均值62.964.85870.862.6总均值y63.863.863.863.863.8差-0.920.98-5.826.98-1.22总校正平方和处理平方和误差平方和DTRDF自由度49494 44545总的差的和为 0处理均值差的和为 0每列

24、和为 0Y ijyY jyY ijYj5个因子个因子(处理处理)对血液凝固的影响对血液凝固的影响此例在后续的方此例在后续的方差分析中有用差分析中有用十大统计学基本概念十大统计学基本概念数据类型数据类型自由度自由度置信区间置信区间试验误差试验误差重复性重复性&再现性再现性中心极限定理中心极限定理位置效应位置效应散度效应散度效应分布分布概率概率 分布随机样本随机样本:等可能抽样出来的样本等可能抽样出来的样本,可以用来说明总体可以用来说明总体(代表代表)20个数据的个数据的12岁女性身高的直方图是粗糙的岁女性身高的直方图是粗糙的1701651601551501451409876543210身身高高频

25、频率率均值154.3标准差7.691N20直直方方图图正态 NO身高身高(CM)(CM)1142.82155.13161.34144.85148.26162.47158.38149.69151.310158.211149.612160.313162.114146.615171.316158.717153.918159.319142.120149.2均值154.3标准差7.691分布随机样本随机样本:等可能抽样出来的样本等可能抽样出来的样本,可以用来说明总体可以用来说明总体(代表代表)12岁女性身高的数据增加到岁女性身高的数据增加到200个个NO身高身高(CM)(CM)1142.82155.13

26、161.34144.85148.26162.47158.38149.69151.310158.211149.612160.313162.114146.615171.316158.717153.918159.319142.120149.2均值154.3标准差7.691NO身高身高(CM)(CM)1144.82155.23154.44164.85147.66147.97153.08150.09165.710166.2167150.4168160.5169154.8170150.6181154.0182155.8183159.0186151.0187153.1188150.3189154.91901

27、62.6191141.1192170.5193135.6194156.4195149.3196167.6197164.0198155.7199149.3200163.0均值154.3标准差7.691分布随机样本随机样本:等可能抽样出来的样本等可能抽样出来的样本,可以用来说明总体可以用来说明总体(代表代表)12岁女性身高的数据增加到岁女性身高的数据增加到200个个,图形变得细腻图形变得细腻1701651601551501451409876543210身身高高频频率率均值154.3标准差7.691N20直直方方图图正态 172.5165.0157.5150.0142.5135.0353025201

28、51050C C6 6频频率率均值154.5标准差7.265N200C C6 6 的的直直方方图图正态 分布频数频数 概率概率 方块顶点连线方块顶点连线 概率密度曲线概率密度曲线 =身高身高 分布曲线分布曲线n无限大无限大,区间无限细分后矩形顶点的连线为区间无限细分后矩形顶点的连线为概率密度曲线,概率密度曲线,曲曲线围起的面积线围起的面积=1 P= p(x) d(x)172.5165.0157.5150.0142.5135.035302520151050C C6 6频频率率均值154.5标准差7.265N200C C6 6 的的直直方方图图正态 1801701601501401300.050.

29、040.030.020.010.00X X密密度度分分布布图图正态, 均值=154.3, 标准差=7.691根据分布求概率MINITAB上有上有24中分布中分布累计函数:求P的过程逆累计函数:求b的过程 f(x)dx=p-b分布是数据的集合。表现形式是概率密度曲线。分布是数据的集合。表现形式是概率密度曲线。0.050.040.030.020.010.00X X密密度度1580.685154分分布布图图正态, 均值=154.3, 标准差=7.691b在正态分布时根据均值和标准差和分布的形态可以求出概率在正态分布时根据均值和标准差和分布的形态可以求出概率0.050.040.030.020.010.

30、00X X密密度度150.10.293154分分布布图图正态, 均值=154.3, 标准差=7.6910.050.040.030.020.010.00X X密密度度149.80.279154分分布布图图正态, 均值=154.3, 标准差=7.691根据分布求概率在正态分布时根据均值和标准差和分布的形态可以求出概率在正态分布时根据均值和标准差和分布的形态可以求出概率根据分布求概率个子高度在个子高度在149.8-150.1149.8-150.1间间的概率是的概率是0.2925-0.27920.2925-0.2792=0.0133(1.33%)=0.0133(1.33%)累积分布函数 正态 分布,平

31、均值 = 154.3 和标 准差 = 7.691 x P( X = x )149.8 0.279240累积分布函数 正态分布,平均值 = 154.3 和标准差 = 7.691 x P( X = x )150.1 0.292501分位数的概念“百年一遇百年一遇”的洪水的洪水?已知分布和概率已知分布和概率,可以求分位数可以求分位数0.0300.0250.0200.0150.0100.0050.000X X密密度度1070.01分分布布图图Gamma, 形状=23, 尺度=3, 阈值=0出现出现“百年一遇百年一遇”的洪水是指出的洪水是指出现高于某水位的现高于某水位的概率是概率是1%逆累计概率逆累计概

32、率:知道知道分布和概率求分分布和概率求分位数位数(水位水位)分位数的概念“百年一遇百年一遇”的洪水的洪水?对标准分布对标准分布,求分位数求分位数0.0300.0250.0200.0150.0100.0050.000X X密密度度1070.01分分布布图图Gamma, 形状=23, 尺度=3, 阈值=0出现出现“百年一遇百年一遇”的洪水是指出的洪水是指出现高于某水位的现高于某水位的概率是概率是1%逆累计概率逆累计概率:知道知道分布和概率求分分布和概率求分位数位数(水位水位)分布形状的描述1负偏度负偏度( (左侧左侧) )正偏度正偏度( (右侧右侧) )偏度零偏度零: :对称分布对称分布正态分布正

33、态分布偏度系数用来度量分布是否对称。偏度系数用来度量分布是否对称。偏度系数与其标准偏度系数与其标准差的比差的比值值( (绝对值绝对值) )大于大于2 2,拒绝正,拒绝正态性。态性。正峰度正峰度比正态分布更陡比正态分布更陡峰度为零峰度为零正态分布正态分布负峰度负峰度与均匀分布相与均匀分布相同,尾部较短同,尾部较短分布形状的描述2峰度是刻画数据在均值两侧的集中程度的参数,峰度是刻画数据在均值两侧的集中程度的参数,峰度系数与其标峰度系数与其标准误准误差的比值用来检验正态性。差的比值用来检验正态性。 21212xf xess-=正态分布拐点拐点由偶然原因引起波动所产生的一种分布。工程上大多数随机变量服

34、由偶然原因引起波动所产生的一种分布。工程上大多数随机变量服从这种分布。残差的分布服从正态分布是统计研究的一个重要出发从这种分布。残差的分布服从正态分布是统计研究的一个重要出发点点 1.1.对称分布对称分布2.2.拐点与均值间的距离相拐点与均值间的距离相 当于当于1 1个标准差的大小个标准差的大小正态分布的特征值是正态分布的特征值是均值和标准差,所以均值和标准差,所以表示为表示为N N(,2)正态分布的检验05101501020304050607080Indiv 9Frequency1 050.999.99.95.80.50.20.05.01.001ProbabilityC 9p-value:

35、0.000A-Squared: 11.982Anderson-Darling Normality TestN of data: 250Std Dev: 1.94084Average: 1.95712Normal Probability Plot54321.999.99.95.80.50.20.05.01.001P robabilityC10p-value: 0.000A-Squared: 1.582Anderson-Darling Normality TestN of data: 250Std Dev: 0.664395Average: 2.02727Normal Probability Pl

36、ot05101501020304050607080AverageFrequency个别数据的分布个别数据的分布样本平均的分布样本平均的分布接近正态分布接近正态分布正态分布的标准变换=0=0(转换转换) )=11Zs sX 1.1.标准变换后根据标准变换后根据Z Z值可以查表立即查得概率值可以查表立即查得概率2.2.可以作为总体比较可以作为总体比较( (假设检验假设检验) )的统计量的统计量( (均值分布服从标准分布均值分布服从标准分布) )N N(0 0,1 1)Z Z大于等于大于等于1.961.96的概率的概率 2.5% 2.5%Z Z大于等于大于等于1.6451.645的概率的概率 5%

37、5%正态分布有关的练习题思路:868584838281800.40.30.20.10.0X X密密度度分分布布图图正态, 均值=83, 标准差=1.02标准差=?2.5%2.5%Z=1.96(85-83)/=1.96 =1.0220个落在(81,85)区间 19个落在(82,84)区间 可能性?个0.40.30.20.10.0X X密密度度820.163840.16383分分布布图图正态, 均值=83, 标准差=1.02正态分布有关的练习题Z=0.98Z=Z=(84-83)/1.021.02=0.98 0.40.30.20.10.0X X密密度度820.6738483分分布布图图正态, 均值=

38、83, 标准差=1.0267.3%每个产品落在82到84克之间的概率为67.3%6个产品同时落在82到84克之间的概率为0.6736=0.0283(2.83%)175170165160155150145140C C1 1身身高高箱线图的表达从图中可以看出分布情况及异常数据从图中可以看出分布情况及异常数据Q3Q1下限下限上限上限中位数中位数下限下限=Q1-1.5(Q3-Q1),最小值最小值上限上限=Q3+1.5(Q3-Q1),最大值最大值均值均值987654321170160150140130120110身身高高身身高高 的的箱箱线线图图箱线图的表达从图中可以看出分布情况及异常数据从图中可以看出

39、分布情况及异常数据下限下限下限下限=Q1-1.5(Q3-Q1),最小值最小值上限上限=Q3+1.5(Q3-Q1),最大值最大值异常值异常值箱线图的实际运用个例可以看出强度中位数时间轴的变化情况及变动可以看出强度中位数时间轴的变化情况及变动(波幅波幅)情况情况YXWVUTSRQPONMLKJIHGFEDCBA1 5 0 01 0 0 05 0 00B o xp lo ts o f A - Y(m e a n s a re in d ic a te d b y s o lid c irc le s )概率现实中的运用的例子现实中的运用的例子1.航空保险航空保险 航空公司赚多少钱航空公司赚多少钱?2

40、.租赁工程机械租赁工程机械 租赁者赚多少钱租赁者赚多少钱?某一现象某一现象( (如,硬币正面朝上如,硬币正面朝上) )发生的确切程度发生的确切程度;若该现象偶然发生若该现象偶然发生的比例有极限值时,则该极限值为该值发生的概率的比例有极限值时,则该极限值为该值发生的概率;现象之和现象之和有用的公式E(X)(均值)= xipi Xp(x)dxX为离散随机变量X为连续型随机变量Var(X)(方差)=xiE(x)2pixE(x)2p(x)dxX为离散随机变量X为连续型随机变量-知道概率或概率密度时知道概率或概率密度时,均值和方差的均值和方差的(数学期望数学期望)计算计算随机变量 p p(y y2 2|

41、y|y1 1=175=175)= p= p(y y2 2|y|y1 1=155=155) 即即 身高和体重两个随机变量是身高和体重两个随机变量是统计相依统计相依的。的。统计独立性:统计独立性: p p(y y2 2|y|y1 1=175=175)= p= p(y y2 2|y|y1 1=155=155) 即即 身高和智商两个随机变量是身高和智商两个随机变量是统计独立统计独立的。的。不知道它精确值不知道它精确值, ,但知道它的概率分布但知道它的概率分布统计相依性统计相依性: :联合概率譬如譬如: :身高身高y y1 1=175=175厘米和体重厘米和体重y y2 2=120=120公斤的概率分布

42、公斤的概率分布 p(yp(y1 1 =175=175,y y2 2 =120)=p=120)=p( y y2 2 =120=120)* * p p(y y1 1|y|y2 2=120=120)p(yp(y1 1 =175=175,y y2 2 =120)=p=120)=p( y y1 1 =175=175)* * p p(y y |y|y =175=175)p(yp(y1 1 ,y y2 2 )=p)=p( y y2 2 )* * p p(y y1 1|y|y2 2)=p=p( y y1 1 )* * p p(y y2 2|y|y1 1)统计独立时的概率:因为统计独立时的概率:因为 p p(y

43、 y1 1|y|y2 2)= p= p(y y1 1) 代入上式得代入上式得p(yp(y1 1 ,y y2 2 )=p)=p( y y2 2 )* * p p(y y1 1)两个以上事件共同发生的概率两个以上事件共同发生的概率统计相依时的概率统计相依时的概率: :独立同分布假定假定y y1 1,y y2 2,y y3 3为统计独立的为统计独立的, ,则则p(yp(y1 1 ,y,y2 2 , y, y3,3,)=p)=p( y y1 1)* * p p(y y2 2)* * p p(y y3 3)假定假定y y1 1,y y2 2,y y3 3 -是同分布的是同分布的( (密度曲线同密度曲线同

44、) )n n个观测可以称为独立同分布的个观测可以称为独立同分布的y y1 1,y y2 2,y y3 3 -就像是来自于单一概率密度函数就像是来自于单一概率密度函数p p( y y)所代表的所代表的某个固定总体的随机抽样而产生的某个固定总体的随机抽样而产生的NIIDNIID分布分布: :如果这个共同的总体分布为正态如果这个共同的总体分布为正态, ,称为正态独立同分布称为正态独立同分布随机变量随机变量, ,它可以被刻画为一个抽样它可以被刻画为一个抽样, ,表示来自于一个密度函数表示来自于一个密度函数p(y)p(y)所代表的总体所代表的总体概率的三个例子1.航空保险卖保险航空保险卖保险,20元一张

45、元一张,飞行事故是百万分之一飞行事故是百万分之一,赔偿金赔偿金是是80万元万元,问航空公司从每张票上赚多少钱问航空公司从每张票上赚多少钱?2.租赁工程机械租赁工程机械1天为天为500元元,晴天可以赚晴天可以赚700元元,下雨天没有的下雨天没有的赚赚,假设下雨的概率是假设下雨的概率是0.4,请问这生意做不做请问这生意做不做? 元元7000.6 500*0.4220元离散性概率运用离散性概率运用(数学期望数学期望)3.离散性概率运用离散性概率运用(数学期望数学期望)甲100*(1/2+(1/2)*(1/2)75法郎乙100*(1/2)*(1/2)25法郎概率的三个例子甲乙十大统计学基本概念十大统计

46、学基本概念数据类型数据类型自由度自由度置信区间置信区间试验误差试验误差重复性重复性&再现性再现性中心极限定理中心极限定理位置效应位置效应散度效应散度效应分布分布概率概率 波动 偶然原因(Common cause)2 52 01510507 57 06 5S a m p le N u m b e rSample MeanX - B a r C h a r t f o r P r o c e s s AX= 7 0 . 9 1U C L = 7 7 . 2 0L C L = 6 4 . 6 2“偶然原因(得到了管理)引起的波动,可长期稳定地维持某一特偶然原因(得到了管理)引起的波动,可长期稳定地维

47、持某一特定形态(分布)。定形态(分布)。过程的输出才是可以预测的过程的输出才是可以预测的. .波动 特殊原因2 52 01510508 07 06 05 0S a m p le N u m b e rSample MeanX -B a r C h a rt fo r P ro c e s s BX = 7 0 .9 8U C L = 7 7 .2 7L C L = 6 4 .7 0(未得到很好管理)引起的波动,引起过程不稳定的要素。(未得到很好管理)引起的波动,引起过程不稳定的要素。不是始不是始终作用于过程的变差的原因终作用于过程的变差的原因. .用用85MPH的稳定速度在高速公路上驾车的稳定

48、速度在高速公路上驾车。 。一般原因一般原因特殊原因特殊原因小组练习小组练习请列表总结下述过程的一般原因和特殊原因请列表总结下述过程的一般原因和特殊原因。 。波动原因类型分析波动原因分析 答案一般原因一般原因 高速公路的倾斜高速公路的倾斜 风的阻力风的阻力 踩离合器的力度踩离合器的力度 驾驶者对速度的判断驾驶者对速度的判断 测量工具测量工具( (速度计速度计) )特殊原因特殊原因 堵车堵车 机械故障机械故障 高速公路巡查高速公路巡查用用85MPH的稳定速度在高速公路上驾车的稳定速度在高速公路上驾车。 。小组练习小组练习请列表总结下述过程的一般原因和特殊原因请列表总结下述过程的一般原因和特殊原因。

49、 。试验误差的几种表达试验误差:当一种操作或一个试验在尽可能接近相同条件的情况下 重复进行时,所的的观测结果的偏差。它的产生有多种多样的原因 1.测量误差 2.分析误差 3.抽样误差 4.材料批次不同、操作人员不同、环境条件不同等 5.人为错误系统好坏的衡量,简单的说,试验误差越小越好 1.偏差系数 / 2.信躁比 S/N试验误差是客观存在的试验误差是客观存在的,要分析各种误差要分析各种误差-统计学的分析对象统计学的分析对象重复性和再现性重复性和再现性是测量系统分析的两个重要指标!重复性和再现性是测量系统分析的两个重要指标!重复性重复性:数据群的数据群的 离散程度离散程度再现性再现性:数据群相

50、对目标值的数据群相对目标值的 偏差程度偏差程度重复性和再现性看一下直观图象更容易明白看一下直观图象更容易明白! !十大统计学基本概念十大统计学基本概念数据类型数据类型自由度自由度置信区间置信区间试验误差试验误差重复性重复性&再现性再现性中心极限定理中心极限定理位置效应位置效应散度效应散度效应分布分布概率概率 置信区间用于表达抽样样本发生变化用于表达抽样样本发生变化, ,其统计特征量的变化范围其统计特征量的变化范围( (确切程度确切程度) )抽样抽样100次次,有有95次母集次母集团真值会落在怎样的团真值会落在怎样的范围内范围内?这个范围叫置信区间这个范围叫置信区间反映总体反映总体(母集团母集团

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 其他资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com