Minitab实战6043.docx

上传人:you****now 文档编号:68882913 上传时间:2022-12-30 格式:DOCX 页数:83 大小:2.18MB
返回 下载 相关 举报
Minitab实战6043.docx_第1页
第1页 / 共83页
Minitab实战6043.docx_第2页
第2页 / 共83页
点击查看更多>>
资源描述

《Minitab实战6043.docx》由会员分享,可在线阅读,更多相关《Minitab实战6043.docx(83页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、minitab操作有些时候我们在复制数据进入minitab后,由于分析的需要,需要对数据的排列进行处理,我们会有很多偷懒的方法,先看看下图的命令菜单。l 它们分别为堆叠栏、堆叠栏块、堆叠行。针对下图的数据据我们在选择上面面的堆叠栏时时,出现如图图的对话框,并并如图输入指指令时,堆叠行的对话框框操作基本与与堆叠栏相同同,输出的不不同可以根据据附图看出。堆叠的操作在很多的分析中可以应用,如方差分析、测量系统分析、控制图等等。l 转换栏操作1有些时候我们的的数据需要从从栏的顺序结结构转换为行行的结构,这这时可以使用用转换栏操作作,如图。l 转换栏操作2利用转换栏的操操作,针对下下图1的数据据,进行图

2、22的对话框操操作后的结果果如图1。=将A、BB栏的数据转转换为行的格格式。转换栏前后数据据l 按序排列数据有有时为了分析析和观察的方方便,需要将将数据按某栏栏的数据大小小进行排列,这这是可以使用用sort命命令,对话框框如图。针对图1的数据据按图2对话话框操作以后后的数据排列列效果如图11。l 栏运算1在进行行minittab分析时时,有时需要要对数据进行行简单的运算算或函数运算算,完成这个个功能的菜单单操作如图11,出现的对对话框及简要要的操作方法法如图2。sample针针对图中的CC1栏进行简简单运算和对对数运算的结结果如图。l 行、栏统计1我我们有时需要要对某一栏或或行的数据进进行一些

3、基本本统计,执行行如图菜单可可帮帮你。在执行菜单后出出现的对话框框如图,此命命令一次只提提供一个基本本统计参数的的运算,包括括:均指、和和、方差、极极值、缺失数数据等,然后后输入需要计计算的栏或行行所在栏组就就可以了。l 标准化操作标准准化结合与分分布概念应该该不是一个陌陌生的名词,mminitaab的操作菜菜单如图。从出现的对话框框来看,miinitabb提供5种标标准化的方法法:1.减去去均值并除以以标准差;22.减去均值值;3.除以以标准差;44.减去指定定的值并除以以指定的值;5.将数据据标准化,使使得数据变化化在某个范围围内。什么是标准化结结合?是标准准化操作,例例如将均值为为,标准

4、差差为的正态态分布转化为为标准正态分分布,其操作作就是(x-)/,这这个应用是很很重要的。各各种常见的标标准化操作上上面讲的5种种,但应用第第一种居多。l 生成模板数据有有时我们在进进行输入数据据的时候,有有些数据是呈呈现某种规律律的,但一个个个输入就显显得比较麻烦烦,我们可以以试试生成模模板数据这个个操作,菜单单操作如图。生成模板数据共共有5种:11.等距数据据的生成2.自定义数列列数据的生成成3.自定义义文本数据的的生成4.等等距日期数据据的生成5.自定义日期期数据的生成成等距数据的的操作如图11,例如生成成简单的1到到3的数据,间间距为1,每每个数据重复复2次,总体体重复两次,按按图1操

5、作后后,输出结果果如图2。生成自定义数列列数据的对话话框如图,例例如生成数列列为1、3、99的数据,每每个数据重复复2次,总体体重复两次,按按图1操作后后,输出结果果如图2。对于其它几种模模板数据的生生成方式,操操作基本与上上面讲述的对对话框操作及及生成结果相相似,例如自自定义文本数数据的生成,就就是在Texxt vallues (e.g., red lighht bluue)框中中输入要生成成的文本数列列就可以了,如如a、b、cc。l 生成随机数据进进行随机抽样样或生成各种种分布的随机机数据,可以以进行一些验验证分析和抽抽样分析,其其菜单操作如如图。选择上面菜单的的Samplle Froom

6、 Collumns,出出现进行随机机抽样的对话话框及操作如如图1。例如如我们要从总总体为1-110的数据中中随机抽取55个样本,则则在Sampple _ rowws froom collumn(ss)中输入55,并给出总总体数据1-10所在栏栏,选择存储储位置,选择择是否重复抽抽样等后,输输出结果如图图2。如果抽抽取的样本量量大于总体数数据量,就必必须选择Saample with replaacemennt,也就是是允许重复抽抽样,例如从从1-10中中抽取12个个数据,输出出如图2。生成随机数菜单单的后续选项项主要就是生生成服从各种种分布的随机机数据,其输输入的内容主主要是:1.生成分布数数据

7、的样本量量为多少2.存储数据的的栏3.确定定分布的参数数值给定,如如正态分布的的均值和标准准差,卡方分分布的自由度度,F分布的的分子和分母母自由度。以以下是生成卡卡方分布的示示例:1.样样本量为1002.生成110组,分别别存储于C11-C1033.自由度给给定为5对话话框的输入和和数据输出结结果如图。其其它的分布数数据生成类似似。l 很多时候我们因因为没有现成成的分布概率率表,所以无无从查起,mminitaab中提供了了这个功能,如如附图所示菜菜单操作,它它提供了多种种分布的概率率密度函数值值、累积概率率密度及分位位数值得计算算。在出现的的对话框中,请请求选择的也也是这三个值值,任君选择择,

8、三个值得得图形含义见见附图2。示例需求标准正正态分布的均均值位置的累累积概率。对对话框输入如如图,结果如如下:Cummulatiive Diistribbutionn Funcction Normaal witth meaan = 00 and standdard ddeviattion = 1xP(X=x0 0.5示例2需计算标标准正态分布布的0.9分分位数,操作作如图,输出出结果如下:Inverrse Cuumulattive DDistriibutioon Funnctionn Normmal wiith meean = 0 andd stanndard deviaation = 1P(

9、X BBasic Statiisticss Grraphiccal Suummaryy,其对华框框输入很简单单,如图1,例例如对以下数数据的分析,分分析结果如图图2。datte20.66760200.4807720.2338819.5027119.2977122.33003177.7818819.9003720.3809220.0544620.00162200.7074421.3227620.5386119.6199618.99708199.9232220.3448320.6612220.6077718.00273199.9562219.5554720.6370221.6433120.2290

10、4200.7241119.2221419.9852119.029991-Samplle ZSttat Basicc Stattisticcs 11-Sampple Z单单样本Z检验验,假设检验验的一种,检检验样本的均均值水平,总总体的标准差差已知(一般般来源于可靠靠有效的历史史数据结果或或某些特殊场场合)的情况况。例如针对对以下数据,检检验原假设为为样本均值等等于34,检检验的对话框框操作如图。date30.108530.134829.116731.398030.363230.146031.388830.430830.654731.045630.494629.555431.423031.961

11、930.547429.290029.760630.512531.106129.694829.546129.801628.872730.445529.864930.556330.051728.671830.304731.4132minitab输出结果为,P值近似为0,说明拒绝原假设,均值不等于34。One-Sample Z: date Test of mu = 34 vs not = 34The assumed standard deviation = 1Variable N Mean StDev SE Mean 95% CI Z Pdate 3030.28870.8032 0.1826(29.

12、9309, 30.6466)-20.330.000点击1-sammple tt testt对话框的ooptionns,弹出对对话框如图,其其中可以自行行输入置信度度水平和选择择假设检验的的备择假设形形式。1-samplle t ttest单样样本t检验与与单样本Z检检验虽然在操操作上比较相相同,但其应应用是不同的的,单样本tt检验主要针针对总体标准准差未知的情情况。针对上上例的数据,采采用1-saamplet检验,操操作如图,结结果如下:OOne-Saample T: daate Teest off mu = 34 vvs nott = 344Variaable N Meaan SStDevS

13、E MMean 95% CI T Pdaate 30020.08020.94415 0.17119(119.72886, 200.43188)-880.980.0000(opttions复复选对话框的的操作意义相相同)2-samplle t ttestSttat Basicc Stattisticcs 22-Sampple t双双样本t检验验,比较两个个水平是否有有显著差别或或者两个水平平的大小比较较问题。在进进行检验时,首首先确定数据据的正态性和和方差其性,因因为双样本tt检验是在总总体呈正态分分布的基础上上进行的,而而且方差不同同检验的方法法也不同。假假设对以下数数据的检验,先先验证正态性

14、性及方差齐性性,然后进行行双样本t检检验,菜单操操作如图。输输出结果如下下,我们从pp值可以得出出结论,两个个工厂间存在在显著的差别别。Two-Samplle T-TTest aand CII: 甲工厂厂, 乙工厂厂 Two-samplle T ffor 甲工工厂 vs 乙工厂 N MeaanSttDevSE Meean甲工厂厂10 50.25 1.18 00.37乙工工厂10055.1750.6622 0.21DDifferrence = mu (甲工厂) - muu (乙工厂厂)Estiimate for ddifferrence:-4.92678895% CCI forr difffer

15、encce:(-5.822624, -4.022731)TT-Testt of ddifferrence = 0 (vs noot =): T-Vaalue = -11.51PP-Valuue = 00.000DF = 18Booth usse Poooled SStDev = 0.99573甲工工厂 乙乙工厂49.2619 54.4834551.19888 555.9788651.11832 56.11006500.06211 544.6117751.13369 55.1223750.7307 55.1400449.29337 554.6922551.77491 54.33854477.90

16、311 566.0615549.96637 55.17736对话框的补充11.提供3种种数据输入形形式 数据在一栏栏,水平标志志在一栏,选选择Sampples iin onee coluumn,在SSamplees中输入数数据所在栏,在在Subsccriptss输入水平标标志。 两个水平平的数据分别别在两栏,选选择Sampples iin diffferennt collumns,在在Firstt和secoond中分别别输入两个水水平数据所在在的栏。 已知两两个水平的样样本量、均值值和标准差而而没有详细的的样本数据,则则选择Summmarizzed daata,在SSamplee sizee、

17、Meann、Stanndard deviaation中中分别输入两两个水平的样样本量、均值值和标准差。2.Assume equal variances选项,如果两个水平方差相等,则点选此项,否则不选,minitab将执行不同的分析方法。3.graphs复选对话框,选择将出现如图1的对话框,可以选择生成置信区间图或箱线图。4.options复选对话框,选择将出现如图2的对话框,可以确定分析的置信度水平,以及检验时的水平间的差值和备选假设的模式。注意这是的备择假设模式如果是大于或小于是,minitab默认将第一个样本放在前面,第二个样本放在后面。Paired t在介绍成成对t检验前前,先将以下下成

18、对t检验验的概念* 我们在进进行2 saample t检验时,差差异仅由因素素水平不同引引起,但有时时候却并不是是这样,那就就是除了因素素水平不同引引起的差异外外(我们要检检验的),那那就是每次实实验还受另外外一个变量的的影响,也就就是说,这个个变量对每次次实验的两个个水平的影响响相同,但对对多次实验之之间的影响就就有区别,这这时候就不能能简单的将两两个水平的样样本进行比较较,而是对两两个水平的差差值进行比较较,这样就将将另外的变量量的影响排出出了,计算的的结果也就可可靠,就好像像控制图内组组内和组间的的概念,因素素水平的影响响就反映在组组内(若干个个同一次实验验)了。 举举个通俗的例例子,我

19、们要要比较两种鞋鞋底的耐磨程程度,于是选选择20个人人进行实验,每每个人两只脚脚分别穿一种种鞋底作的鞋鞋,在这里,我我们可以看到到,除了两种种鞋底的不同同引起的耐磨磨效果不同外外,20个人人体重的不同同也是一个影影响,这是要要单独的考量量鞋底不同的的影响,就要要排除体重这这个变量,怎怎么办呢,成成对T检验,就就是这样一个个概念,将每每个人的磨损损情况做差值值进行分析。*菜单操作Stat Basic Statistics Paired t如图只要了解了paairet t 与 22 sampple t 的区别,其其对话框的操操作类似,数数据分别存储储在两个栏内内,在对话框框直接选择进进入firss

20、t 和 ssecondd复选框内就就可以。grraph、ooptionn操作意义相相同。1.如如何进行等方方差检验后续续会讲到及mminitaab操作2.方差等和不不等是2saample t 检验有有何不同请看看附图,主要要是统计参数数和自由度的的计算不同。1 Propoortionn单比例P检检验菜单操作作:Statt Baasic SStatisstics 1 PProporrtion主主对话框如图图1数据输入入两种 Samplles inn coluumns:将将检查结果数数据直接输入入 Suummariized ddata:输输入检查总数数在Numbber off triaals,输入

21、入合格总数在在Numbeer of eventts。opttions对对话框如图22 Coonfideence llevel:置信度水平平 Teest prroporttion:检检验比率 Alteernatiive:备择择假设模式 Usee testt and interrval bbased on noormal distrributiion:在正正态分布的基基础上检验(一一般样本量较较大的场合)2 Propoortionns双样本PP检验,菜单单操作如图出现的对话框操操作如图。举举例对下例数数据进行检验验,是否存在在显著差别。由由于检查数据据分别在两栏栏,我们选择择Samplles in

22、n diffferentt coluumns输入入数据。saample11 saample220 111 000 000 000 001 000 000 000 000 11检验结果如如下Testt and CI foor Twoo Propportioons: ssamplee1, saample22 Evennt = 11VariaableX NNSammple ppsamplle1 21000.22000000samplle2 21000.22000000Diffeerencee = p (sampple1) - p (samplle2)Esstimatte forr diffferen

23、cce:0095% CCI forr diffferencce:(-0.3550609, 0.3550609)Test for ddifferrence = 0 (vs noot = 00):ZZ = 0.00PP-Valuue = 11.000* NOTEE * Thhe norrmal aapproxximatiion maay be inacccuratee for smalll sampples.样本量太少少,结果不可可靠Fishhers exactt testt: P-VValue = 1.0000简单的的从P值来看看,认为两者者没有显著差差别。点击主对话框的的optioons,将出

24、出现如图的对对话框,其内内容如图1。其中是否选择 use a pooled estimate of p for the test,计算方法不同,其区别如图22 Variaances双双样本方差齐齐性检验主要要比较两个样样本的方差检检验,菜单操操作如图。检检验模型为HH0:1=1H1:11双样本方差检验验的对话框如如图1。 Sammples in onne collumn:数数据存储在一一栏内,那么么数据输入SSamplees框中,数数据标志输入入Subsccriptss中。 Sampples iin diffferennt collumns:两个样本的的数据分别在在两栏内,则则分别将两栏栏数据

25、的栏号号输入Firrst、Seecond。 Summarized data:将两个样本数据的样本量和方差分别输入Sample size、Variance。 *option对话框可以设置置信度水平,Storage对话框可以选择存储两个样本的标准差、方差或置信上下限。示例S1 S2 30.2441 29.323831.0379 30.086627.9622 30.384329.9718 31.447231.1175 31.102029.7028 30.620729.2911 28.979229.5267 29.300230.5728 30.484432.2077 30.630430.4481 31

26、.049829.3376 29.155931.5307 29.155129.4860 30.329130.1718 30.494930.1388 30.257429.4959 30.902231.5960 27.921429.9977 30.229329.9297 30.7134分析结果如图2包括正态分布基础上的检验结果(F-Test),和其它任何连续数据分布的检验结果(Levenes Test)。从P值来看,检验结果都无差别。Normaliity Teest正态性性检验通过抽抽样样本检验验总体是否为为正态分布。mminitaab提供了33种检验方法法,分别为AAndersson-Daarli

27、ngg(美国)、RRyan-JJoinerr(中国)、KKolmoggorov-Smirnnov(俄罗罗斯)可供选选择。另外可可以在正态概概率图上画出出参考线,可可以在Perrcentiile liines中输输入特定的值值即可实现。菜单操作Stat Basic Statistics Normality Test假设对下列数据进行检验。而且想估计不良率的水平,规格为(12,24),运用Anderson-Darling方法检验结果如图。可以从P值看出总体服从正态分布,合格率为0.9477-0.0026=0.9451。date18.900018.454018.441820.967215.91941

28、4.941920.974620.120821.449821.426222.397014.957617.888719.719722.038819.746613.639518.728520.932617.700922.886220.794218.136418.722221.909521.986825.186117.849123.844317.0503Regresssion现实实生活中的许许多现象之间间存在着相互互依赖、相互互制约的关系系,这些关系系在量上主要要有两种类型型:1. 确确定性关系,即即我们所熟悉悉的变量之间间的函数关系系,如圆的半半径R与圆的的面积S之间间就存在确定定的函数关系系;2.

29、 非非确定性关系系,即变量之之间虽然有密密切的关系,但但这种关系却却无法用确定定的函数关系系表达,如人人的年龄与血血压之间有密密切的关系,但但却找不到一一个函数能准准确地表示它它们之间的关关系,变量之之间的这种非非确定性关系系,称为相关关关系.值得注意的的是,即使是是具有确定性性关系的变量量,由于测量量误差的影响响,其表现形形式也具有某某种程度的不不确定性.具有相关关关系的变量量间虽然不具具有确定的函函数关系,但但是通过大量量的观测数据据,可以发现现它们之间存存在一定的统统计规律,数数理统计中研研究这些统计计规律或者说说研究变量之之间相关关系系的方法就是是所谓的回归归分析.它能能帮助我们有有效

30、地从一个个可以控制或或可以精确观观察的变量取取得的值去估估计另一随机机变量所取的的值.如用年年龄估计血压压.miniitab的回回归分析菜单单如图如图主对话框,在Response输入响应变量所在栏在Predictors输入个因子所在栏示例针对一下数据做回归分析,其中HeatFlux为响应,East、South、North为因子HeatFlux East South North271.8 33.53 40.55 16.66264.0 36.50 36.19 16.46238.8 34.66 37.31 17.66230.7 33.13 32.52 17.50251.6 35.75 33.71 1

31、6.40257.9 34.46 34.14 16.28263.9 34.60 34.85 16.06266.5 35.38 35.89 15.93229.1 35.85 33.53 16.60239.3 35.68 33.79 16.41258.0 35.35 34.72 16.17257.6 35.04 35.22 15.92267.3 34.07 36.50 16.04267.0 32.20 37.60 16.19259.6 34.32 37.89 16.62240.4 31.08 37.71 17.37227.2 35.73 37.00 18.12196.0 34.11 36.76 18

32、.53278.7 34.79 34.62 15.54272.3 35.77 35.40 15.70267.4 36.44 35.96 16.45254.5 37.82 36.26 17.62224.7 35.07 36.34 18.12181.5 35.26 35.90 19.05227.5 35.56 31.84 16.51253.6 35.73 33.16 16.02263.0 36.46 33.83 15.89265.8 36.26 34.89 15.83263.8 37.20 36.27 16.71Responsse上述分析的输出出结果为Reegresssion AAnalyssis:

33、 HHeatFllux veersus East, Soutth, Noorth (回回归方程)TThe reegresssion eequatiion issHeatFFlux = 389 + 2.112 Easst + 55.32 SSouth - 24.1 Norrth(回归归系数检验)Predictor Coef SE Coef T PConstant 389.17 66.09 5.89 0.000East 2.125 1.214 1.75 0.092South 5.3185 0.9629 5.520.000North -24.132 1.869 -12.920.000(残差标准差及回

34、归系数平方)S = 8.59782 R-Sq = 87.4% R-Sq(adj) = 85.9%(方差分析)Analysis of VarianceSource DF SS MS F PRegression 3 12833.9 4278.057.870.000Residual Error25 1848.1 73.9Total 28 14681.9Source DF Seq SSEast 1 153.8South 1 349.5North 1 12330.6(异常观测值)Unusual ObservationsObsEast HeatFlux Fit SE Fit ResidualSt Resi

35、d4 33.1 230.70210.20 5.03 20.50 2.94R2237.8 254.50 237.16 4.24 17.34 2.32RR denotes an observation with a large standardized residual.从分析结果看1.方差分析结果P为0说明方程是有意义的,至少有一个因子系数不为0。2.从系数检验来看,South, North 因子与HeatFlux有可靠性关系,但East认为关系不可靠 ,可另外从Seq SS值看出。3.R-Sq、 R-Sq(adj)均为80%以上,说明拟和较好。4.第4、22个观测值异常,因为其超过SSe的两倍

36、。Regresssion选择择主对话框的的graphh复选,选择择four in onne出现如图图1的残差分分析图,我们们怎样来看呢呢?1.从NNormall Probbabiliity Pllot来看,有有可能出现异异常,就是位位于右端的两两点,我们可可以看看到底底是那两个点点呢?让我们们用鼠标左键键点击图形,选选择顶上的bbrush,鼠鼠标箭头会变变成一个手形形选择,然后后选择这两个个可能的异常常点,就会出出现图2的bbrush框框输出,可以以知道这两个个异常点是44和22,这这跟刚才分析析的结果是一一样的。2.从直方图来来看,结果基基本与Norrmal PProbabbilityy Plott结果一致。3.从Residuals Versus the Fitted Values和Residuals Versus the Order of the Data图可以看出,残差有变小的趋势,表明残差可能不是随机的常数。Stepwi

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 电力管理

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com