多元统计分析及SPSS应用优秀PPT.ppt

上传人:1398****507 文档编号:55883545 上传时间:2022-10-31 格式:PPT 页数:43 大小:1.27MB
返回 下载 相关 举报
多元统计分析及SPSS应用优秀PPT.ppt_第1页
第1页 / 共43页
多元统计分析及SPSS应用优秀PPT.ppt_第2页
第2页 / 共43页
点击查看更多>>
资源描述

《多元统计分析及SPSS应用优秀PPT.ppt》由会员分享,可在线阅读,更多相关《多元统计分析及SPSS应用优秀PPT.ppt(43页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、rzhaoorsc.edu session 3 聚类分析 应用多元统计分析及应用多元统计分析及SPSS应用应用 Session 3 统计数据的收集、整理与描述统计数据的收集、整理与描述 Session Topics统计数据的来源统计数据的来源 统计数据的收集统计数据的收集 统计数据的描述统计数据的描述 统计数据的整理统计数据的整理 统计数据的来源一、统计数据的干脆来源来源于管理和探讨须要而特地组织的调查来源于科学试验的数据二、统计数据的间接来源 来源于公开出版物的数据来源于内部调查的数据 统计数据的收集数据的搜集方法数据的搜集方法询问调查询问调查访访访访问问问问调调调调查查查查观察实验观察实验

2、电电电电话话话话调调调调查查查查邮邮邮邮寄寄寄寄调调调调查查查查观观观观察察察察电电电电脑脑脑脑辅辅辅辅助助助助座座座座谈谈谈谈会会会会个个个个别别别别深深深深访访访访实实实实验验验验访问调查访问调查1.调查者与被调查者通过面对面地交谈而获得资料2.有标准式访问和非标准式访问标准式访问通常按事先设计好的问卷进行非标准式访问事先一般不制作问卷邮寄调查邮寄调查1.也称邮寄问卷调查2.是一种标准化调查3.调查者与被调查者没有干脆的语言沟通,信息的传递依靠于问卷4.通过某种方式将调查表或问卷送至某调查者手中,由被调查者填写,然后将问卷寄回指定收集点5.问卷或表格的发放方式有邮寄、宣扬媒介传送、特地场所

3、分发三种电话调查电话调查电话调查电话调查1.调查者利用电话与被调查者进行语言沟通以获得信息2.时效快、成本低3.问题的数量不宜过多 您好您好!我是我是调查公调查公司的调查司的调查员员电脑协助调查电脑协助调查1.又称电脑协助电话调查2.电脑与电话相结合完成调查的全过程3.一般需借助特地的软件进行4.硬件设备要求较高座谈会座谈会1.也称集体访谈2.将一组被调查者集中在调查现场,让他们对调查的主题发表看法以获得资料3.参与座谈会的人数不宜过多,一般为610人4.侧重于定性探讨个别深度访问个别深度访问1.一次只有一名受访者参与、针对特殊问题的调查2.适合于较隐秘的问题,如个人隐私问题;或较敏感的问题,

4、如政治方面的问题3.侧重于定性探讨视察法视察法 1.就调查对象的行动和意识,调查人员边视察边记录以收集所需信息 2.调查人员不是强行介入 3.能够在被调查者不察觉的状况下获得资料试验法试验法1.在设定的特殊试验场所、特殊状态下,对调查对象进行试验以获得所需资料2.有室内试验法和市场试验法统计数据的间接来源统计数据的间接来源 1.公公开开出出版版物物:中国统计年鉴、中国统计摘要、中国社会统计年鉴、中国工业经济统计年鉴、中国农村统计年鉴、中国人口统计年鉴、中国市场统计年鉴、世界经济年鉴、国外经济统计资料、世界发展报告InternetInternet 2.2.网络网络网络网络中国统计中国统计中国统计

5、中国统计年鉴年鉴年鉴年鉴20012001中中中中国国国国人人人人口口口口统统统统计计计计年年年年鉴鉴鉴鉴中中中中国国国国市市市市场场场场统统统统计计计计年年年年鉴鉴鉴鉴世世世世界界界界发发发发展展展展报报报报告告告告世世世世界界界界经经经经济济济济年年年年检检检检工工工工业业业业普普普普查查查查数数数数据据据据中国统计出版社统计数据的整理一、统计分组 依据统计探讨的目的和客观现象的内在特点,按某个标(或几个标记)把被探讨的总体划分为若干个不同性质的 组,称为统计分组。例:某班学生按考试成果分组二、频数分布与频率分布将数据按其分组标记进行分组的过程,就是频数分布和频率分布形成的过程。表示各组的单

6、位的次数称为频数,各组次数与总次数之比称为频率。二、频数分布与频率分布频数分布就是视察值按其分组标记安排在各组内的次数,由分组标记序列和各组相对应的分布次数两个要素构成。由分组标记序列和各组相应的频率构成频率分布。当所视察的次数很多,组距很小并且组数很多时,所绘出的折线图就会越来越光滑,渐渐形成一条光滑的曲线,这种曲线即频数分布曲线,反映了数据的分布规律。三、累积频数分布与频率分布 为了统计分析的须要,有时要视察某一数值以上或某一数值以下频数或频率之和,这就须要绘出累积频数或累计频率。在SPSS 中对下数据进行频数(率)分析1.定义工人编号和加工零件数的变量名分别为NO 和X,然后输入变量NO

7、 和X 的原始数据。2.选择Analyze=Descriptive Statistics=Frequencies.,弹出Frequencies主对话框。现欲X 进行频数分析,在对话框左侧的变量列表中选X,单击按钮使之进入Variable(s)列表框,并选择Display Frequency Tables显示频数分布表。3.可单击Format.按钮弹出Frequencies:Format子对话框 依据数值大小按升序从小到大作频数分布数值大小按降序从大到小作频数分布频数多少按升序从少到多作频数分布频数多少按降序从多到少作频数分布4.可单击Statistics.按钮,弹出Frequencies:St

8、atistics子对话框,并单击相应项目,在作频数表分析的基础上,附带作各种统计指标的描述,特殊是可进行任何水平的百分位数计算。这里不选。5.可单击Charts.钮,弹出Frequencies:Charts子对话框,用户可选三种图形:直条图(Bar chart)、饼图(Pie Charts)和直方图(Histogram)。这里选择Histogram 项,并选择With Normal Curve要求绘制正态曲线。单击Continue按钮返回Frequencies主对话框,再单击OK钮即可得到(累计)频数(频率)分布表和直方图。输出结果频数(率)分布表加工零件数应当留意的是,SPSS 在未特殊指定

9、的情形下,直方图或频数分布表是依据原始数值逐一作频数分布的,这与日常须要的等距分组、且组数保持在确定数目的要求不符。在调用Frequencies统计过程吩咐之前,可先对原始数据进行预处:已知最小值为84,最大值为128,全距为10,故可要求分成5 组,起点为80,组距为10。选择Transform=Recode=Into Different Variable.,在弹出的Recode Into Different Variable对话框中选定X,单击按钮使之进入Numeric VariableOutput Variable列表框,在OutputVariable栏的Name文本框中输入x1,单击C

10、hange按钮表示新生成的变量名为x1。单击Old and New Values按钮弹出Recode Into Different Variable:Old and New Values子对话框,在Old Value选项中单击Range项,输入第一个分组的数值范围:8089,在New value栏内输入新值:80,单击Add按钮.依此将各组的范围及对应的新值逐一输入,最终单击Continue按钮返回,再单击OK按钮即完成。系统在原数据库中生成一新变量为x1,这时再调用Frequencies统计过程将输出等距分组且组数为5 的频数分布表。统计数据的描述 作为统计数据的代表值,一个是分布的中心,反

11、映分布的集中趋势,另一个是分布的形态,反映分布的离散程度。这些代表性的数量特征值精确地描述出不同的统计数据分布。一、分布的中心众数(mode)在正态分布和一般的偏态分布中,分布曲线最高点所对应的数值即是众数。假如没有明显的最高点,众数可以不存在。当然,假如有两个最高点,也可以有两个众数。中位数(median)与分位数中位数是数据排序后,位置在最中间的数值。与中位数相像的还有四分位数(quartiles)、特别位数(decile)和百分位数(percentile)。中位数是将统计分布从中间分成相等的两部分,而四分位数就是将数据分布四等分的三个数值,其中中间的四分位数就是中位数。特别位数和百分位数

12、分别是将数据分布十等分和一百等分的数值。平均数(均值)(mean)平均数是数据集中趋势的最主要测度值三个中心度量的比较二、分布的形态 用于描述数据分布形态即分布关于其中心的波动程度的代表值有:极差、内距、方差和标准等,它们描述了分布的离散程度和差异程度。(一)极差(range)极差也称为全距,是最大值与最小值之间的距离,它是数据离散或差异程度的最简洁测度值,即例如,在前面的数据中,极差为128-84=44(件)。明显,数据的离散程度大,极差就越大。极差虽然很简洁计算,但它只告知我们数据分布范围,至于分布的中间部分是如何变更的则不得而知。而且它受极端值的影响可能是很大的。(二)内距(Inter-

13、Quartile Range,IQR)内距又称为四分位差,是两个四分位数之差,IQR=高四分位数低四分位数。若内距比较小,则说明数据比较集中在中位数旁边;反之则比较分散。内距常和中位数一起用来描述一个定距特殊是定序测量数据的分布。(三)方差(variance)和标准差(standard deviation)方差是离差平方的平均数,即或三、偏度与峰度(一)偏度(skewness)所谓偏度是指反映频数分布偏态方向和程度的测度。在频数分布中,最大集中点以上(频数曲线图横轴上众数的右边)的频数占总频数的一半多,称为右偏或正偏。最大集中点以下(频数曲线图横轴上众数的左边)的频数占总频数的一半多,称为左偏

14、或负偏。偏度的计算公式为:(二)峰度(kurtosis)所谓峰度,是指频数分布曲线高峰的形态,即反映分布曲线的尖峭程度的测度。峰度的计算公式为 当=0 时,表示分布的峰度是正态分布的峰度;当0 时,表示分布曲线的高峰是尖顶高峰;当Descriptive Statistics=Descriptives.,打开Descriptives主对话框。打开Descriptives主对话框。在主对话框左边列表中选定变量X,单击按钮使之进入Variables(s)列表框。(三)单击Options.按钮,打开Descriptives:Options子对话框。选择均值(Mean)、总和(Sum)、标准差(Std.

15、Deviation)、方差(Variance)、极差(Range)、最小值(Minimum)、最大值(Maximum)、偏度(Skewness)和峰度(Kurtosis),选好后单击Continue按钮返回Descriptives主对话框,再单击OK按钮即可得到各种统计量的计算结果。输出结果:以上结果没有给出中位数、众数等统计量,可以在频数(率)分析时增加选项计算相应的统计量,具体操作步骤如下:(一)定义工人编号和加工零件数的变量名分别为NO 和X,然后输入变量NO 和X 的原始数据。(二)选择Analyze=Descriptive Statistics=Frequencies.,弹出Freq

16、uencies主对话框。现欲X 进行频数分析,在对话框左侧的变量列表中选X,单击按钮使之进入Variable(s)列表框,并选择Display Frequency Tables显示频数分布表。(三)单击Statistics.按钮,弹出Frequencies:Statistics子对话框,并单击相应项目。本例中选择均值(Mean)、中位数(Median)、众数(Mode)、总和(Sum)、标准差(Std.Deviation)、方差(Variance)、极差(Range)、最小值(Minimum)、最大值(Maximum)、偏度(Skewness)和峰度(Kurtosis),选好后单击Continue按钮返回Frequencies主对话框,再单击OK按钮即可得到各种统计量的计算结果。输出结果:The End!Enjoy!

展开阅读全文
相关资源
相关搜索

当前位置:首页 > pptx模板 > 商业计划书

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com