chap10基础数据分析.ppt

上传人:qwe****56 文档编号:69501084 上传时间:2023-01-05 格式:PPT 页数:36 大小:195KB
返回 下载 相关 举报
chap10基础数据分析.ppt_第1页
第1页 / 共36页
chap10基础数据分析.ppt_第2页
第2页 / 共36页
点击查看更多>>
资源描述

《chap10基础数据分析.ppt》由会员分享,可在线阅读,更多相关《chap10基础数据分析.ppt(36页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第十章第十章 基础数据分析基础数据分析用于营销调研的统计分析类型用于营销调研的统计分析类型类类型型说说 明明例例 子子统计统计概念概念描述描述数据数据压缩压缩 描述典型的被描述典型的被访问访问者,描述回答者,描述回答类类似似程度程度 均均值值、中位数、中位数、众数、众数、频频率分率分布、布、标标准差准差推理推理 决定决定总总体参数,体参数,检验检验假假设设估估计总计总体体值值标标准准误误差、零假差、零假设设差差别别 确定确定组组与与组组之之间间是否存在差异是否存在差异 估估计计一个一个样样本中两本中两组组均均值值的差异的的差异的统统计计重要性重要性 差差别别的的T检验检验,方差分析方差分析联联

2、合合确定确定联联系系 确定两个确定两个变变量是否量是否再系再系统统下相关下相关相关性、交叉表相关性、交叉表预测预测 预测预测以以统计统计模型模型为为基基础础 给给出出X数量,估数量,估计计Y的水平的水平时间时间序列、回序列、回归归分分析析10.1 统计学的非专业构成统计学的非专业构成 从非统计专业的学生学习的角度来看,统计学原理可以分为四个大的从非统计专业的学生学习的角度来看,统计学原理可以分为四个大的组成部分:组成部分:1调查与实验设计调查与实验设计调查与实验设计涉及到统计中获得原始数据的各种方法。调查是调查与实验设计涉及到统计中获得原始数据的各种方法。调查是在社会经济统计中获得原始数据的主

3、要手段。随着市场经济的发展,在社会经济统计中获得原始数据的主要手段。随着市场经济的发展,调查在经济活动中所起的作用越来越大,企业的经营,政府的决策,调查在经济活动中所起的作用越来越大,企业的经营,政府的决策,都离不开来自调查的第一手数据。都离不开来自调查的第一手数据。在科学研究过程中,获得统计数据的手段还包括实验方法。实验在科学研究过程中,获得统计数据的手段还包括实验方法。实验是在研究对象进行一定控制的情况下获得数据的方法。是在研究对象进行一定控制的情况下获得数据的方法。2描述统计描述统计描述统计包括整理、显示和分析数据的一系列方法。调查或者实描述统计包括整理、显示和分析数据的一系列方法。调查

4、或者实验中所获得的有关事物整体的原始资料,往往是零乱和不系统的,需验中所获得的有关事物整体的原始资料,往往是零乱和不系统的,需要经过一系列的统计处理,才能转化为人们可以直接阅读和理解的信要经过一系列的统计处理,才能转化为人们可以直接阅读和理解的信息。这种息。这种针对事物整体数据的统计处理工作,被称为描述统计。针对事物整体数据的统计处理工作,被称为描述统计。3推断统计推断统计在有些情况下,人们获得的统计资料并非事物整体的在有些情况下,人们获得的统计资料并非事物整体的状况,而是来自事物的一个局部。如果利用局部的数据去状况,而是来自事物的一个局部。如果利用局部的数据去推断整体的情况,以及这种推断的有

5、效性和可靠性如何,推断整体的情况,以及这种推断的有效性和可靠性如何,即是推断统计所要研究的内容。即是推断统计所要研究的内容。4多元统计分析多元统计分析在统计课程设计中,多元统计分析是一个独立的部分,在统计课程设计中,多元统计分析是一个独立的部分,主要涉及到对多变量情况的研究。例如,描述一个人的能主要涉及到对多变量情况的研究。例如,描述一个人的能力,需要从科研能力、动手能力、组织能力等多个方面进力,需要从科研能力、动手能力、组织能力等多个方面进行综合判断,如果对涉及多个变量的统计问题进行研究,行综合判断,如果对涉及多个变量的统计问题进行研究,即为多元统计的内容。多元统计根据掌握信息的不同,也即为

6、多元统计的内容。多元统计根据掌握信息的不同,也可分为多元描述统计和多元推断统计,但基本方法大多需可分为多元描述统计和多元推断统计,但基本方法大多需要涉及到矩阵等工具,属于统计学原理中要求较高的部分。要涉及到矩阵等工具,属于统计学原理中要求较高的部分。10.2 术语解释术语解释(1)数据压缩)数据压缩通过计算较少的数据集合中数量来通过计算较少的数据集合中数量来描述数据的过程。描述数据分析是数据压缩的通常方描述数据的过程。描述数据分析是数据压缩的通常方法。法。数据压缩的四种功能数据压缩的四种功能概括:将原始数据转换成一些有意义的计算结果的过概括:将原始数据转换成一些有意义的计算结果的过程。如程。如

7、10分制下,马自达公司的马爱德轿车德平均分制下,马自达公司的马爱德轿车德平均得分是得分是8.2分,我们已经得到对该轿车德欢迎程度的分,我们已经得到对该轿车德欢迎程度的概括。概括。概念化概念化:统计调研的量所表达的内容的想象。意味:统计调研的量所表达的内容的想象。意味着对统计量的表达内容的洞察。如最近一次调查的分着对统计量的表达内容的洞察。如最近一次调查的分数范围是数范围是72-86分,那么我们可以想象得出你的同学分,那么我们可以想象得出你的同学在考试中得成绩,范围如果是在考试中得成绩,范围如果是25-98分,你的想象就分,你的想象就有很大的不同。有很大的不同。沟通沟通:是一种翻译过程,将统计分

8、析结果变成一种可:是一种翻译过程,将统计分析结果变成一种可以理解的形式。以理解的形式。内推内推:样本的调查结果可以被添加或被用于估计总体:样本的调查结果可以被添加或被用于估计总体的真实值的真实值(2)推理分析推断统计推理分析推断统计(3)差别分析确认数据间的差异程度,如高收入和差别分析确认数据间的差异程度,如高收入和低收入受访者之间的使用信用卡的行为是否存在显著低收入受访者之间的使用信用卡的行为是否存在显著差异等。差异等。(4)联合分析研究变量间的系统相关性。联合分析研究变量间的系统相关性。(5)预测分析对未来事件进行预测。预测分析对未来事件进行预测。10.3 描述性统计分析描述性统计分析 1

9、0.3.1 中心趋势量中心趋势量基本目标是给出对一个问题的最典型的回答基本目标是给出对一个问题的最典型的回答A 众数众数一种描述统计量,是一串数字中出现最多一种描述统计量,是一串数字中出现最多次数的标志值。次数的标志值。方法:先把每个数字在串中的频数或频率列表,然后方法:先把每个数字在串中的频数或频率列表,然后容易找出容易找出注意:众数不一定需要多数回答。注意:众数不一定需要多数回答。B 中位数中位数一组有序值中居中的那个数值。一组有序值中居中的那个数值。中位数提供了更多的信息,因为众数出现在任何位置,中位数提供了更多的信息,因为众数出现在任何位置,而中位数只出现在中间。而中位数只出现在中间。

10、C 平均数平均数平均数在数列中接近于典型值。平均数在数列中接近于典型值。考虑了所有数据,因而信息比中位数更多考虑了所有数据,因而信息比中位数更多 10.3.2 变化性的量变化性的量仅仅考虑中心趋势量是不够的,电子购物的调查可能仅仅考虑中心趋势量是不够的,电子购物的调查可能显示,均值为显示,均值为5,但一个调查者可能一月,但一个调查者可能一月20次通过网次通过网络购物,因此了解顾客的多样性可能更有助于企业找络购物,因此了解顾客的多样性可能更有助于企业找到自己的重点客户,从而制定有效营销策略。到自己的重点客户,从而制定有效营销策略。A 频率分布频率分布均值与百分率分布一起可以解释有关特点的消费模式

11、均值与百分率分布一起可以解释有关特点的消费模式国家国家啤酒啤酒葡萄酒葡萄酒烈性酒烈性酒总计总计澳大利澳大利亚亚114.621.32.8138.7新西新西兰兰114.814.44.3133.5英国英国108.616.04.3128.9美国美国89.79.06.8105.5加拿大加拿大82.210.26.699.0芬芬兰兰61.78.77.077.4瑞典瑞典46.811.75.263.7挪威挪威47.55.13.556.1日本日本40.60.86.047.4平均数平均数78.510.85.294.5人均消费量:升人均消费量:升 容易看出:容易看出:(1)将最后一栏比较,很容易看出消费量高和低的国家

12、将最后一栏比较,很容易看出消费量高和低的国家(2)单独看葡萄酒和烈性酒。葡萄酒:)单独看葡萄酒和烈性酒。葡萄酒:美国人低于平均美国人低于平均消费水平,瑞典则高于这个数字。而两者的酒类消费总量消费水平,瑞典则高于这个数字。而两者的酒类消费总量与啤酒消费总量的相对位置刚好反过来。日本人的葡萄酒与啤酒消费总量的相对位置刚好反过来。日本人的葡萄酒消费是很低的,但烈性酒消费高于平均水平。澳大利亚是消费是很低的,但烈性酒消费高于平均水平。澳大利亚是啤酒和葡萄酒、酒类人均消费最高的国家,拥有最低的人啤酒和葡萄酒、酒类人均消费最高的国家,拥有最低的人均烈性酒消费量。均烈性酒消费量。居民不同酒类支出占酒类总支出

13、的比例居民不同酒类支出占酒类总支出的比例国家国家啤酒啤酒葡萄酒葡萄酒烈性酒烈性酒总计总计澳大利澳大利亚亚62.621.715.7100新西新西兰兰57.219.323.5100英国英国53.419.227.4100美国美国51.511.936.6100加拿大加拿大39.216.244.6100芬芬兰兰37.513.748.8100瑞典瑞典26.818.854.4100挪威挪威42.814.442.8100日本日本38.031.230.8100平均数平均数45.418.536.1100则:澳大利亚与新西兰、美国与英国,酒类产品平均则:澳大利亚与新西兰、美国与英国,酒类产品平均多于一般花费在啤酒上

14、,而在加拿大、芬兰与瑞典和多于一般花费在啤酒上,而在加拿大、芬兰与瑞典和挪威占有较低的百分比,这些国家烈性酒的消费接近挪威占有较低的百分比,这些国家烈性酒的消费接近于他们酒类平均消费的一般。于他们酒类平均消费的一般。日本人日本人在葡萄酒上的花费相应多一些。在人均消费量在葡萄酒上的花费相应多一些。在人均消费量较低的情况下,是否意味着日本市场的葡萄酒价格很较低的情况下,是否意味着日本市场的葡萄酒价格很高?高?B 极差(全距)极差(全距)C标准差标准差 C 标准差标准差之所以之所以(n-1)是为了实现对标准差的无偏差估计。是为了实现对标准差的无偏差估计。假定分布是钟形的,标准差可让我们想象这些代表假

15、定分布是钟形的,标准差可让我们想象这些代表性的回答与平均数有多相似或不相似性的回答与平均数有多相似或不相似2(xi-x)n-1P10.4 描述分析的职业道德问题描述分析的职业道德问题 统计表不会说谎,但说谎者会利用统计表统计表不会说谎,但说谎者会利用统计表。所所说说的的话话意思是意思是可能的可能的误误解解常常规规的回答是的回答是.这这个回答比个回答比别别的回答多的回答多大多数甚至所有人能大多数甚至所有人能都都给给出了出了这样这样的回答的回答大半人回答大半人回答超超过过一半的回答一半的回答大多数甚至所有人能大多数甚至所有人能都都给给出了出了这样这样的回答的回答较较多人回答多人回答这这个回答超个回

16、答超过过其他回答,其他回答,但比例不到但比例不到50大半的被提大半的被提问问者者给给出出这样这样的回答的回答中中间间回答是回答是一半的人的回答在其下而一半的人的回答在其下而另一半的回答在其上另一半的回答在其上大多数回答者大多数回答者给给出出这这样样的回答的回答 中中间间回答是回答是一半的人的回答在其下而另一半的人的回答在其下而另一半的回答在其上一半的回答在其上大多数回答者大多数回答者给给出出这样这样的回答的回答 平均的回答是平均的回答是所有的被所有的被访问访问者回答的算者回答的算术术平均数平均数大多数回答者大多数回答者给给出出这样这样的回答或者非常接近的回答或者非常接近这这个回答个回答在在这这

17、些回答中有些回答中有一些一些变变化化被被访问访问者者给给出了种种回答,出了种种回答,回答是多回答是多样样的,其中一些有的,其中一些有一致性一致性被被访问访问者之者之间间没有一致没有一致性性无效的数无效的数值值在分在分析析时时就省略了就省略了被被访问访问者未回答的不包括在者未回答的不包括在内,因此内,因此问题问题的的样样本大小被本大小被压缩压缩了了考考虑虑到未回答到未回答问题问题的被的被提提问问者,做了者,做了调调整,但整,但样样本大小不受影响本大小不受影响标标准差是准差是.按照按照标标准差公式准差公式计计算所得的算所得的数数值值不理解不理解为避免误解的产生,为避免误解的产生,1.准备定义调研术

18、语的手册并提供给委托人准备定义调研术语的手册并提供给委托人2.统计概念的定义包含在分析报告中首次被提到的地统计概念的定义包含在分析报告中首次被提到的地方。方。3.脚注与注释包含在表格与图形中,以便解释说明使脚注与注释包含在表格与图形中,以便解释说明使用的统计概念。用的统计概念。10.5 交叉表与关联分析交叉表与关联分析l非单调关联是这样一种关系:一个变量的存在非单调关联是这样一种关系:一个变量的存在(或不存或不存在)和另一个变量的存在(或不存在)系统上的关联。在)和另一个变量的存在(或不存在)系统上的关联。非单调的基本意思是联系之间没有内在方向性,但关联非单调的基本意思是联系之间没有内在方向性

19、,但关联确实存在。确实存在。l例如:麦当劳在实践中发现,顾客在早上一般要一杯咖例如:麦当劳在实践中发现,顾客在早上一般要一杯咖啡,中午一般要一杯软饮料。但这种关联决不是没有意啡,中午一般要一杯软饮料。但这种关联决不是没有意外不保证顾客总在早上要咖啡而在中午要软饮料。外不保证顾客总在早上要咖啡而在中午要软饮料。这种非单调关联只是简单地说明早上的顾客倾向于购买这种非单调关联只是简单地说明早上的顾客倾向于购买鸡蛋、饼干和鸡蛋、饼干和咖啡咖啡,而中午的顾客则倾向于买汉堡包、,而中午的顾客则倾向于买汉堡包、油炸食品和油炸食品和软饮料软饮料。10080604020购买咖啡购买咖啡购买软饮料购买软饮料午餐购

20、买者早餐购买者l单调型关系指调研者可以在总体上指出两个变量关单调型关系指调研者可以在总体上指出两个变量关联的方向,但无法指出随着一个变量变化时,另一联的方向,但无法指出随着一个变量变化时,另一个变量的精确变化值。个变量的精确变化值。有两种类型的单调关联:增加型和减少型。单调增有两种类型的单调关联:增加型和减少型。单调增加关系是一个变量随着另一个变量的增加而增加,加关系是一个变量随着另一个变量的增加而增加,另外的则是相反。另外的则是相反。如我们知道年龄大的儿童比年龄小的儿童需要的鞋子如我们知道年龄大的儿童比年龄小的儿童需要的鞋子的尺码大,但是没有一种办法可根据儿童的年龄计算的尺码大,但是没有一种

21、办法可根据儿童的年龄计算出适用的尺码。因为儿童的脚的增长速度没有一个普出适用的尺码。因为儿童的脚的增长速度没有一个普遍的规律。我们只知道年龄小的儿童在购买决策中影遍的规律。我们只知道年龄小的儿童在购买决策中影响力小,往往由父母陪同购买。年龄大的儿童在决策响力小,往往由父母陪同购买。年龄大的儿童在决策中有大的影响,儿童年龄和父母陪同买鞋子的次数存中有大的影响,儿童年龄和父母陪同买鞋子的次数存在单调递减关系,因而这种关系是单调的。在单调递减关系,因而这种关系是单调的。下面是一个用卡方分析的威恩图(下面是一个用卡方分析的威恩图(VENN)的例子。)的例子。图中白领工人用右边的圆表示,蓝领领工人用左边

22、圆图中白领工人用右边的圆表示,蓝领领工人用左边圆形表示。一个较大的圆形表示整个啤酒市场。在较大形表示。一个较大的圆形表示整个啤酒市场。在较大的圆形内有一个小圆形,表示买一特定品牌啤酒的的圆形内有一个小圆形,表示买一特定品牌啤酒的人。这个品牌是米切罗波淡啤酒。表示白领工人的圆人。这个品牌是米切罗波淡啤酒。表示白领工人的圆形面积比蓝领工人大,换句话说,白领工人买米切罗形面积比蓝领工人大,换句话说,白领工人买米切罗波淡啤酒的比蓝领个人多。波淡啤酒的比蓝领个人多。米切罗波淡啤酒购买者米切罗波淡啤酒购买者 蓝领蓝领工人工人 白领工人白领工人所有淡啤酒购买者所有淡啤酒购买者l交叉表可以用来评估两个名义变量

23、之间是否存在非单调型关系。交叉表可以用来评估两个名义变量之间是否存在非单调型关系。米切罗波淡啤酒米切罗波淡啤酒频频率表率表职业职业买买不不买买总计总计白白领领1528160蓝领蓝领142640合合计计16634200原表百分率原表百分率频频率表率表职职业业买买不不买买总计总计白白领领76(152)4(8)80(160)蓝领蓝领7(14)13(26)20(40)合合计计83(166)17(34)100(200)频频率表率表职业职业买买不不买买总计总计白白领领92(152)24(8)80(160)蓝领蓝领8(14)76%(26)20%(40)合合计计100%(166)100%(34)100%(20

24、0)列百分率表列百分率表频频率表率表职业职业买买不不买买总计总计白白领领95(152)5(8)100(160)蓝领蓝领35(14)65(26)100(40)合合计计83(166)17(34)100(200)行百分率表行百分率表可以看出,在非买者中可以看出,在非买者中24%是白领,是白领,76%是蓝领。与此相是蓝领。与此相反买者反买者92%是白领,是白领,8%是蓝领。对于白领工人,是蓝领。对于白领工人,95%是是买者,买者,5%是非买者。在表中几个不相等的个体百分率集是非买者。在表中几个不相等的个体百分率集群说明了存在非单调型关系的可能性。如果我们发现大约群说明了存在非单调型关系的可能性。如果我

25、们发现大约25%的样本分在每一个单元上,说明不存在关联的样本分在每一个单元上,说明不存在关联白领和白领和蓝领是和不是该啤酒的消费者的概率相等。但是如果个体蓝领是和不是该啤酒的消费者的概率相等。但是如果个体较大的集群在两个特定的单元中,说明该啤酒较大可能性较大的集群在两个特定的单元中,说明该啤酒较大可能性消费者是白领工人,同时也有个趋势,非消费者是蓝领工消费者是白领工人,同时也有个趋势,非消费者是蓝领工人人。换句话说,在这个特定的样本中,职业状况和个体的。换句话说,在这个特定的样本中,职业状况和个体的啤酒消费行为之间可能存在关联啤酒消费行为之间可能存在关联10.6 充分利用各种图表充分利用各种图

26、表 一图抵千字一图抵千字例如:乐凯胶卷分析报告节选例如:乐凯胶卷分析报告节选l1、有关年龄的问题,有效答案为、有关年龄的问题,有效答案为1871个,有效率个,有效率99.9,其中,其中2235岁这个年龄段所占的人数最多,约占岁这个年龄段所占的人数最多,约占有效样本量的有效样本量的65.0。这种情况说明,这种情况说明,中国资产新闻中国资产新闻(报纸调查)(报纸调查)报的报的读者可能主要是这一年龄段的人,而且这个年龄段的读者可能主要是这一年龄段的人,而且这个年龄段的读者也比较关注乐凯的发展,详见表读者也比较关注乐凯的发展,详见表3和图和图1 人数人数有效百分有效百分比比22岁岁以以下下22-351

27、21665.035-5050岁岁以以上上合合计计l影响乐凯彩卷消费的因素影响乐凯彩卷消费的因素 彩卷消费时与一定的生活水平和消费水平相联系的。彩卷消费时与一定的生活水平和消费水平相联系的。影响彩卷消费的因素很多,对于乐凯这一品牌的彩卷来影响彩卷消费的因素很多,对于乐凯这一品牌的彩卷来说,我们列示了七个影响消费的因素,调查结果显示,说,我们列示了七个影响消费的因素,调查结果显示,考虑考虑“价格低廉价格低廉”这一因素的人很多,占了被调查者总这一因素的人很多,占了被调查者总数的数的33.3,也就是说,对于消费乐凯彩卷的人来说,也就是说,对于消费乐凯彩卷的人来说,有三分之一的主要是因为其价格因素而消费

28、的,而受有三分之一的主要是因为其价格因素而消费的,而受“媒体报道和媒体报道和 广告宣传影响广告宣传影响”、“熟人推荐熟人推荐”两个因素的两个因素的影响则显得那么微不足道,分别只占了影响则显得那么微不足道,分别只占了4.5和和2.6,可见乐凯彩卷在质量已接近国际知名品牌的同时,应加可见乐凯彩卷在质量已接近国际知名品牌的同时,应加强广告宣传和树立起良好的口碑。详见表强广告宣传和树立起良好的口碑。详见表7-33和图和图2。表表-影响乐凯彩卷的因素影响乐凯彩卷的因素人数(人)人数(人)有效百分比()有效百分比()价格低廉价格低廉支持国支持国货货质质量量优优异异尝试尝试使用使用受媒体宣受媒体宣传传或广告宣或广告宣传传影响影响随随处处可以可以买买到到熟人推荐熟人推荐其他其他合合计计图图2 影响乐凯彩卷消费的因素图影响乐凯彩卷消费的因素图334.5%2.6%本章小结本章小结

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com