常用统计量数讲稿.ppt

上传人:石*** 文档编号:50405608 上传时间:2022-10-15 格式:PPT 页数:82 大小:1.35MB
返回 下载 相关 举报
常用统计量数讲稿.ppt_第1页
第1页 / 共82页
常用统计量数讲稿.ppt_第2页
第2页 / 共82页
点击查看更多>>
资源描述

《常用统计量数讲稿.ppt》由会员分享,可在线阅读,更多相关《常用统计量数讲稿.ppt(82页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、关于常用统计量数第一页,讲稿共八十二页哦描述统计(descriptive statistics)描述统计对数据特征进行描述数据的两个主要特征中心位置离散性第二页,讲稿共八十二页哦Outline第一节 集中量数一、算术平均数二、几何平均数三、中数与众数第二节 差异量数一、平均差二、方差与标准差三、差异系数第三节 地位量数一、百分位分数二、百分等级分数第三页,讲稿共八十二页哦第一节 集中量数一、算术平均数二、几何平均数三、中数与众数第四页,讲稿共八十二页哦集中量数集中量数对数据的集中趋势的度量确定一组数据的代表值第五页,讲稿共八十二页哦常用的集中量数算术平均数 mean加权平均数几何平均数geom

2、etric mean中数median众数mode第六页,讲稿共八十二页哦问题某部门有5名一般职员和1名经理。一般职员的薪水是3000元,而经理的薪水是10000元,请问该部门收入的平均水平是多少?第七页,讲稿共八十二页哦算术平均数:可简称为平均数或均数,是用以度量次数分布集中趋势及位置最常用的集中量数。(一)总体平均数与样本平均数(二)加权平均数第八页,讲稿共八十二页哦(三)算术平均数的性质1.每一个观测值加上一个相同常数C,其平均数为原来的平均数加常数C2.每一个观测值乘以一个相同常数C,其平均数为原来的平均数乘常数C3.每个观测值都乘以一个相同常数c,再加上一个常数d后,计算得到的平均数等

3、于原平均数乘以该常数c再加上常数d4.观测值与平均数的差(离均差)的总和等于零5.观测值与任意常数C的离差平方和不小于观测值与平均数的差的平方和。-离差平方和最小,样板平均数是总体平均数的最佳估计。第九页,讲稿共八十二页哦算术平均数的优点反应灵敏,确定严密,简明易解,计算简便并能作进一步的代数演算,是应用最普遍的一种集中量数。适用情境:数据准确可靠,且又同质,需要每一个数据都能加入计算,同时还要作进一步的代数运算时,一般都用算术平均数表示集中趋势。易受极端数据影响、出现模糊数据和存在不同质数据时无法计算第十页,讲稿共八十二页哦几何平均数适用条件:1.一组数据中任何两个相邻数据之比接近于常数,即

4、数据按一定比例关系变化。在教育与心理研究中,求平均增长率或对心理物理学中的等距与等比量表实验进行数据处理,均应使用几何平均数。2.当一组数据中存在极端数据时,分布呈偏态,算术平均数不能很好地反映数据的典型情况,此时应使用几何平均数或其他集中量数(如中数、众数)来反映数据的典型情况。第十一页,讲稿共八十二页哦(一)几何平均数的基本公式第十二页,讲稿共八十二页哦(二)几何平均数在教育与心理研究中的应用1.心理物理学中等距与等比量表实验的数据处理2.平均增长率的计算第十三页,讲稿共八十二页哦(一)中数中数又称中位数,符号记为Mdn。中数是指位于一组数列中中间位置的那个数,它可以是数列中的某一个原始数

5、据,也可以不是原始数据而是通过计算得到的一个数。总之,如果将一组数据按大小排列,则中数一定是将数据个数平均分为大小相等两部分的那个数。中数的特点:计算简单,不受极端数据影响,但由于是根据数据的相对位置来确定的,在计算时不是每个数据都加入,从而有较大的抽样误差,不如平均数稳定,且会流失很多的被试信息,同时,中数难以作进一步的代数运算第十四页,讲稿共八十二页哦(二)众数众数又称为范数,常用Mo表示。众数指次数分布中出现次数最多的那个数的数值。适用条件:当一组数据中出现不同质的情况,或分布中出现极端数据时,常用众数作为集中量数的粗略估计。计算众数的皮尔逊经验法:Mo3Mdn2M第十五页,讲稿共八十二

6、页哦众数Mode,Mo众数:一组数据中出现次数最多的数如2、3、5、3、4、3、6的众数为3如果次数分布最多的有两个数,而且两个数是相邻的,那么一般取两者的平均值作为众数;如果这两个数不相邻,那么一般需要报告两个众数,而且认为该组数据是bimodal双峰分布的第十六页,讲稿共八十二页哦第二节 差异量数一、平均差二、方差与标准差三、差异系数第十七页,讲稿共八十二页哦离中趋势的度量 数据离中趋势是表示数据分散程度的一组统计量,反映的是各变量值远离其中心值的程度。表示数据离中趋势的测度有:平均差、方差、标准差、四分位差、极差(全距)、变异系数等。第十八页,讲稿共八十二页哦一、平均差(Mean dev

7、iation)1.定义:也称平均离差,次数分布中所有原始数据与平均数举例的绝对值的平均,用AD表示。2.计算公式平均差的数学性质不是最优的,在实际应用中应用较少。第十九页,讲稿共八十二页哦二、方差(Variance)与标准差(Standard deviation)方差与标准差事最经常用于描述次数分布离散程度的差异量数。(一)总体方差与总体标准差(二)样本方差与样本标准差(三)标准差的合成(四)方差与标准差的意义第二十页,讲稿共八十二页哦方差与标准差的定义方差:每个数据与该组数据平均数之差乘方后的均值,即离均差平方和的平均数。标准差:方差的算术平方根,表示一列数据的平均差距。第二十一页,讲稿共八

8、十二页哦(一)总体方差与总体标准差总体方差的表示:总体标准差的表示:第二十二页,讲稿共八十二页哦(二)样本方差与样本标准差样本方差的表示:样本标准差的表示:样本方差为什么要除以(n1)与自由度(degrees of freedom)有关。自由度是数学名词,在统计学中,n个数据如不受任何条件的限制,则n个数据可取任意值,称为有n个自由度。若受到k个条件的限制,就只有(nk)个自由度了。计算样本方差时,n个变量值本身有n个自由度。但受到样本均数的限制,任何一个“离均差”均可以用另外的(n1)个“离均差”表示,所以只有(n1)个独立的“离均差”,因此只有(n1)个自由度。第二十三页,讲稿共八十二页哦

9、(三)标准差的合成方差具有可加性。在已知几个组方差或标准差的情况下,可以计算她们的总方差或总标准差。-只有在应用同一种观测手段,对不同样本的统一特质进行测量时才能使用。标准差的合成,:总平均数;:各小组的平均数i第二十四页,讲稿共八十二页哦练习表 4 个学习小组的竞赛成绩学习小组nSA20808B18757C16708D2070674第二十五页,讲稿共八十二页哦(四)标准差的性质1.每一个观测值都加一个常数c后,计算得到的标准差等于原标准差。2.每一个观测值都乘以一个常数c,则所得的标准差等于原标准差乘以这个常数。3.每个观测值都乘以同一个常数c(c0),再加上一个常数d,所得标准差等于原标准

10、差乘以这个常数c。第二十六页,讲稿共八十二页哦方差和标准差的优缺点(1)反应灵敏;(2)计算严密;(3)受抽样变动影响小(1)不太容易理解;(2)易受极端数值影响;(3)有个别数值模糊不清时,无法计算。方差和标准差是表示一组数据离散程度的最好指标。值越大,说明次数分布的离散程度越大。第二十七页,讲稿共八十二页哦三、差异系数(Coefficient of variation)1.差异系数也叫变异系数,它是一种相对差异量,常用CV表示。是一组数据的标准差与其相应的均值之比。2.计算公式第二十八页,讲稿共八十二页哦差异系数的适用情境变异系数指出了标准差相对于平均值的大小,用于比较不同总体或样本数据的

11、离散程度。(1)同一团体不同测量的变异的比较,如相同班级不同科目的变异的比较;-两个或两个以上样本所测的特质不同(2)不同团体同一测量的变异的比较,如不同年级同一科目变异大小的比较。-两个或两个以上样本所测的特质相同,但样本间的水平相差较大。第二十九页,讲稿共八十二页哦练习1 已知某小学一年级学生的平均体重为25公斤,体重的标准差是3.7公斤,平均身高110厘米,标准差位6.2厘米,问体重与身高的离散程度哪个大?2 通过同一个测验,一年级学生的平均分数为60分,标准差为4.02分,五年级学生的平均分数为80分,标准差为6.04分,这两个年级的测验分数中哪一个分散程度大?第三十页,讲稿共八十二页

12、哦全距(range)也称两极差,是一组数据的最大值与最小值之差。R=max(Xi)-min(Xi)第三十一页,讲稿共八十二页哦差异系数Coefficient of variation变异系数指出了标准差对于平均值的大小,用于比较不同总体或样本数据的离散程度。同一样本不同测量的变异的比较,如相同班级不同科目的变异的比较;不同样本同一测量的变异的比较,如不同年级同一科目变异大小的比较。第三十二页,讲稿共八十二页哦第三节 地位量数一、百分位分数二、百分等级分数第三十三页,讲稿共八十二页哦百分位分数百分位分数是一种相对地位量数,它是次数分布中的一个点。把一个次数分布排序之后,分为100个单位,百分位分

13、数就是次数分布中相对于某个特定百分点的原始分数,它表明在次数分布中特定个案百分比低于该分数。用Pm表示,其中m是特定百分点。eg.P30=60,表明在该次数分布中有30%的个案低于60分。第三十四页,讲稿共八十二页哦计算第p百分位步骤第一步:从小到大排列原始数据第二步:计算指数i i=(p/100)n,n为项数,p为所求的百分位的位置第三步:若i不是整数,将i向上取整;若i是整数,则第p百分位数是第i项与第 i+1 项数据的平均值例:有12个职员薪金的数据,求第85和第50百分位数。解:(1)将12个数据从小到大排序如下:2210 2225 2350 2380 2380 2390 2420 2

14、440 2450 2550 2630 2825 (2)i=(p/100)n=(85/100)12=10.2 (3)由于i=10.2不是整数,向上取整,所以第85百分位数对应的是第11项,其值为2630。同理,计算第50百分位(中位数)。i=(50/100)12=6,是整数,第50百分位数是第6项和第7项的平均值,即(2390+2420)/2=2405。第三十五页,讲稿共八十二页哦百分位分数的计算1.组下限:2.组上限:第三十六页,讲稿共八十二页哦二、百分等级分数百分等级分数是一种相对地位量数。百分等级分数与百分位分数不同,是事先知道分布中的一个原始分数,再求这个原始分数在分布中所处的相对位置-

15、百分等级。用PR表示。一个原始分数的百分等级分数,定义为次数分布中低于这个原始分数的次数百分比。百分等级分数指出原始数据在常模团体中的相对位置,百分等级越小,原始数据在常模团体中的相对位置越低;百分等级越大,原始数据在常模团体中的位置越高。第三十七页,讲稿共八十二页哦百分位等级分数的计算公式第三十八页,讲稿共八十二页哦表 某市招干考试分数分布表分数分组次数累积次数累积百分数90-9458-8980-8475-7970-7465-6960-6455-5950-5445-4940-4435-3930-3425-2920-2415-1910-145-90-4132751709813413112514

16、9136134126138139147151982671900188718601809173916411507137612511102966832706568429282131337100.0099.3297.8985.2191.5386.3779.3272.4265.8458.0050.8443.7937.1629.8922.5814.846.891.740.37P9073.52X=82,PR96.28第三十九页,讲稿共八十二页哦百分位量表的特点百分位分数和百分等级分数称为百分位量表。优点:计算简便、意义明确、对各种测验普遍适用。缺点:是一个顺序量表,不具有相等单位,从而不能作进一步的数学运

17、算,无法作进一步的统计分析;另外,由于百分位量表的分布呈长方形,当测验分数的分布为正态或接近正态时,百分位量表将夸大分布中间的原始分数的差异而缩小分布两端的原始分数的差异。第四十页,讲稿共八十二页哦第四节 相关分析一、相关系数及其解释(一)相关:事物间存在联系但又不能作出因果关系的解释(二)相关系数及其解释二、常用相关分析方法及计算第四十一页,讲稿共八十二页哦事物之间的关系因果关系、共变关系和相关关系因果:A B下雨地上会湿共变:C A,C B 严格的说不叫相关,只是A和B之间有某些共同点婴儿身高和树苗高度的关系相关:指两类现象在发展变化的方向和大小方面存在一定的关系,不能确定是否为因果关系广

18、告费支出与商品销售额的关系第四十二页,讲稿共八十二页哦相关的判定1.散点图2.统计分析第四十三页,讲稿共八十二页哦散点图(a)完全正相关(b)完全负相关(c)无相关关系(d)非线性关系(e)正相关(f)负相关第四十四页,讲稿共八十二页哦散点图 scatter diagram第四十五页,讲稿共八十二页哦第四十六页,讲稿共八十二页哦第四十七页,讲稿共八十二页哦第四十八页,讲稿共八十二页哦(一)相关系数及其解释1.相关系数的取值范围:-1,1(1)正相关Vs.负相关-只表示方向(2)相关程度的大小:相关系数的值2.有相关不一定有因果第四十九页,讲稿共八十二页哦二、常用相关分析方法及其计算(一)积差相

19、关系数(二)等级相关1.斯皮尔曼等级相关2.肯德尔W系数(肯德尔和谐系数)(三)质量相关1.点双列相关2.双列相关第五十页,讲稿共八十二页哦积差&协方差1.积差的定义 :成对变量的离差乘积。2.积差的表示3.协方差(covariance):积差的平均数 第五十一页,讲稿共八十二页哦(一)积差相关系数积差相关系数又称积矩相关系数,是英国统计学家皮尔逊提出的一种计算相关系数的方法,故也称皮尔逊相关。这是一种求直线相关的基本方法。记作:rxy。它是利用离差乘积的关系来说明事物的关系,是将原始记分转换为离差乘积(即积差),再转换为标准积差后所求得的标准积差的平均数。积差相关系数实际上就是成对变量标准积

20、差的算术平均数。第五十二页,讲稿共八十二页哦积差相关系数的使用条件(1)两列变量都是等距的或等比的测量数据(2)两列变量所来自的总体必须是正态的或近似正态的对称单峰分布(3)两列变量必须具备一一对应关系第五十三页,讲稿共八十二页哦积差相关系数的计算1.均数已知3.利用原始数据2.标准差已知第五十四页,讲稿共八十二页哦表 5名学生身高和体重的测查结果编号实测记分离差记分积差标准记分标准积差身高体重XY11707203001.50.00216569-500-0.4100.00315066-20-3601.63-1.52.44418070101100.820.50.4151856815-1-151.

21、22-0.5-0.6185034500552.24第五十五页,讲稿共八十二页哦等级相关的界定等级相关是根据两列顺序变量数据中各对等级数据的差数来计算相关系数的方法。对于连续变量的数据,必要时可分别把两列数据按大小顺序赋给名次等级,进而采用等级相关法计算相关系数。等级相关法因变量个数的多少而有用于分析两列变量相互关系的斯皮尔曼等级相关和用于分析多列变量相互关系的肯德尔和谐系数和肯德尔一致性系数。第五十六页,讲稿共八十二页哦1.斯皮尔曼等级相关斯皮尔曼等级相关(Spearmans correlation coefficient for rank data)是英国心理学家、统计学家斯皮尔曼根据积差相

22、关的概念推导出来的,是通过两列变量的成对等级差数来计算相关系数,又叫“等级差数法”,用符号rR或rs表示。斯皮尔曼等级相关适用于两列具有等级顺序的测量数据,或总体为非正态的等距、等比数据。第五十七页,讲稿共八十二页哦斯皮尔曼等级相关的基本公式-无相同等级 Di:二列成对变量的等级差数N:等级个数1.等级差数法2.等级序数法第五十八页,讲稿共八十二页哦练习表 2位教育专家对5篇论文的评价结果编号rxryDD201020304052541343125-223-1-24491420第五十九页,讲稿共八十二页哦观测变量有相同等级的处理 在观测变量没有相同等级时能够保证RX=RY,RX2=RY2。如果观

23、测变量出现相同等级时RX=RY,但RX2RY2。R2随相同等级数目的增多而有规律地减少。t:相同等级的数目第六十页,讲稿共八十二页哦2.肯德尔W系数(和谐系数)肯德尔W系数又称为肯德尔和谐系数,是表示多列等级变量相关程度一种方法,适用于两列以上等级变量。第六十一页,讲稿共八十二页哦肯德尔W系数的适用资料1.K个评分人评价N个被评价人或N件作品,以分析和评价K个评分人的评价是否一致2.同一个人先后K次评价N个被评人或N件作品,以分析其前后评价是否一致第六十二页,讲稿共八十二页哦肯德尔W系数的计算公式-无相同等级K:评定者的数目R:K个评定者对同一个被评事物所给予的等级之和N:被评定事物的数目SS

24、:R的离差平方和第六十三页,讲稿共八十二页哦有相同等级的W系数n:相同等级的数目第六十四页,讲稿共八十二页哦对W系数的说明1.取值范围:W0,12.相关方向:从实际资料中进行分析。3.相关程度 (1)若K个评价者意见完全一致,则W1;若K个评价者的意见存在一定关系,单又不完全一致,则0W1;若K个评价者的意见完全不一致,则W0。(2)SS越小,评价的一致性程度越低;SS越大,评价的一致性程度越高。第六十五页,讲稿共八十二页哦练习第六十六页,讲稿共八十二页哦第六十七页,讲稿共八十二页哦质量相关一列变量按事物的某一属性划分种类,而另一列变量则为等比或等距的侧脸数据,这种情况下求得的相关,称为质量相

25、关。第六十八页,讲稿共八十二页哦计算相关系数时应注意的问题相关系数受样本容量n的影响如果n很小,可能完全没有相关的两事物,却计算出较大的相关系数。一般以n大于30为宜计算相关系数要求成对数据 没有线性相关,不一定没有关系,可能是非线性的相关系数的计算不受以下因素影响互换两个变量第六十九页,讲稿共八十二页哦2.3 质量相关 P66一列变量为正态的等距或比例数据,另一列变量为类别变量,求两列变量的直线相关,称为质量相关。点二列相关二列相关多系列相关第七十页,讲稿共八十二页哦1.点双列相关点双列相关适用于双列变量中一列变量为来自正态总体的等距或等比的测量数据,另一列为二分称名变量,即按事物的某一性质

26、只能分为两类相互独立的变量,如,男女,文盲与非文盲。第七十一页,讲稿共八十二页哦2.3.1 点二列相关 缩写PBpoint-biserial correlation适用条件两列变量中一列为等距或等比的测量数据而且总体分布为正态,另一列变量为二分的类别变量。应用点二列相关多用于编制是非测验题评价测验内部一致性等问题。注:每个题目(二分类别变量)与总分(数值)变量的相关,称为每个题目的区分度。相关高说明该题答对答错与总分的一致性高,即区分度高。第七十二页,讲稿共八十二页哦点双列相关的计算公式第七十三页,讲稿共八十二页哦练习第七十四页,讲稿共八十二页哦2.双列相关双列相关系数适用于两列变量均来自正态

27、总体的等距(比)变量,而其中一列被人为地划分为两个类别的数据。双列相关常作为问答题或主观题的区分度指标。第七十五页,讲稿共八十二页哦二列相关 biserial correlation适用条件两列变量都为正态等距(比例)变量,但其中一列变量被人为地划分成两类。应用教育和心理测量中问答题的区分度指标二列相关与点二列相关的主要区别在于二分变量是否正态。第七十六页,讲稿共八十二页哦二列相关的计算第七十七页,讲稿共八十二页哦练习 下表为10名考生一次测验的卷面总分和一道回答题的得分,试求该问答题的区分度(该回答题满分为10分,因此得6分以上则视为通过)。考生编号A测验总分75577365675663616567某题得分7674744476表 10名考生的测验成绩 解:回答题得分被认为划分为通过和不通过两类,应求二列相关。N=10,Sy=6.12,p=0.6,q=0.4,Xp=67.33,Xq=61.25。查正态分布表:当p=0.60时,y=0.3866。第七十八页,讲稿共八十二页哦品质相关当RC列联表c2检验结果显著,表明两个变量之间有关联,这种相关称为品质相关(计数数据之间的相关)f相关系数列联相关四分相关第七十九页,讲稿共八十二页哦f相关系数 phi coefficient第八十页,讲稿共八十二页哦列联系数第八十一页,讲稿共八十二页哦感感谢谢大大家家观观看看第八十二页,讲稿共八十二页哦

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com