信度与效度精选课件.ppt

上传人:石*** 文档编号:65772370 上传时间:2022-12-08 格式:PPT 页数:81 大小:1.40MB
返回 下载 相关 举报
信度与效度精选课件.ppt_第1页
第1页 / 共81页
信度与效度精选课件.ppt_第2页
第2页 / 共81页
点击查看更多>>
资源描述

《信度与效度精选课件.ppt》由会员分享,可在线阅读,更多相关《信度与效度精选课件.ppt(81页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、关于信度与效度第一页,本课件共有81页5.1测评信度及检验5.1 测评效度的概念1、信度概念:测评结果的前后一致性。又称可靠性程度。2、信度系数:用一样本在两种不同时间、不同情景条件下或两组不同评价材料的评定结果之间的相关系数(rxx)。信度系数越大,则说明该测量或评定方法的可靠性越强,反之,则可靠性弱。简单地说信度就是指测量数据和结论的可靠性程度,也就是说测量工具能否稳定地测量到它要测量的事项的程度。第二页,本课件共有81页我们可以举例说明信度的问题:如果想知道某人的体重,我们可以叫两个人来估计,一个人的估计为150镑,另一个人的估计为300镑,那么我们就可以认为,叫别人来估计体重是非常不可

2、信的方法。如果用磅秤,连续测量两次的结果都是相同的,因而我们可以说,在测量体重方面,用磅秤的方法要比叫人来估计更可信。我们可以用信度系数来表示信度的大小。第三页,本课件共有81页 对信度系数要注意三点:对信度系数要注意三点:第一,在不同情况下,对不同样本,采用不第一,在不同情况下,对不同样本,采用不同方法会得到不同的信度系数,因此一个测验可同方法会得到不同的信度系数,因此一个测验可能不止一个信度系数;能不止一个信度系数;第二,信度系数只是对测量分数不一致程度第二,信度系数只是对测量分数不一致程度的估计,并没有指出不一致的原因;的估计,并没有指出不一致的原因;第三,获得较高的信度系数并不是心理测

3、量追求第三,获得较高的信度系数并不是心理测量追求的最终目的,它只是迈向目标的一步,是使测验有效的的最终目的,它只是迈向目标的一步,是使测验有效的一个必要条件。一个必要条件。第四页,本课件共有81页信度系数要达到多高才可以接受呢?信度系数要达到多高才可以接受呢?一般能力与学绩测验的信度系数在一般能力与学绩测验的信度系数在0.90 0.90 以上;以上;人格测验的信度系数通常在人格测验的信度系数通常在0.80 0.80 以上。以上。当当r rxxxx 0.700.70时,不能用测验对个人作评价,也不能在团体间作比时,不能用测验对个人作评价,也不能在团体间作比较;当较;当 r rxxxx 0.70

4、0.70时,可用于团体间比较时,可用于团体间比较;当当r rxxxx 0.85 0.85 时,可用于鉴别个人。时,可用于鉴别个人。第五页,本课件共有81页为何要进行信度的衡量?为何要进行信度的衡量?我们知道在进行测量时,误差是难免的,这就使得真实值和测量值之间是不可能完全一致。我们可以这样来表示真实值和测量值之间的关系。X=T+B+ET表示真实值,B表示偏差即系统误差,E表示测量误差即随机误差。由于系统误差很难分解,因而有些书中的分解式将系统误差包括在真实值之中,因而X可以简单地概括为X=T+E第六页,本课件共有81页5.1.2测评信度的分类测评信度的分类(一)重测信度又称稳定性信度,它用于分

5、析两次间隔一定时间的评定或测定结果之间的相关关系。这种方法通常是重复同样的测量来检验信度信度系数可以用相关系数来表示。假如我们第一次测量时的观测值是X,第二次的观测值是Y,那么重测信度就等于X与Y的相关系数。但重复测量时,我们要注意两次测量的时间间隔要恰当。如果时间间隔太久,可能会发一些变故,影响到被调查者的态度,那么前后的测量就会有很大的差异。第七页,本课件共有81页5.1.2测评信度的分类测评信度的分类(二)折半信度(二)折半信度通常是在无副本且不准备重测的情况下,我们就用折半信度来计通常是在无副本且不准备重测的情况下,我们就用折半信度来计算信度系数。算信度系数。举例来说,如果有一份问卷,

6、其中有十个问题涉及到女性歧视现举例来说,如果有一份问卷,其中有十个问题涉及到女性歧视现象。利用折半信度时,可将是个问题随机分成两组,每组有五个象。利用折半信度时,可将是个问题随机分成两组,每组有五个问题,然后根据每组的测量结果来计算两组的相关系数,就问题,然后根据每组的测量结果来计算两组的相关系数,就是折半信度是折半信度,Rhh。但整个问卷的信度需要用校正公式来得到:。但整个问卷的信度需要用校正公式来得到:Rxx=2Rhh/(1+Rhh)第八页,本课件共有81页5.1.2测评信度的分类测评信度的分类(三)等值信度(复本信度)等值信度是指以两个平行型的测评量表在最短时距内施行两次所的结果的相关系

7、数来评估的。什么是平行型量表:内容、形式和长度相同,难度(即有相同的平均数)和差异程度(相同的标准差)也相同。A型量表B型量表最短时距相关系数为等值信度第九页,本课件共有81页5.1.2测评信度的分类测评信度的分类等值信度的实施技巧:为了抵消测评先后顺序效应,一般要求有一半人先用A型量表进行测定,然后再用B型量表进行测定;另一半人则先用B型,再用A型。二者间隔时间要求保持在最短时距内。其范围为几分钟到几小时。第十页,本课件共有81页5.1.35.1.3影响信度的因素影响信度的因素主体客体第十一页,本课件共有81页 影响信度的主体的因素不严格按照规定实施测验、制造紧张气氛、给予特别协助、评分主观

8、第十二页,本课件共有81页来自客体的影响因素:被试方面:身心健康状况、动机、注意力、持久性、求胜心、作答态度等均随时在变化中测验内容方面:试题取样不当、内部一致性较低、题数过少、题意模糊等施测环境方面:施测现场条件,如通风、温度、光线、噪音、桌面好坏、空间的阔窄等 第十三页,本课件共有81页另外几个重要的影响因素:一、分数分布范围二、测验长度三、测验的难度四、间隔时间第十四页,本课件共有81页 误差变异越大,信度越低。除前面谈到的几种误差来误差变异越大,信度越低。除前面谈到的几种误差来源外,还有以下几个因素会影响信度系数的大小:源外,还有以下几个因素会影响信度系数的大小:一、被试样本(分数分布

9、范围)一、被试样本(分数分布范围)(一)团体的异质性(一)团体的异质性 信度系数受分数的分布范围(全距)的影响,而分数信度系数受分数的分布范围(全距)的影响,而分数范围与被试团体的异质程度有关。一个团体越异质,其分范围与被试团体的异质程度有关。一个团体越异质,其分数范围越大,信度系数也就越高。相反,相对同质的团体数范围越大,信度系数也就越高。相反,相对同质的团体分数则较为均匀。如图所示分数则较为均匀。如图所示:第十五页,本课件共有81页 图中大方框显示的是一个较大的异质团体在两图中大方框显示的是一个较大的异质团体在两次施测中的分数分布次施测中的分数分布,显然有很高的正相关显然有很高的正相关.在

10、小方框在小方框中显示的是一个高度同质的亚团体中显示的是一个高度同质的亚团体,两次分数几乎呈两次分数几乎呈随机变化随机变化,相关接近于零相关接近于零.第十六页,本课件共有81页 (二)团体的平均水平(二)团体的平均水平 对于不同的团体,题目具有不同的难度。每个题目在难度对于不同的团体,题目具有不同的难度。每个题目在难度上的微小差异积累起来便会影响信度。上的微小差异积累起来便会影响信度。例如,同一量表对不同年龄,不同例如,同一量表对不同年龄,不同IQ水平的被试,水平的被试,信度则不尽相同。信度则不尽相同。因此,我们在编制测验量表,抽选被试时,往往要考因此,我们在编制测验量表,抽选被试时,往往要考虑

11、选取不同层次的被试,以使得测验团体呈异质性,从而虑选取不同层次的被试,以使得测验团体呈异质性,从而使得信度提高。反之,当需要同质团体的信度时,就应该使得信度提高。反之,当需要同质团体的信度时,就应该尽量选取同一层次的被试。尽量选取同一层次的被试。第十七页,本课件共有81页 二、题目的数量二、题目的数量 一般说来,在一个测验中增加同质的题目,可以一般说来,在一个测验中增加同质的题目,可以使信度提高。即测验越长,信度越高。这是因为测验使信度提高。即测验越长,信度越高。这是因为测验加长,加大了分数分布的范围,可能改进项目取样的加长,加大了分数分布的范围,可能改进项目取样的代表性,从而能更好地反映受测

12、者的真实水平。即测代表性,从而能更好地反映受测者的真实水平。即测验的项目越多,在每个项目上的随机误差就可以互相验的项目越多,在每个项目上的随机误差就可以互相抵消。抵消。第十八页,本课件共有81页 增加测验长度的效果可以用斯皮尔曼增加测验长度的效果可以用斯皮尔曼布朗公式布朗公式来计算:来计算:rxx=Krxx/1+(K-1)rxx 式式中中,K为为改改变变后后的的长长度度与与原原来来长长度度之之比比,rxx为为原原测测验验的的信信度度,rxx为为测测验验长长度度是是原原来来的的K倍倍时时的的信信度度估估计计。一一般般来来说说,题题目目数数量量对对相相关关系系数数的的影影响响是是递递增增的的。如表

13、所示如表所示题目数量相关系数10 50 100 200 300 400 5000.50 0.83 0.91 0.95 0.968 0.976 0.980第十九页,本课件共有81页 但是,增加测验长度的效果遵循报酬递减率,测但是,增加测验长度的效果遵循报酬递减率,测验过长是得不偿失的,可以通过上式确定一个测验究验过长是得不偿失的,可以通过上式确定一个测验究竟要增长多少才能达到理想的信度水平。竟要增长多少才能达到理想的信度水平。注意:只有当新题目是与原题目选自同一总体,增长注意:只有当新题目是与原题目选自同一总体,增长测验才能改进信度。测验才能改进信度。第二十页,本课件共有81页随堂练习随堂练习

14、1.假设有一份由假设有一份由20题组成的测验,题组成的测验,rxx=0.50,若测验增加同质性题目,若测验增加同质性题目80道,道,则增长后的测验信度则增长后的测验信度rxx是多少?是多少?按照公式:按照公式:rxx=Krxx/1+(K-1)rxx=0.8 第二十一页,本课件共有81页 随堂练习随堂练习2.假设有一个包括假设有一个包括 10个题目的测验,信度为个题目的测验,信度为0.60,若把测验增加到若把测验增加到80个题目,其信度将增加到多少个题目,其信度将增加到多少?3.一个包含一个包含40个题目的测验信度为个题目的测验信度为0.8,欲将信度,欲将信度提高到提高到0.90,需要增加多少题

15、目?,需要增加多少题目?第二十二页,本课件共有81页5.1.4信度检验:计算不同的信度系数 第二十三页,本课件共有81页一、重测信度(稳定性系数)一、重测信度(稳定性系数)(一)定义与计算(一)定义与计算定义定义 用同一种测验,对同一组受试者,前后施测两用同一种测验,对同一组受试者,前后施测两次,再根据受试者两次测验分数计算其相关系数,次,再根据受试者两次测验分数计算其相关系数,即得重测信度。即得重测信度。即测验即测验时距(几分几年)时距(几分几年)再测验再测验 此种信度能表示两次测验结果有无变动,反此种信度能表示两次测验结果有无变动,反映测验分数的稳定程度,故又称稳定性系数。映测验分数的稳定

16、程度,故又称稳定性系数。第二十四页,本课件共有81页 计算方法计算方法 计算使用皮尔逊积差相关公式的变式:计算使用皮尔逊积差相关公式的变式:第二十五页,本课件共有81页(二)误差来源(二)误差来源 1.测验本身:测验所测的特性本身就不稳定,例测验本身:测验所测的特性本身就不稳定,例如情绪。如情绪。2.被试方面:成熟、知识的发展并非人人都被试方面:成熟、知识的发展并非人人都等量增长,且练习因素、记忆效果也存在个体差等量增长,且练习因素、记忆效果也存在个体差异。异。3.施测情境:偶发因素的干扰,如计时错误,施测情境:偶发因素的干扰,如计时错误,情绪波动,健康状况,动机变化等。情绪波动,健康状况,动

17、机变化等。重测信度高,说明分数受被试状况和测验情重测信度高,说明分数受被试状况和测验情境变化影响小。这里题目取样并不影响重测信度。境变化影响小。这里题目取样并不影响重测信度。第二十六页,本课件共有81页所测量的特性必须是所测量的特性必须是 稳定的;稳定的;遗忘与练习的效果相同;遗忘与练习的效果相同;两次施测期间被试的学习效果没有差别。两次施测期间被试的学习效果没有差别。(三)计算重测信度的几个假设(三)计算重测信度的几个假设第二十七页,本课件共有81页 (四)使用重测信度的优缺点(四)使用重测信度的优缺点 优点:优点:能提供有关测验结果是否随时间而变异的资料,能提供有关测验结果是否随时间而变异

18、的资料,可作为预测受测者将来行为的依据。可作为预测受测者将来行为的依据。缺点:缺点:容易受练习和记忆的影响,前后两次施测间容易受练习和记忆的影响,前后两次施测间隔的长短必须适度隔的长短必须适度;第一次尝试所发现的错误也第一次尝试所发现的错误也可能导致第二次反应的变化而增加误差变异。可能导致第二次反应的变化而增加误差变异。第二十八页,本课件共有81页 (五)注意事项(五)注意事项 两次测验的时间间隔要适当。最适宜的时距随两次测验的时间间隔要适当。最适宜的时距随测验目的、性质及被试特点而异;测验目的、性质及被试特点而异;此方法适用于速度测验或人格测验,不适此方法适用于速度测验或人格测验,不适于难度

19、测验;于难度测验;注意提高被试的积极性。注意提高被试的积极性。第二十九页,本课件共有81页 二、复本信度(等值系数)二、复本信度(等值系数)(一)定义与计算(一)定义与计算 1.定义定义 根据一组被试在两个平行(等值)测验上的得分根据一组被试在两个平行(等值)测验上的得分计算相关系数计算相关系数。测验复份测验复份A 测验复份测验复份B 因为它反映的是两个测验之间的等值程度,故又因为它反映的是两个测验之间的等值程度,故又称等值系数。称等值系数。最短时距最短时距第三十页,本课件共有81页 2.计算方法计算方法 AB A B/N r rxxxx =NAB 式中,式中,A A、B B为同一被试在两个测

20、验复份为同一被试在两个测验复份A A、B B上的分数,上的分数,A A 、B B为为A A、B B两型测验的平均分数,两型测验的平均分数,A A、B B为为A A、B B两型测验的标准差,两型测验的标准差,N N为被试人数。为被试人数。第三十一页,本课件共有81页 (二)误差来源(二)误差来源 1.测验两种形式是否等值:测验两种形式是否等值:(1)测题取样是否匹配;)测题取样是否匹配;(2)格式是否相同;)格式是否相同;(3)内容、题数、难度、平均数、标准差是否一)内容、题数、难度、平均数、标准差是否一致。致。2.被试方面情绪波动、动机变化等。被试方面情绪波动、动机变化等。3.测验情境的变化测

21、验情境的变化,偶发因素的干扰。偶发因素的干扰。第三十二页,本课件共有81页 (三)等值测验应符合的条件(三)等值测验应符合的条件 等值测验可避免重测法的缺点,但所使用的必须是等值测验可避免重测法的缺点,但所使用的必须是真正的复本。复本应符合以下条件:真正的复本。复本应符合以下条件:1.各份测验测量的是同一种心理特性;各份测验测量的是同一种心理特性;2.各份测验具有相同的内容和形式;各份测验具有相同的内容和形式;3.各份测验的题目不应有重复的地方;各份测验的题目不应有重复的地方;4.各份测验题目数量相等,并且有大体相等的难度、各份测验题目数量相等,并且有大体相等的难度、区分度;区分度;5.分数分

22、布(平均数和标准差)大致相等。分数分布(平均数和标准差)大致相等。第三十三页,本课件共有81页 (四)注意事项(四)注意事项 1.两个测验必须在项目的内容、形式、数量、两个测验必须在项目的内容、形式、数量、难易、时限、指导语等方面相同或相似;难易、时限、指导语等方面相同或相似;2.两次测验的时间间隔要适当,若太短,由于两次测验的时间间隔要适当,若太短,由于测验太相似被试可能厌倦,若太长可能又会因新测验太相似被试可能厌倦,若太长可能又会因新的学习而产生干扰。的学习而产生干扰。第三十四页,本课件共有81页 (五)使用复本信度的局限(五)使用复本信度的局限 1.只能减少但不能完全消除练习和记忆的影响

23、;只能减少但不能完全消除练习和记忆的影响;2.由于第二个测验只改变了题目的具体内容,由于第二个测验只改变了题目的具体内容,已经掌握的解题原则可以很容易地迁移到同类问题。已经掌握的解题原则可以很容易地迁移到同类问题。3.对许多测验来说,建立复本是十分困难的。对许多测验来说,建立复本是十分困难的。第三十五页,本课件共有81页 三、分半信度三、分半信度 (一)定义和计算(一)定义和计算 在测验无复本且只能施测一次的情况下,通常用在测验无复本且只能施测一次的情况下,通常用分半法估计信度,即将测题分成对等的两半,根据各分半法估计信度,即将测题分成对等的两半,根据各人在这两半测验的分数,用皮尔逊积差相关公

24、式计算人在这两半测验的分数,用皮尔逊积差相关公式计算其相关系数,作为信度指标。其相关系数,作为信度指标。分半信度考察的是两半题目之间的一致性,故这种分半信度考察的是两半题目之间的一致性,故这种信度系数也称内部一致性系数。计算分半信度仍然可信度系数也称内部一致性系数。计算分半信度仍然可用积差相关方法。用积差相关方法。第三十六页,本课件共有81页 (二)分半的方法(二)分半的方法 要计算分半信度,首先是如何将测验分半,要计算分半信度,首先是如何将测验分半,以便得到最接近的可比较的两半。通常采用奇偶以便得到最接近的可比较的两半。通常采用奇偶分半法。使用此方法应注意:分半法。使用此方法应注意:1一组解

25、决同一问题或互相有牵连的题目应尽量一组解决同一问题或互相有牵连的题目应尽量安排在同一半内。安排在同一半内。2当试卷中有任选题时不宜使用分半法,速度测验当试卷中有任选题时不宜使用分半法,速度测验也不宜用。也不宜用。第三十七页,本课件共有81页 (三)校正公式(三)校正公式 分半法求得的相关仅是半个测验分数相关,应使分半法求得的相关仅是半个测验分数相关,应使 用用“斯皮尔曼斯皮尔曼布朗布朗”公式加以校正,藉以估计整个测验的信度。公式加以校正,藉以估计整个测验的信度。1.斯皮尔曼斯皮尔曼布朗公式布朗公式 rxx=2rhh/(1+rhh)其中,其中,rhh为两半分数的相关系数,为两半分数的相关系数,r

26、xx为测验在原长度时为测验在原长度时的信度估计。的信度估计。此法假设:两半测验分数的变异性相等,但实际资料未此法假设:两半测验分数的变异性相等,但实际资料未必符合此假设。必符合此假设。当两半不等值时,即上述假设不满足时,可采用下面两公当两半不等值时,即上述假设不满足时,可采用下面两公式之一:式之一:第三十八页,本课件共有81页例题:例4:有一个由100题构成的量表施测于10个高三学生。测验一次后,应试者即毕业离校。现在怎样评介测验结果的信度?解:因不能再次测验,只能求分半信度。步骤:(1)计算出每个应试者的奇数题总分(X1)和偶数题总分(X2),见下表第三十九页,本课件共有81页得分被试123

27、45678910X138373841403638394035X237373639393438393936第四十页,本课件共有81页 随堂练习随堂练习 1.假设有一份主观幸福感调查表,先后两次假设有一份主观幸福感调查表,先后两次施测于施测于10名学生,时间间隔为半年,结果如表所名学生,时间间隔为半年,结果如表所示,求该测验的重测信度。示,求该测验的重测信度。测验X1 16 15 13 13 11 10 10 9 8 7X2 16 16 14 12 11 9 11 8 6 7被 试 1 2 3 4 5 6 7 8 9 10 第四十一页,本课件共有81页解:用计算器算出S1=2.82,S23.38,

28、把以上数据代入公式,可得 第四十二页,本课件共有81页 2.假设用假设用A、B两型创造力复本测验对初中一两型创造力复本测验对初中一年级年级10个学生施测。结果如表所示,个学生施测。结果如表所示,X1,X2 分别分别代表代表A、B两型测验。求该测验的复本信度。两型测验。求该测验的复本信度。测验 被 试 1 2 3 4 5 6 7 8 9 10X1 20 19 19 18 17 16 14 13 12 10 X2 20 20 18 16 15 17 12 11 13 9第四十三页,本课件共有81页解:先用计算器计算得出以下值:,代入公式可得:第四十四页,本课件共有81页5.2测量的效度及检验测量的

29、效度及检验第四十五页,本课件共有81页案例一 美国杜克能源公司某蒸气站被美国杜克能源公司某蒸气站被12名黑人名黑人雇工告上了法庭,缘由是该公司把他们都当勤杂雇工告上了法庭,缘由是该公司把他们都当勤杂工使用,每天的任务就是扫地和清洁,他们原本工使用,每天的任务就是扫地和清洁,他们原本指望能被提升到像运煤工这样层次更高的岗位上,指望能被提升到像运煤工这样层次更高的岗位上,但公司说他们的智力测验分数不够,而该公司的但公司说他们的智力测验分数不够,而该公司的14个黑人员工中有个黑人员工中有13个做勤杂工,诉讼的理由个做勤杂工,诉讼的理由是智力测验有种族歧视。而公司说没有任何歧视,是智力测验有种族歧视。

30、而公司说没有任何歧视,岗位安排完全根据测验结果来定,没有歧视黑人。岗位安排完全根据测验结果来定,没有歧视黑人。法庭要求公司提供测验对职位胜任的预测力法庭要求公司提供测验对职位胜任的预测力。第四十六页,本课件共有81页案例二 某大学学生期终考试后向校方提出质疑,某大学学生期终考试后向校方提出质疑,说教授给出的考试范围是教科书中的说教授给出的考试范围是教科书中的110章,但考试内容却都集中于前三章,这样的章,但考试内容却都集中于前三章,这样的考试无法检验真实的学习成绩,也就是考试考试无法检验真实的学习成绩,也就是考试并没有提供一个让我展现所学全部知识的机并没有提供一个让我展现所学全部知识的机会。会

31、。第四十七页,本课件共有81页5.2.1 效度概述效度概述定义定义:测评实际上能够测得所测评测评实际上能够测得所测评对象的真实程度对象的真实程度.也就是测评也就是测评本身所能达到期望目标的程度本身所能达到期望目标的程度有多大。有多大。效度反应了测验的准确性效度反应了测验的准确性第四十八页,本课件共有81页 第四十九页,本课件共有81页与目的有关的真分数在实测分数中所占的比与目的有关的真分数在实测分数中所占的比例例 (在实测分数中有效真分数所占的比率在实测分数中有效真分数所占的比率)实测分数实测分数=真分数真分数+误差误差(随机误差随机误差)与目的与目的 与目的与目的 有关有关 无关无关(系统误

32、差系统误差)第五十页,本课件共有81页一个稳定但无效的智力测验一个稳定但无效的智力测验1.你出生在几月份?2.你母亲姓什么?3.1+1=?4.一个星期有几天?5.下面哪个是三角形?A.B.C.第五十一页,本课件共有81页信度与效度的关系信度与效度的关系 信度是效度的必要条件信度是效度的必要条件,但不是但不是充分条件充分条件.要想一个测验的效度高要想一个测验的效度高,其其信度必须得高;但信度高信度必须得高;但信度高,效度未必效度未必高高.第五十二页,本课件共有81页影响效度的误差来源影响效度的误差来源1.测验题目不能反应要测量的特征测验题目不能反应要测量的特征.2.实施过程偏离了标准化的程序实施

33、过程偏离了标准化的程序.3.被试不能如实回答被试不能如实回答.第五十三页,本课件共有81页5.2.1测验效度的类型测验效度的类型效标效度效标效度内容效度内容效度结构效度结构效度第五十四页,本课件共有81页第二节第二节 效标效度效标效度(准则关联效度准则关联效度)什么是效标什么是效标:是假定的客观标准,反应测是假定的客观标准,反应测验目的的行为参照验目的的行为参照.它作为测评有它作为测评有效性的指标。效性的指标。什么是效标效度什么是效标效度:寻求测评结果与某项效标的相寻求测评结果与某项效标的相关程度来度量的效度。也称经验效关程度来度量的效度。也称经验效度或统计效度。度或统计效度。第五十五页,本课

34、件共有81页理想效标的四大条件理想效标的四大条件1.有效性有效性2.可靠性可靠性3.可操作性可操作性4.实用性实用性第五十六页,本课件共有81页预测性和同时性效度预测性和同时性效度预测性效度:测验分数和以后的某个效标预测性效度:测验分数和以后的某个效标之间的相关之间的相关同时性效度:同时获得测验分数和某个效同时性效度:同时获得测验分数和某个效标之间的相关标之间的相关第五十七页,本课件共有81页如何选择效标如何选择效标上级部门或领导的评估上级部门或领导的评估工作实绩工作实绩总结评比的结果总结评比的结果综合标准综合标准第五十八页,本课件共有81页效标效度的计算方法效标效度的计算方法1.相关法相关法

35、 求取测验分数与效标变量之间求取测验分数与效标变量之间的相关程度的相关程度,即效度系数即效度系数.第五十九页,本课件共有81页1)积差相关积差相关 在两组数据都是连续变量在两组数据都是连续变量,且两者存在且两者存在线性关系时使用线性关系时使用公式公式:第六十页,本课件共有81页被被 试试12345678910测验测验(x)20 34 32 47 20 24 27 25 22 16销售额销售额(y)2.53.8340.712.23.52.81.2第六十一页,本课件共有81页2.命中率命中率测验有效性的指标之一就是作出正确测验有效性的指标之一就是作出正确决定的比率决定的比率,即决策的命中率即决策的

36、命中率.效标成效标成绩绩测验预测测验预测失败失败成功成功成功成功(A)失误失误(B)命中命中失败失败(C)命中命中(D)失误失误第六十二页,本课件共有81页第六十三页,本课件共有81页例题某工交公司对240名司机进行了反应速度的测验,用1,8区间的不同数值代表个体反应时的差异。把三年中未发生事故的司机定义为成功,把发生一次以上事故的司机定义为不成功。240人成绩与安全性水平的分布如下表所示第六十四页,本课件共有81页测验成绩成功(未发生)失败(发生1次以上)总人数8909717017637037545449445752327936281220141620总人数19248240如果把反应时的测验

37、成绩以5分及以上为标准界限,则该表可以转换为下表第六十五页,本课件共有81页 安全水平反应时成功成功不成功成功1084不成功8444按照公式可得:Rct=第六十六页,本课件共有81页第三节第三节 内容效度内容效度定义定义:测验题目对所要测量的内测验题目对所要测量的内容范围的代表性程度,考验题容范围的代表性程度,考验题目样本是否代表了内容总体目样本是否代表了内容总体。第六十七页,本课件共有81页内容效度的两个要点内容效度的两个要点1.测题对测量对象的有效性测题对测量对象的有效性2.全部测题对测量对象的涵盖程度全部测题对测量对象的涵盖程度第六十八页,本课件共有81页例子例子对一个优秀篮球运动员技能

38、的测量对一个优秀篮球运动员技能的测量测量目的测量目的:一个优秀篮球运动员需要具备的一个优秀篮球运动员需要具备的技能技能对内容领域的描述对内容领域的描述:投蓝,运球,抢篮板。投蓝,运球,抢篮板。测验测验A:在各个位置上投蓝在各个位置上投蓝40次次;测验测验B:各种情景下的运球各种情景下的运球30次次.第六十九页,本课件共有81页确定内容效度的方法确定内容效度的方法专家判断专家判断 请某领域里的专家来评判测验的请某领域里的专家来评判测验的内容是否编排的合理内容是否编排的合理.缺点缺点:1)没有量化指标没有量化指标;2)对内容效度的判断不一致对内容效度的判断不一致;3)教育思想或心理学观点不同教育思

39、想或心理学观点不同,所以对所以对内容范围的理解也不同内容范围的理解也不同.第七十页,本课件共有81页内容效度比(内容效度比(CVR)内容效度比低的题目就应该被淘汰内容效度比低的题目就应该被淘汰.然然后计算全部测题的内容效度比的平均数后计算全部测题的内容效度比的平均数,作作为内容效度的指标为内容效度的指标.第七十一页,本课件共有81页其他辅助的方法其他辅助的方法2.统计分析法统计分析法3.再测法再测法4.经验法经验法5.内在一致性内在一致性第七十二页,本课件共有81页内容效度与表面效度的区别内容效度与表面效度的区别表面效度是指测验看起来所要测量表面效度是指测验看起来所要测量的东西的东西,是被试或

40、外行看来是有效的测验是被试或外行看来是有效的测验.表面效度与内容效度并不总是一致表面效度与内容效度并不总是一致的的.表面效度能间接影响测验的效度表面效度能间接影响测验的效度,所所以测验编制时也要适当关注表面效度以测验编制时也要适当关注表面效度.第七十三页,本课件共有81页提高内容效度的有效方法:提高内容效度的有效方法:编制命题的双向细目表编制命题的双向细目表记忆记忆 了解了解 应用应用 分析分析 综合综合 评价评价 合计合计第一章第一章8210第二章第二章12621030第三章第三章 4422618第四章第四章 2101284642合计合计6262814206100第七十四页,本课件共有81页

41、第四节第四节 结构效度结构效度定义定义:根据测评所假定的结构予以解释根据测评所假定的结构予以解释的程度,主要用于人员功能结构的理的程度,主要用于人员功能结构的理论概括和探讨。论概括和探讨。第七十五页,本课件共有81页某一智力理论的四项假设某一智力理论的四项假设:1.智力随年龄而增长智力随年龄而增长;2.智商是稳定的智商是稳定的;3.智力与学业成绩有密切关系智力与学业成绩有密切关系;4.智力受遗传的影响智力受遗传的影响.第七十六页,本课件共有81页某注意力的理论某注意力的理论,注意有如下特征注意有如下特征:1.稳定性稳定性2.集中性集中性3.转移性转移性4.分配分配5.范围范围第七十七页,本课件

42、共有81页收集结构效度资料的方法收集结构效度资料的方法1.测验内方法测验内方法 研究测验的内部构造来界定所测研究测验的内部构造来界定所测量的结构范围量的结构范围.1)内容效度内容效度 2)内在一致性内在一致性 3)因素分析因素分析第七十八页,本课件共有81页2.测验间方法测验间方法 研究几个同类测验间的相互关系来研究几个同类测验间的相互关系来考察它们是否测量相同的心理结构考察它们是否测量相同的心理结构.1)相容效度相容效度 2)会聚效度和区分效度会聚效度和区分效度第七十九页,本课件共有81页谢谢!谢谢!第八十页,本课件共有81页感感谢谢大大家家观观看看08.12.2022第八十一页,本课件共有81页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com