心理测量学 心理测量学 心理测量学

第五章

心理测量学知识
王景汉

第一节 概述
无论是临床诊断,判定疗效,还是进行 心理咨询和治疗,都必须以 心理测量为基础

第一单元 测量与量表
一、什么是测量
测量就是依据一定的法则用数字对事物加以确定 测量定义的三个主要元素 (1) 事物—测量对象 在心理测量中,所测量的实际是心理现象的外显行为 (2) 数字—事物或其属性的量 数的逻辑性:区分性、序列性或等级性、等距性、可加性 (3)法则—测量所依据的规则和方法法则有好坏之分

二、测量要素
(一) 参照点 计算的起点: 绝对零点 相对零点 在心理测量中很难找到绝对零点,多用人为标定的相对零点 (书本的错误P.325)
(二) 单位 好的单位必须具备两个条件 1、 有确定的意义 2、 有相同的价值

三、测量的量表
测量的本质是根据某一法则将事物数量化,即在一个定有 单位和参照点的连续体上把事物的属性表现出来,这个连 续体就称为量表。 根据量表的精确程度,斯蒂文斯(S.S.Stevens)将测量从 低级到高级分成四种 (一) 命名量表:1、代号 2、类别 (二) 顺序量表: 有大小关系、无相等单位、无绝对零点 (三) 等距量表:有大小关系、有相等单位、无绝对零点 (四) 等比量表: 有相等单位、有绝对零点 心理测量一般在顺序量表上进行,但利用某种统计方法可 以将数据换算为等距数据来进行统计

第二单元

心理测量的基本概念

一、心理测验的定义
心理测验,就是依据心理学理论,使用一定的操作程 序,通过观察人的少数有代表性的行为,对于贯穿在 人的全部行为活动中的心理特点做出推论和数量化分 析的一种科学手段 1、测量的是人的行为 2、行为样本 3、标准化 4、常模

二、心理测验的性质
心理测量的间接性 心理测量的相对性 心理测量的客观性 项目、实施方法 记分
分数的转换和解释

第三单元

心理测验的分类

一、按测验的功能分类
(一)智力测验 (二)特殊能力测验 (三)人格测验—问卷法、投射法

二、按测验材料的性质分类
(一)文字测验 (二)操作测验

三、按测验材料的严谨程度分类
(一)客观测验 (二)投射测验

四、按测验的方式分类
(一)个别测验 (二)团体测验

五、按测验的要求分类
(一)最高作为测验 (二)典型行为测验

第四单元

纠正错误的测验观

一、错误的测验观
(一) 测验万能论 (二) 测验无用论 (三) 心理测验即智力测验

二、正确的测验观
(一)心理测验是重要的心理学研究方法之一,是决 策的辅助工具 (二)心理测验作为研究方法和测量工具尚不完善

第五单元 心理测验在心

理咨询中的应用
一、智力测验 二、人格测验 三、心理评定量表

第六单元

心理测验发展史

始于汉代,兴于隋唐的科举制度是公认的最早的心理测验的实践

一、科学心理测验的产生与发展
? 早期发展情况 英国心理学家高尔登(1884)建立了一个心理测量实验室,设计 出测量差异的方法。 ? 美国心理学家卡特尔(1890)发表《心理测验与测量》 ? 法国心理学家比内(1905)年编制比内- 西蒙智力量表 ? 19世纪80年代高尔登的十年 ? 19世纪90年代卡特尔的十年 ? 20世纪头十年是比内的十年

20世纪20年代以后的发展特点 ? 操作测验的发展 ? 团体智力测验的发展 ? 能力倾向测验的发展 ?人格测验的发展

二、现代心理测验在我国的发展
兴起阶段 1914年前后,二,三十年代翻译和二次修订比内量表 低谷阶段 几十年停顿状态 蓬勃发展 1979年以来,广泛进行国外的量表的修订。
近年本土化取得初步成果

第二节 测验的常模
第一单元 常模团体 一、常模团体的性质
常模团体是具有某种共同特征的人所组成的群 体,或者是该群体的一个样本。用一个标准规范 的分数表示出来,以提供比较的基础

二、常模团体的条件
? (一) 群体的构成必须明确界定 ? (二) 常模团体必须是所测群体的代表性样本 ? (三) 样本的大小要适当 一般不少于30或100人 全国性常模:2000~3000人 (四)标准化样组是一定时空的产物

三、取样的方法
取样即从目标人群中选择有代表性的样本 (一)简单随机抽样 根据随机的原则选择样本,在该范围内每个人被抽到的 机会相等。 (二)系统抽样 (三)分组抽样 当总体数目较大,无法进行编号,而群体又具多样性时 采样 先分组,再在组内随机抽样 (四)分层抽样 制定常模是最常用的方法 先按某种(或几种)变量分层,然后在每层中随机抽取 一定样本,组合成常模样本。 分层比例抽样 分层非比例抽样

四、常模分数与常模
(一)常模分数 将常模样本被试测验的原始分按一定规则转换出来的导 出分数(如百分位、标准分、T分等) 举例: 简单转换表: 将单一测验原始分转换成一种或几种分数。 如:瑞文推理测验、全量表IQ 复杂转换表: 包括几个分测验或几种常模团体的原始分 与导出分数的对应关系。如:韦氏智力测验粗分等值量 表分转换表、MMPI T分转换表等。 (二)常模 常模分数构成的分布,就是常模 常模是解释测验结果的参照指标 一般常模 特殊常模

第二单元
一、发展常模

常模的类型

(一)发展顺序量表
葛塞尔发展程序表 皮亚杰对守恒概念的研究

(二)智力年龄
简称智龄:比内-西蒙量



(三)年级当量

二、百分位常模
(一)百分等级 未分组资料的百分等级的计算 PR=100-(100R-50)/N R 指某人原始分排列的顺序数 N 指样本总人数
举例:小东在30名同学中语文成绩是80分,排列第5名,其百分等级 为: PR=100-(100×5-50)/30=85

分组资料的百分等级求法,计算方法不同,但其 百分等级的意义与未分组资料一样 (二)百分点 (三)四分位数和十分位数

百分点用于计算处于某一百分比例的人相对应的测验分数是 多少
计算方法(直线内插法) 举例:已知高考的最高分为695,其百分等级为100,最低分为 103分,百分等级为1,求百分等级80所对应的分数是多少?
100 ? 80 80 ? 1 ? 695 ? PP PP ? 103
? 计算部骤(因式分解)

20/(695-PP)=79/(PP-103) 79(695-PP)=20(PP-103)(等号两侧交叉 相乘) 54905-79PP=20PP-2060 54905+2060=20PP+79PP 56965=99PP PP=56965/99 PP=575.4 ?575

三、标准分常模
标准分是将原始分数与平均数的距离以标准差为单位表 示出来的量表。 因为它的基本单位是标准差,所以叫标准分。 常见的标准分数有z分数、Z分数、T分数、标准九分数、 离差智商(IQ)等。 (一)线性转换的标准分数 原始分转换标准分基本公式:

X ?X Z ? SD
X 其中X为任一原始分数, 为样本平均数,SD为样本标准差

正态分布
正态分布又称常态分布,统计学中一种重要

的理论分布,在自然界、人类社会、心理 与教育中大量的现象和特征均按正态的形 式分布,如能力、人格特征、学习成绩、 社会态度、行为表现以及身高、体重等。

正态分布的特点
正态分布的形式是对称的 正态分布曲线的两端与基线趋于无穷远,但不会相交。 正态分布曲线与基线之间的面积等于1(100%),代表了总体事件。 从正态分布曲线的最高点作垂直线,形成正态分布的中轴,将面积分为 相等的两半,各占50%。 平均值位于正态分布的中轴上。 正态分布曲线下各对应的横坐标(即标准差)处与平均数之间的面积可 用积分公式计算,也可查正态分布表获得。 正态分布曲线下,标准差与概率(面积)之间的关系举例: 平均值±(加减)Z个SD,包含A%的面积(概率) 平均值±(加减)1个SD,包含68.26%的面积(概率) 平均值±(加减)1.96个SD,包含95%的面积(概率) 平均值±(加减)2.58个SD,包含99%的面积(概率) 平均值±(加减)2个SD,包含95.45%的面积(概率) 平均值±(加减)3个SD,包含99.73%的面积(概率)

正态分布曲线:p.345图

几种导出分数间的相互关系
从上图以及书中p.345图中可以看出: z分1.00分,T分60分,CEEB600分,韦氏离差智商 的115分,韦氏分测验的13分等分数,都

表示原始 分数在它所在的分布中是高于平均数一个标准差, 对于常态化的标准分数或趋于常态分布的z分数来 说,大约相当于84的百分等级(实际是84.13%) 。 两个标准差大约相当于98的百分等级(实际 97.72)。-2.00的z分数等分数表示低于平均值两 个标准差,大约相当2的百分等级 标准差不同的正态分布形式:

方差和标准差 反映数据离中(离散)趋势的两种指标。英文 variance(方差)用S2 或σ2来表示;standard deviation(标准差),用S或SD来表示,亦可用σ 表示。 对离中趋势进行度量的意义 全面反映事物的面貌:平均值只反映了事物的典 型情况,标准差可反映事物的特殊性。 判断集中量数(如平均值)的代表性:在一组数 据中,离中趋势越小,集中趋势量数的代表性就 越好,相反就越差。

基本公式 方差计算公式
S
2

?(X ?

i

? X)

2

N

Xi为每个数据,从X1、X2……Xn (Xi-X)为离均差 (Xi-X)2为离均差平方 ∑(Xi-X)2为离均差平方和 N为数据的个数

标准差计算公式

SD ? S

2

计算举例(下例1组) S12=[(45-60)2+(50-60)2+(55-60)2+(58-60)2+(60-60)2+ (60-60)2+(62-60)2+(65-60)2+(70-60)2+(75-60)2]/10 =70.8 S1=√70.8=8.41
例:3组20岁男性的体重(公斤) M 1组:45、50、55、58、60、60、62、65、70、75 60 2组:50、55、55、60、60、60、60、65、65、70 60 3组:40、45、50、55、60、60、65、70、75、80 60 SD ? ? ?

例:3组20岁男性的体重(公斤) 计算结果(平均值与标准差)
M SD 1组:45、50、55、58、60、60、62、65、70、75 60 8.41 2组:50、55、55、60、60、60、60、65、65、70 60 5.48 3组:40、45、50、55、60、60、65、70、75、80 60 12.25

正态分布理论在心理测验的应用
化等级评定为测量数据 测定题目的难易度 利用正态分布将原始分转变为标准分 在评定时确定人数(概率)

四、智商及其意义
? 最早的比内–西蒙量表用心理年龄来表示智力的高低 ? 测验题目的安排完全按难度排列,某条目在某年龄组中50 %能通过,该条目就被当成该年龄组的题目。

? (一)比率智商
– 比率智商公式 – IQ=MA(心理年龄)/CA(实足年龄)×100 – 比率智商的不足之处 ? 个体智力的增长与年龄的关系并非一直呈直线关系,因 此不适合于成人。 ? 比率智商的分数在不同年龄组具有不同的意义。

(二)离差智商
是一种以年龄组为样本计算而得的标准分数,为了使其 与传统的比率智商基本一致,一般研究者将离差智商的 平均值定为100。 韦克斯勒智力量表的标准差定在15 IQ=100+15 (X–X)/SD 或 IQ=100+15z 斯坦福-比内量表的标准差定在16 IQ=100+16 (X–X)/SD 或 IQ=100+16z 常模标准分转换表 在实际工作中,测验编制者会采用某种标准分

公式计算 出与原始分相对应的标准分,并编制成原始分转换标准 分等值表,附在手册上方便使用。 每个测验采用何种标准分,以及量表分的平均值和标准 差均可从测验手册中查到

以100为平均数不同标准差条件下每一组距 正态曲线下个案百分比
分组分数 130以上 120~129 110~119 100~109 90~99 80~89 70~79 SD=12 0.7 4.3 15.2 29.8 29.8 15.2 4.3 百分数分布 SD=14 SD=16 1.6 3.1 6.3 7.5 16.0 26.1 26.1 16.0 6.3 15.8 23.6 23.6 15.8 7.5 SD=18 5.1 8.5 15.4 21.0 21.0 15.4 8.5

70以下 总计

0.7 100.0

1.6 100.0

3.1 100.0

5.1 100.0

第三单元

常模分数的表示方法

一、转换表法
? 又称常模表,最简单、基本的表示方法。 ? 将测验的原始分转换成相对应的常模分数(如百分 位、标准分、T分等) ? 举例 – 简单转换表:将单一测验原始分转换成一种或几种分数。
如:瑞文推理测验、全量表IQ – 复杂转换表:包括几个分测验或几种常模团体的原始分 与导出分数的对应关系。如:韦氏智力测验粗分等值量表 分转换表、MMPI T分转换表等。

二、剖面图表示法
? 剖面图是将分数的转换关系用图形表示出来 ? 剖面图能直观地表示出被试在各分测验上的表现 及相对位置 ? 有的剖面图直接可作为粗分等值量表分转换表用, 如韦氏成人智力测验记录纸的剖面图 ? WISC-RC剖面图举例
– 总智商在平均值以上 – 言语智商相当高,操作智商一般。

第三节 测验的信度
第一单元 信度的概念
一、信度的定义
信度是指同一被试者在不同时间内用同一测验(或用另一套 相等的测验)重复测量,所得结果的一致程度。 – 信度指测验或量表的可靠性(可靠程度)。(龚耀先) – 信度就是对测量一致性程度的估计。(金喻) – 在编制或修订心理测验时,信度研究是必须的环节,信度 资料是测验手册里必备的测量学指标。 – 在使用心理测验时,没有信度资料的测验不能使用。

公式(5-7): X=T+E
表示实得分数(总分数)X总是由真分数T和误差E构成的 ? 用测验分数的方差代入公式5-7就得到公式5-8 ? 在测量理论中,信度被定义为:真分数方差与总方差的比率。 即公式5-9 ? 由于真实分数是无法统计的, ? 因此公式5-9可转化为公式5-10 ? 信度也可以看作总的方差中非测量误差的方差所占的比例 ? P.349.图5-2显示真分数方差、测量误差方差和信度的关系

二、信度的指标
? (一)信度系数与信度指数
? 信度系数:真分数方差与实得分数方差的比值 即公式5-11也就是公式5-9 ? 信度指数:是真分数标准差与实得分数标准差的比值 ? 从公式5-12可见信度指数的平方就是信度系数

? (二)测量标准误
? 公

式5-13表示: ? 标准误是所得分数标准差乘以1减信度系数的开方。 ? 从公式可以看出测量的标准误与信度是互为消长的关系

第二单元
一、重测信度

信度评估的方法P.349

又称稳定性系数,主要用于评价时间误差。 最适宜的重测时距为2-4周,最好不超过6个月 二、复本信度 又称等值性系数,以两个等值但题目不同的测验(复本) 来测量同一群体,然后求被试者在两个测验得分的相 关,用于评价两个测验内容的一致性。 实施两个测验的间隔时间长短可能影响复本信度 对许多测验来说,建立复本是十分困难的

三、内部一致性信度 (一)分半信度
用于评价同一测验内部条目抽样的误差。 方法:将测验条目按单双号分为两组,计算出两组的得分,然后进行相关。 在同样的情况下,信度的高低与条目数量成正比,分半信度只计算了一半条 目的信度,因此要用斯皮尔曼—布朗的公式进行校正。

(二)同质性信度
评价测验内题目间一致性(内容抽样误差) 计算的公式: 1、库德–理查逊公式(K-R20公式) K-R21公式 2、克伦巴赫α系数

四、评分者信度
肯德尔和谐系数

第三单元 信度与测验分数的解释
一、解释真实分数与实得分数的相关 二、确定信度可以接受的水平
一般的原则是: 信度系数小于0.70时不能用于个人及团体 等于或大于0.70而小于0.85时可用于团体比较 等于或大于0.85时才可用来鉴别或预测个人的成绩行为 另一个原则是: 新编的测验信度应高于原有的同类测验或相似测验 获得较高信度不是心理测验的最终目标,只是迈向目 标的一步,是使测验有效的一个必要条件

几种心理测验的信度系数
信 测验类型 成套成就测验 低 0.66 中 0.92 度 高 0.98

学术能力测验
成套倾向性测验 客观人格测验

0.56
0.46 0.46

0.90
0.88 0.85

0.97
0.96 0.97

兴趣测验
态度量表

0.42
0.47

0.84
0.79

0.93
0.98

教材P.352表5-4有误。以此为准

三、解释个人分数的意义标准误
标准误公式 SE ? S x 1 ? rxx 公式5-15即5-13 标准误是所得分数标准差乘以1减信度系数的开方

置信区间:X-1.96SE < X T ≤X+ 1.96SE
参看教材P.353的例子: 某被试IQ为100 已知标准差为15,信度系数为0,84 利用公式5-15计算得出标准误为6 代入公式5-16计算置信区间=88~112 结论:被试的真实IQ有95%的可能性落在88~112之间

四、比较不同测验分数的差异
测量标准误和测验信度在评价两个不同测验分数的差异否具 有统计学意义上的显著性时非常重要 这种比较可以是两个人的不同分数的差别,也可以是同一被 试的两个测验分数 公式5-17是差异标准误的计算公式

在统计上,通常要求两个分数的差异

心理测量学 心理测量学 心理测量学

程度达到0.05才认为是 显著的
教材P.353的例子说明某被试的言语智商和操作智商的差异通 过计算表明差异不显著

第四单元 影响信度的因素
一、样本特征 信度系数就是相关系数 (一)样本团体异质性的影响
取样团体较为异质,会高估信度 取样团体较为同质,会低估信度

(二)样本团体平均能力水平的影响

二、测验长度
测验的长度,亦即测验条目数,也是影响信度系数 的一个因素。一般说来,增加同质的条目可以提高 测验的信度。
– 如果我们在预备试验中已知道某测验的信度,希望提高至某 一水平,可以运用斯皮尔曼–布朗的公式计算出至少应增加 多少条目。
– 公式5-18

rkk (1 ? rxx ) K? rxx (1 ? rkk )

三、测验难度 四、时间间隔
时间间隔只对重测信度和不同时测量时的复本信度有影响,对其余的信 度来说不存在时间间隔问题

第四节 测验的效度
第一单元 效度的概念
一、效度的定义
在心理测验中效度是指所测量的与所要测量的心理特 点之间符合的程度。 在编制或修订心理测验时,效度研究是必须的环节, 效度资料是测验手册里必备的测量学指标。 在使用心理测验时,没有效度资料的测验也不能使用。

? 公式5-21表明: ? 效度系数为有效方差与总方差的比率 ? 测量的效度除受随机误差的影响外还受 系统误差的影响 ? 可信的测验未必有效,而有效的测验必 定可信 ? 信度是效度的必要条件。

二、效度的性质
(一)效度具有相对性 (二)效度具有连续性

专栏:信度和效度的关系
(一)信度是效度的必要条件而非充分条 件 (二)效度受信度的制约

第二单元

效度评估的方法

一、内容效度(content–related validity)
(一)什么是内容效度 指测验条目对有关内容或行为取样的适用性。换句话说,所 选用的条目是否能测到想要测量的行为。 (二)内容效度的评估方法 1、专家判断法 2、统计分析法 3、经验推测法 (三)内容效度的特性 定义的内容、时间特定性 内容效度与表面效度的关系

二、构想效度(construct–related validity)
(一)什么是构想效度(又叫构思效度、结构效度) 1954年提出,主要涉及理论概念问题。指测验能够测量到理论上的 构想或特质的程度,亦即测验的结果能否证实或解释某一理论的 假设、术语或构想,解释的程度如何。

(二)构想效度的估计方法 1、对测验本身的分析 2、测验间的相互比较 区分效度、因素分析法 3、效标效度的研究证明 4、实验法和观察法的证实

三,效标效度(criterion-related validity)
(一)什么是效标效度 效标效度又称实证效度,反映的是测验预测个体在某种 情景

下行为表现的有效性程度。 被预测的行为是检验效度的标准,简称效标 在检验一个测验的效标效度时,难点在于找到合适的效 标。一个好的效标效度必须具备以下条件: 1,效标必须能最有效地反映测验的目标,即效标测量本 身必须有效。 2,效标必须具有较高的信度,稳定可靠,不随时间等因 素而变化。 3,效标可以客观地加以测量,可用数据或等级来表示。 4,效标测量的方法简单,省时省力,经济实用。

(二)效标效度的评估方法
1,相关法:相关法是评估效标效度最常用的方法,它是 求测验分数与效标资料间的相关,这一相关系数称为 效度系数。 2,区分法:区分法是检验测验分数能否有效地区分由效 标所定义的团体的一种方法。计算公式如下:
t ? XH ? XL
2 2 SH SL ? NH NL

3,命中率法:命中率法是当测验用来做取舍的依据时, 用其正确的比例作为效度指标的一种方法。

第三单元 效度的功能
一,预测误差 二,预测效标分数 三,预测效率指数

第四单元

影响效度的因素

一,测验本身的因素
要保证测验具有较高效度,要做好以下几点: 1,测验材料必须对整个内容具有代表性; 2,测题设计时应昼避免容易引起误差的题型 (如是非题); 3,测题难度要适中,具有较高的区分度; 4,测验长度要恰当,即要有一定的测题量 5,测题目的排列按先易后难顺序。

二、测验实施中的干扰因素 (一)主试的影响因素 (二)被试的影响因素 三、样本团体的性质 (一)样本团体的异质性 (二)干涉变量 四、效标的性质

第五节 项目分析
测验的项目分析定性分析和定量分析 定性分析:测验的内容效度、题目编写的恰当性 和有效性 定量分析:对题目的难度和区分度进行分析 项目分析的目的是:通过选择和修改测验题目, 提高测验的信度和效度。

第一单元
一、定义

项目的难度

难度(difficulty),指项目的难易程度,能力测验 中一个重要的指标。 在人格测验中,类似的指标是“通俗性”。即取 自相同总体样本中,能在答案方向上回答该题的 人数。 两种指标的计算方法是相同的

二、计算方法
(一)二分法记分的项目(1、0记分)
公式(通过率):
P? R ?100% N

P 指项目的难度(通过率) R 答对或通过该项目的人数 N 全体被试人数 举例:第一题10名被试中8人答对,其难度为: P=8/10×100%=80%

当被试人数较多时的计算方法:
根据测验总成绩将被试分为三组 高分组(PH):分数最高的27% 中间组:分数居中的46% 低分组(PL):分数最低的27% 计算高分和低分组的通过率 计算两组平均通过率作为难度指标 公式:

PH

? PL P? 2
P 指难度(通过率) PH指高分组通过率 PL指低分组通过率 举例:某测验条目高分组通过率为85%,中间组通过率为52%,低分 组通过率为35%,问平均通过率是多少? 85%+35%/2=60%

吉尔福特难度校正公式:
因为选择题易受到猜测的影响,备选答案越少,机遇的作用越大, 越不能反映真实难度,吉尔福特的校正公式用于对此进行校正。

公式:

KP ? 1 Cp ? K ?1
P Cp 校正后通过率 P 校正前通过率 K 备选答案数目 举例:5选1的题型,通过率为0.6,请计算校正后的通过率?
L

Cp ?

KP ? 1 5 ? 0.6 ? 1 ? ? 0.5 K ?1 5 ?1

(二)非二分法记分的项目
当测验项目为问答题或不能用二分法记分时,用以下的公式:

X P? ? 100% X max
X 为全体被试平均分,X max 为该题的满分

举例:
某题平均得分1.8分,最高分2分,通过率: P=1.8/2.0×100%=90

三、难度水平的确定
(一)项目的难度 ? 进行难度分析的目的是为了筛选条目,项目难度 多高合适,取决于测验的目的、性质及项目的形 式。 ? 一般而言,难度(通过率)在0.5时,区别力最高, 对信度和效度影响最好。 ? 在能力测验中,为了使尽可能少的人在测验中得 0分或得满分,因此必须安排较容易的项目和较 难的项目,最好使试题的平均难度接近0.50,而 各题的难度在 0.50±0.20之间。

(二)测验的难度 ? 测验的难度取决于组成测验项目的难度 ? 通过观察测验分数的分布,可以进行直观检验。
– 如果测验难度适中,分数的分布应当接近常态分布; – 如果测验偏难,分布呈正偏态(图5-4,A) – 如果测验偏容易,分布呈负偏态(图5-4,B)

? 测验偏难或偏容易时,可以通过增加或减少不同 难易程度的条目来解决。 ? 某些测验(如标准参照测验)允许测验分数呈偏 态分布。

第二单元 项目的区分度
一、定义
项目区分度,也叫鉴别力,是指测验项目对被试 的心理能力的区分能力 高区分度条目:实际水平高者能通过,实际水平 低者不能通过。
h

二、计算方法
(一)鉴别指数 此方法的主要步骤如下: 1,按测验总分高低排列答卷; 2,确定高分组与低分组,每一组取答卷总数的27%; 3,分别计算高分组与低分组在该项目上的通过率或得分率; 4,按下列公式估计出项目的鉴别指数。(公式5-35)

D ? PH ? PL
D为鉴别指数, H 为高分组通过率,PL 为低分组通过率 P

鉴别指数的判断 因为高分组条目总得分上高于低分组,理论上他们 每个条目的通过率也要高于低分组。 D>0时,D越大,说明该条目区分两种水平(组)的 能力越强 D<0则反映高分组的得分反而低于低分组,说明该条 目有

问题。 伊贝尔(L. Ebel, 1965)关于鉴别指数评价项目性能 的标准:
鉴别指数(D) 0.40以上 0.30~0.39 0.20~0.29 0.19及以下 项目评价 很好 良好,修改后会更佳 尚可,但需修改 差,必须淘汰

(二)相关法
1,点二列相关 2,二列相关 3, Ф相关法

三、区分度与难度的关系
理论上最大区分度(以总分对半划分高、低分组时)

项目通过率
1.00 0.90

高分组通过率
1.0 1.0

低分组通过率
1.0 0.8

D的最大值
0.00 0.20

0.80
0.70 0.60 0.50

1.0
1.0 1.0 1.0

0.6
0.4 0.2 0.0

0.40
0.60 0.80 1.00

0.40
0.30 0.20

0.8
0.6 0.4

0.0
0.0 0.0

0.80
0.60 0.40

0.10
0.00

0.2
0.0

0.0
0.0

0.20
0.00

第六节 测验编制的一 般程序
? 心理测验中,测验的编制是较为重要同 时也是较难的一个环节。学习相关知识 不仅为日后编制测验打下基础,也可以 使我们有能力评价和更好的使用测验

第一单元
一、测验的对象

测验的目标分析

在编制测验前首先要明确测量的对象,也就是 该测验编成后要用于哪些团体。

二、测验的用途 (一)显示性测验 (二)预测性测验 三、测验的目标 (一)工作分析 (二)对特定概念下定义 (三)确定测验的具体内容

第二单元 测题的编写
一、搜集资料
(一)已出版的标准测验 (二)理论和专家的经验 (三)临床观察和记录

二、命题的一般原则
(一)内容方面:主要是要求题目的内宾符合测 验的目的。 (二)文字方面:使用准确的当代语言,简明扼 要。 (三)理解方面:题目应有确切的答案。 (四)社会敏感性方面:尽量避开社会敏感性问 题。

三、测题的编制要领 (一)选择题
1,题干所提的问题必须明确。 2,选项切忌冗长,要简明扼要。 3,每题只给一个正确答案。 4,各选项长度应相等。 5,避免题干用词与选项用词一致。 6,选项最好用同一形式。

(二)是非题
1,内容应以有意义的概念、事实或基本原则为基础。 2,每道题只能包含一个概念。 3,尽量避免否定的叙述。 4,若是表达意见的题目,最好说明意见的来源和根据。 5,“是”、“非”题的数目应有适应比例。

(三)简答题
1,宜用问句形式。 2,如果是填充形式,空格不宜太多。 3,每题应只有一个正确答案,答案要简短而具体。

(四)操作题
1,明确所要测量的目标,并将其操作化。 2,尽量选择真实性程度较高的项目。 3,指导语要简明扼要。 4,制定评分标准,确定计分方法。

第三单元

测验的编排和组织

一、合成测验 (一)选择与审定试题
1,选择试题形式 2,审定题目

(二)测题的编排
1,测题的难度排列宜逐步上升。 2,尽可能将同类型的测题组合在一起。 3,注意根据各种类

型测题本身的特点排列题目。 并列直进式 混合螺旋式

二、预测与项目分析 (一)预测
1,预测对象应取处将来正式测验准备应用的群体。 2,预测的实施过程与情境应力求与将来正式测验时的情 况相近似。 3,预测的时限可稍宽一些,最好使每个被试都能将题目 做完。 4,在预测过程中,应对被试的反应情形随时加以记录。

(二)项目分析 三、信度与效度的考察 (一)信度 (二)效度

四、常模制订
建立常模的方法是,在将来要使用测验的全体对象中, 选择有代表性的一部分人(称标准化样本),对此样 本施测并将所得的分数加以统计整理,得出一个具有 代表性的分数分布,此即该测验的常模。

五、编写指导手册
1,测验的目的和功用。 2,测验编制的理论背景以及测验中的材料是根据什么原 则、应用什么方法选择出来的。 3,如何实施测验的说明。 4,测验的标准答案和记分标准。 5,常模资料。 6,测验的基本特征。

第七节 心理测验的使用
第一单元 主试的资格
主试资格包含技术和道德两方面的要求。

一|、知识结构 二、专业理论和专业技能
(一)专业理论知识 是主试资格考察的最基本条件。 (二)专业技能 必须具有实际操作心理测验的专业技能和经验。

三、职业道德
(一)测验的保密和控制使用 (二)测验中个人隐私的保护

第二单元 测验的选择
一、所选测验必须适合测量的目的 二、所选测验必有符合心理测量学的要求

第三单元 测验前的准备及注意事项
一、测验前的准备工作
(一)预告测验 (二)准备测验材料 (三)熟悉测验指导语 (四)熟悉测验的具体程序

二、测验中主试的职责 三、建立协调关系

第四单元 测验实施的程序及要 素
一、指导语
(一)对被试的指导语 (二)对主试的指导语

二、时限 三、测验的环境条件
1,必须完全遵从测验手册的要求 2,记录下任何意外的测验环境因素 3,在解释测验结果时也必须考虑这一因素

第五单元
(一)应试技巧 (二)练习效应

被试误差及控制方法

一、应试技巧与练习效应 二、动机与焦虑因素
(一)应试动机 (二)测验焦虑

三、反应定势
(一)求“快”与求“精确”的反应定势 (二)喜好正面叙述的反应定势 (三)喜好特殊位置的反应定势 (四)喜好较长选项的反应定势 (五)猜测的反应定势

第六单元
一、原始分数的获得

测验的评分

1,及时而清楚地记录反应情况。 2,要有一张标准答案或正确反应的表格。即记 分键。 3,将被试的反应与记分键比较,对反应进行分 类。

二、原始分数的转换

第七单元 测验结果的报告
一、测验分

数的综合分析
(一)应根据心理测验的特点进行分析。 (二)不能把分数绝对化,不能仅仅根据一次测验的结 果轻易下结论。 1、个人经历 2、测验情境 (三)必有有测验的信度和效度资料。 (四)对于来自不同测验的分数不能直接加以比较。

二、报告分数的具体建议
(一)不应把测验分数直接告诉被试本人或家长、 学校班主任等有关人员。 (二)避免使用专业术语。 (三)要保证当事人知道这个测验测量或预测什 么。 (四)要使当事人知道他是和什么团体在进行比 较。 (五)要使当事人知道如何运用他的分数。 (六)要考虑测验分数将给当事人带来什么心理 影响。 (七)要让当事人积极参与测验分数的解释。


  

爱华网本文地址 » http://www.aihuau.com/a/359651/688352037970.html

更多阅读

如何克服腼腆心理 如何克服浮躁心理

如何克服腼腆心理——简介腼腆的心理 不善于表达、胆小内向、错误的认知、好面子、丧失勇气、保守的思想等…这些心理让我们在与他人交谈相处中感到为难、不自在、还会脸红等,下面我个人见解,希望对读者有一定的启发。如何克服腼腆心

抑郁症自测题 测抑郁症的心理测试题

抑郁症自测题——简介 抑郁症是一种比较可怕的心理疾病,并且,不容易被人发现,而且,很多人对抑郁症根本不了解,抑郁症患者严重时会产生严重的自卑消极情绪,觉得活着很累,往往会产生轻生的年头和行动.抑郁症自测题——工具/原料抑郁

抑郁症的治疗——心理治疗方法 心理抑郁症怎么样治疗

治疗抑郁症常用的治疗方法有哪些,下面介绍几种心理治疗法,合用下面的心理治疗方法,可以有很好辅助治疗效果。抑郁症的治疗——心理治疗方法——步骤/方法抑郁症的治疗——心理治疗方法 1、支持性心理治疗法,又称一般性心理治疗,常用的技

怎样报考心理咨询师职业资格证书 报考心理咨询师资格证

怎样报考心理咨询师职业资格证书——颁发单位国内现在的心理咨询师认证主要有人力资源和社会保障部的国家心理咨询师资格认证、上海市的心理咨询师职业资格认证以及国际心理咨询师资格认证。目前较权威的人力资源和社会保障部的认证

小学生心理发展都有哪些基本特点? 一年级小学生心理特点

心理过程即人人共有的心理活动。由于心理活动都经历着发生、持续并结束的过程,因而称心理过程,包括认知过程、情感过程和意志过程。认知过程是人们认识周围事物(包括自己)的过程,通过知觉、技艺、思维、想象等心理活动来实现。情绪和情

声明:《心理测量学 心理测量学 心理测量学》为网友帅气范儿分享!如侵犯到您的合法权益请联系我们删除