第五章心理测量学知识习题

1. 关于测量，正确的是（测量就是依据一定的法则用数字对事物加以确定）

2. 参照点就是确定事物的量时，计算的（起点）

3. 用1代表男，用2代表女等等，这样的量表通常叫（命名）量表

4. 我们通常将学生的考试结果按名次排队，这些名次属于（顺序）变量

5. 在顺序量表中，变量具有（等级）

6. 0°C并不意味着没有温度，这种说法（正确）

7. 其数值可以加、减、乘、除运算的量表是（等比量表）

8. 一般来说，心理测量是在（顺序量表）上进行的

9. 下列说法中正确的是（心理测量就是依据心理学理论，使用一定的操作程序…）

10. 关于测量的客观性，下列说法中不正确的是（要有绝对的标准）

11. 下列属于正确的测验观的是（心理测验尚不完善）

12. (比内)编制了世界上第一个正式的心理测验

13. 近些年来，我国心理学家正在致力于心理测验的（本土化）研究

14. （常模团体）是由具有某种共同特征的人所组成的一个群体，或者是该群体的一个样本

15. 常模样本量的大小，一般最低不小于（30或100）

16. 全国性常模，样本量一般要在（2000-3000）之间

17. 样本大小适当的关键是样本要有（代表性）

18. 取样是指从（目标人群中）选择有代表性的样本

19. 随机号码表法是（简单随机抽样）

20. 系统抽样又称为（等距抽样）

21. 先将群体分组，再在组内进行随机取样的方法是（分组抽样）

22. （常模）是一种供比较的标准量数，是心理测验时用于比较和解释测验结果的参照分数

标准

23. 常模分数又叫（导出分数）

24. 发展常模就是（年龄量表）

25. 在（年龄）量表中，个人的分数指出了他的行为在按正常的途径发展方面出于什么样的

发展水平

26. 最早的一个发展顺序量表的范例是（葛塞尔发展程序表）

27. 按照葛塞尔研究的婴儿行为变化的顺序，（16）周的婴儿能使头保持平衡

28. 皮亚杰最著名的工作就是对（守恒）概念的研究

29. 皮亚杰发现，儿童不同时期出现不同的守恒概念，通常儿童到（5）岁时才会理解质量

守恒；(6)岁才会掌握重量守恒；（7）岁时才具有容量守恒的概念

30. （比内—西蒙量表）中首先使用了智力年龄的概念

31. 在吴天敏修订的比内—西蒙量表中，某儿童通过了4岁组的全部题目，5岁组通过3题，

6岁组痛过2题，7岁组痛过1题，其智龄为（5岁）

32. 常模样本中6年纪的算术平均分为35分，某儿童在算数测验中也得35分，那就是说，

该儿童的算数能力的年级当量是（6年级水平）

33. （百分等级）是应用最广的表示测验分数的方法、

34. 55分的百分等级表示在常模样本中有55%的人比这个分数（低）

35. 在实际应用中，我们一般既可以由原始分数计算百分等级，又可以由百分等级确定原始

分数。通过这样的双向分数编制的原始分数与百分等级对照表，就是（百分位常模）

36. 四分位数是将量表分成四等份，相当于百分等级的（25%，50%，75%）

37. 十分位数（1%-10%）为第一段

38. 在计算标准工分数的公式中SD为（样本标准差）

39. Z=A+Bz式中，Z为转化后的标准分数，A、B为根据需要指定的常数。加上一个常数是

为了去掉（负值），乘以一个常数是为了使单位变小，从而去掉小数点

40. 当以50为平均数，以10为标准差来表示时，通常叫（T分数）

41. 标准九分是一种标准分数系统，其量表是个9级的分数量表。它是以（5）为平均数，

以（2）为标准差的一个量表

42. 标准十分，平均数为（5.5），标准差为(1.5)

43. 标准二十分，平均数为（5.5），标准差为（3）

44. 使用最广、影响最大的标准分数是（离差智商）

45. 当原始分数不是常态分布时，也或以使之常态化，这一转换过程是（非线性的）

46. （常态化）过程主要是将原始分时转化为百分等级，再将百分等级转化为常态分布上相

应的离均值，并可以表示为任何平均数和标准差

47. 单纯用心理年龄来表示智力高低的方法缺乏不同（年龄）儿童间的可比性

48. 比率智商（IQ）被定义为（心理年龄）与实足年龄之比

49. 由于个体智力增长是一个由快到慢再到停止的过程吗，即心理年龄与实足年龄（不同步）

增长，所以比率智商并不适合于年龄较大的受测者

50. 韦克斯勒将离差智商的平均数定为（100），标准差定为（15）

51.

第二篇：5第五章心理测量学知识8

第五章心理测量学知识

第一节

一、测量：就是依据一定的法则用数字对事物加以确定。

测量三元素：1、事物：

2、数字：具有自然数的特点：（1）区分性

（2）序列或等级性

（3）等距性

（4）可加性。

3、法则：

测量的要素：（一）参照点：为计算事物的量而设置的计算的起点。1、绝对零点：

2、相对零点：

（二）单位：1、要有明确的意义；

2、要有相同的价值。

测量量表：即在一个有单位和参照点的连续体上把事物的属性表现出来，这个连续体就称为量表。按照制定量表的单位和参照点的不同可将量表分为四种水平，从低到高依次为：

（一）命名量表：1代表男，2代表女

（二）顺序量表：考试名次，数字仅表示等级，一般来说，心理测量是在顺序变量上进行的。

（三）等距量表：具有相等的单位。其数值可以互相作加减运算。如温度。0度并不意味着没有温度。

（四）等比量表：有相等的单位、绝对零点。数值可以做加减乘除运算。如重量等。

二、心理测验：就是依据心理学理论，使用一定的操作程序，通过观察人的少数有代表性的行为，对于贯

穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种手段。

心理测验的性质：（一）间接性

（二）相对性：

（三）客观性：1、测验的刺激是客观的

2、测验的量化是客观。

3、测验的结果是客观的

心理测验的分类1、按测验的功能分类：（1）智力测验：

（2）特殊能力测验

（3）人格测验

2、按测验材料的性质分类：（1）文字测验：

（2）操作测验：

3、按测验材料的严谨程度分类：（1）客观测验：

（2）投射测验：

4、按测验的方式分类：（1）个别测验：

（2）团体测验：

5、按测验的要求分类：（1）最高作为测验：

（2）典型行为测验：

四、纠正错误的测验观

（一）错误的测验观：（1）测验万能论

（2）测验无用论

（3）心理测验即智力测验

（二）正确的的测验观（1）是一种重要的心理学研究方法，是决策的辅助工具。

（2）这种研究方法和辅助工具尚不完善。

五、在门诊中使用较多的三类心理测验：1、智力测验

2、人格测验

3、心理评定量表

六、心理测验的发展史

（一）科学心理测验的产生与发展

1、高尔顿：（1）提出了人的不同气质特点和智能是按身体特点的不同而遗传的；

（2）为了研究差异的遗传性，设计了测量差异的方法；

（3）为心理测验奠定了统计学基础，提出了相关的概念，

2、卡特尔：（1）使心测验首次出现在心理学文献中，在《心理》杂志上发文章，开先河；

第五章心理测量学知识

（2）认为心理学应立足于实验和测验

（3）认为心理测验应有统一的标准；。

3、比内：（1）19xx年在《心理学报》上发表＜诊断异常儿童智力的新方法＞包含30个题目。

（2）是世界上第一个正式的心理测验。

（二）20世纪二十年代后心理测验的发展趋势1、操作测验的发展

2、团体智力测验的发展

3、能力倾向测验的发展

4、人格测验的发展

第二节测验的常模

一、常模团体：是由具有某种共同特征的人所组成的一个群体，或者是该群体的一个样本。

常模团体的选择：1、确定一般总体

2、确定目标总体

3、确本样本

常模团体的条件：1、群体构成的明确界定

2、对群体具有代表性

3、样本的大小要合适：最低不小于30或100个。全国性常摩，一般应有2000~3000

人为宜。

（1）经济

（2）实用

（3）减少误差

（4）关键是有代表性

4、具有新近性

取样：即从目标人群中选择有代表代表性的样本。

取样的方法：1、简单随机取样：随机号码表法

2、系统抽样：要求目标总体无序可排，无等级结构存在。关键是计数组距。

先编号然后隔段抽取 K=N/n N总体数目 K组距 n样本数目

3、分组抽样：先将群体分组，再在组内进行随机进行取样的方法。

4、分层抽样：分为分层比例抽样和分层非比例抽样。

常模分数：是施测常模样本被试后，将被试者的原始分数按一定规则转换出来的导出分数。

导出分数：是根据原始分数的分布特点使用现在统计学的方法转换出的具有一定的参照点和单位的测验量表。是一个有意义的测验量表，与原始分数等值，可以进行比较。

常模：常模分数构成的分布，就是通常据说的常模。

二、常模的类型

（一）发展常模（年龄量表）：个人的分数指出其行为在按正常途径发展时处于什么样的发展水平。

1、发展顺序量表：告诉人们儿童发育与其年龄相比是正常、超前、滞后

（1）最早的范例是葛塞尔发展程序表：按月份显示儿童在运动水平、适应性、语言、社会性方面的大致发展水平。

4周，能控制眼睛运动；

16周，能使头保持平衡；

28周，能用手抓握东西并玩弄它；

40周，能控制躯干、坐立或爬行；

52周，能控制腿脚运动、站立和行走。

（2）皮亚杰：提出守恒定律。5岁时才会理解质量守恒，

6岁才会掌握重量守恒，

7岁时才有容量守恒概念。

2、智力年龄：一个儿童在年龄表上所得的分数，就是最能代表他的智力水平的年龄。这种分数叫智力年龄，简称智龄。

比内—西蒙量表中首先使用智力年龄的概念。

吴天敏修订的比内—西蒙量表中，每个年龄都有6个测题，答对每题得智龄2个月。

智力年龄＝基本年龄（全对题年龄）+各非基本年龄所答对题之和*2/12

如：通过4岁组全部题目，5岁组通过3题，6岁组通过2题，7岁组通过1题，

则智力年龄＝4+（3+2+1）*2/12＝5

第五章心理测量学知识

3、年级当量：6年级的算术平均分为35，某儿童的算术测验中得35分，则该儿童的算术年级当量是6年级水平

（二）百分位常模包括：百分等级、百分点、百分位数、四分位数、十分位数

1、百分等级

（1）一个测验的百分等级是指在常模中低于这个分数的百分比。

如：55的百分等级表示常模样本中55%的人比这个分数低

是应用最广的表示测验分数的方法。

（2）未分组资料的计算公式：PR=100-(100R-50)/N R是原始分数排列顺序数，N是指总人数（样本总人数）

如王红得80分，在30名同学中排第5名，则百分等级＝100-（100*5-50）/30＝85，表示低于80分的有85人。

2、百分点或百分位数

百分点是计算处于某一百分比例的对应的测验分数是多少。

相对于某一百分等级的分数点就叫百分点或百分位数。

是与求百分等级相反的过程。

公式：(100-pr)/(sh-pp)=(pr-1)/(pp-sl)

如：高考最高分为650，其百分等级为100，最低分为105，其百分等级为1，要录取20%的学生，百

分等级为80的百分位数。则（100-80）（/650-PP）=（80-1）/（PP-100），则PP＝540

3、四分位数：将量表分不是分成100份而是4等份。相当于25%、50%、75%

十分位数：将量表分分成十等份。相当于1%－10%、11%－20%、91%-100%

（三）标准分常模

标准分常模就是将原始分数与平均分数的距离以标准差为单位表示出来的量表，

因为它的基本单位为标准差，所以叫标准分数。

常见的标准分数有z分数、Z分数、T分数、标准九分数、离差智商等。

标准分数可以通过线性转换，也可以通过非线性转换得到。

1、线性转换的标准分数

转换公式：z=X-X/ SD，SD为样本标准差

Z＝A＋Bz，加上一个常数是为了去掉负数，乘以一个常数是为了去掉小数点

2、非线性转换的标准分数

当原始分不是常态分布时，也可以使之常态化，这一转换过程是非线性的。

常态化过程：主要是将原始分数转换成百分等级，再将百分等级转化为常态分步上相应的离均值，并可

以表示为任何平均数和标准差。

常见的常态化标准分数：标准九分： Z=5+2z

标准十分： Z＝5＋1.5z

标准二十分： Z＝10＋3z

离差智商： IQ=100+15z

T分数: Z=50+10 z

（四）智商及其意义

心理年龄：最早的比内－西蒙量表使用心理年龄，存在缺乏不同年龄儿童之间的可比性问题。比率智商：是心理年龄与实足年龄之比。两者不同步增长，不适用于年龄较大的被试。

公式：IQ=(MA/CA) ×100

离差智商：是一种以年龄组为样本计算而得的标准分数。

公式：IQ=100+15z =100+15(X-X)/SD

（1）建立在统计学的基础上

（2）表示个体智力在年龄组中所入的位置

（3）表示智力高低的一种理想指标

（4）不同测验获得的离差智商只有当标准差相同或相近时才可以比较

三、常模分数的表示方法

1、转换表：也叫常模表，是一种最简单、最基本的且常用的呈现常模资料的方法。

测验的使用者利用转换表可以将原始分数转换为与其对应的导出分数，从而使对测验的分数作出有意义的解释。

常模表的构成要素：（1）原始分数

第五章心理测量学知识

（2）导出分数

（3）对常模团体的有关具体描述

发展量表中的年龄量表最基本的假设是所测量的特质随年龄有系统地改变。

年龄量表的基本要素：（1）一组可以区分不同年龄组的题目

（2）一个常模团体

（3）常模表

2、剖面图：是将测验分数的关系用图形表示出来。从而可以很直观地看出被试在各个分测验上的表现及其相对位置。

3、对于某些特殊的群体来说，情况很具体而特殊，我们就需要制定特殊常模。

第三节测验的信度

一、信度：是指同一被试在不同时间内用同一测验（或用另一套相等的测验）重复测验，所得结果的一致性程度。

信度只受随机误差的影响，随机误差越大，信度越低。

真分数理论：一个测验的实得分数（X）总是由真实分数（T）和误差分数（E）两部分构成的。即X＝T

＋E可以用各数据组的方差（标准差的平方）代表具体分数。变为方差形式

信度被定义为：一组测量分数的真分数方差与总分数方差（实得分数的方差）的比率。

信度公式

222信度的指标：1、信度系数：rxx=rxT=sT/sx

2、信度指数：rxT= sT/sx（信度指数的平方等于信度系数）

3、标准误公式: SE=Sx 1—rxx ，SE为测量的标准误，Sxrxx为测

量的信度系数。

分数测量值的标准误与信度成反比：信度越高，标准误越小；信度越低，标准误越大。

T，X同时变大为正相关，T，X同时变小时为负相关。相关系数最大是1；相关系数最小是-1。

二、信度评估的方法1、重测信度：（1）又称稳定性系数。是使用同一测验，在同样条件下对同一组被试

前后施测两次测验，求得两次得分间的相关系数。

（2）最适宜的时距随测验的目的、性质和被试特点而异，一般是2周到4周较宜，间隔时

间最好不超过6个月。

2、复本信度：（1）又称等值性系数。是以等值但题目不同的测验（复本）来测同一群体，求得

被试者在两个测验上得分上相关系数。

（2）反映的是测验在内容上的等值性

（3）如果复本信度考虑到两个复本实施的时间间隔，并且两个复本的施测相隔一段时间，

则称重测复本信度或稳定与等值系数。

（4）优点：能够避免重测信度的一些问题，如记忆效果、学习效应。

（5）缺点：①如果测量的行为易受练习的影响，则复本信度只能减少而不能消除这种影

响

②由于第二个测验只改变了题目的内容，已经掌握解题原则，可以很容易迁

移到同类问题

③对于许多测验验来说，建立复本是十分困难的

3、内部一致性信度（1）分半信度：A通常是在测验实施后将测验按奇、偶数分为等值的两伴，

并分别计算每位被试在两半上得分，求出这两伴

分数的相关系数。

B这个相关系数就代表了两半测验内容取样的一

致程度。

C斯皮尔曼－布朗公式：rxx=2rhh/（1+rhh）

第五章心理测量学知识

rhh为一半分数的相关系数，

rxx为测验在原长度时的信度估计值。

（2）同质性信度:A主要表示测验内部所有题目间的一致性。

B库德－理查逊公式:K－R20和K－R21，只适

用于是非题

4、评分者信度：（1）一般要求在成对的受过训练的评分者之间平均一致性达0.9以上。

（2）方法是随机抽取若干份测验卷，由两位评分者按评分标准分别，再根据每份试卷组

成的两列分数计算相关系数。

（3）所有题目看起来好象测量同一特质，但相关很低，或为负相关时，则测验为异质的

（4）人的多数心理特征如智力、性格、兴趣等，具有相对的稳定性，间隔一段时间，不

会有很大变化

（5）不同的信度反应误差的不同来源

5第五章心理测量学知识8

xx2、了解实得分数再测时可能的变化情形。

测量标准误：SE= Sx 1-rxx

大约有95%的可能性真实在所得分数±1.96SE的范围内，或有5%的可能性落在范围之外。

置信区间：X－1.96SE＜XT≤X＋1.96SE

比较不同测验分数的差异：＠甲被试在韦氏成人智力测验中言语智商为102，操作智商为110，已知两

个分数都是以100为平均数，15为标准差的标准分数，假设言语测验和

操作测验的分半信度分别为0.87和0.88，那么假被试的操作智商不显著

高于言语智商。

四、影响信度的因素：1、标本特征：（1）样本团体异质性的影响：一般而言，若获得信度的取样团体较

为异质的话，往往会高估测验的信度

（2）样本团体平均能力水平的影响:对于不同水平的团体，题目难度会影响信度相关系

数受样本是否异质性及样本团体平均能力水平的影

响。

2、测验长度：（1）在一个测验中增加同质的题目，可以使信度提高。

（2）测验越长，测验的测题取样或内容取样就越有代表性。

（3）测验越长，被试的猜测因素影响就越小

（4）增加测验长度的效果应遵循报酬递减率原则

（5）测验过长，有时反而会引起被试的疲劳和反感而降低可靠性

＠40题目的测验信度为0.80，欲将信度提高到0.9，则需增加60个题

目。

3、测验难度：各类选择题平均难度为：（1）五择一测题，0.70；

（2）四择一测题，0.74；

（3）三择一测题，0.77；

（4）是非题，0.85。

4、测验的时间间隔（1）以再测法或复本法求信度，两次测验相隔时间越短，其信度系数越大；

间隔时间越久，其他变因介入的可能性越大，受外界的影响也

越大，信度系数便越低。

第四节测验的效度

一、效度：是指所测量的与所要测量的心理特点之间的符合程度，或者简单地说是指一个心理测验的准确性。

第五章心理测量学知识

效度定义公式：在一组测量中，与测量目标有关的真实方差（有效方差）与总方差的比率。

其中rxy2代表测量的效度系数，SV2代表有效方差，SX2代表总方差

效度的性质：1、效度具有相对性：在评鉴测验时，必须考虑测验的（1）目的

（2）功能

2、效度具有连续性

3、效度结果的有效性。

信度和效度的关系：（1）信度是效度的必要而非充分条件；

（2）效度是受信度制约的

二、效度的评估方法：按美国心理学会1974发行的《教育与心理测量之标准》一书中将效度分为三类

1、内容效度：指测验题目对有关内容或行为取样的适用性，从而确定测验是否是所测量行为领域的代表性取样。

内容效度的评估方法：（1）专家判断法：请有关专家对测验题目与原定内容的符合性做出判断，看测

验的题目是否代表规定的内容。

如果专家认为测验题目恰当地代表了所测内容,则测验具有内容效度。因此内容效

度又称逻辑效度。

专家判断法的步骤：A定义好测验内容的总体范围

B编制双向细目表

C制定评定量表来评估测验的整个效

度，

D由每位评分者在评定量表上做出判断

（2）统计分析法：A计算两个评分者一致性。

B复本相关

C再测法

（3）经验推测法

内容效度的特性：A不是普遍适用的。

B内容效度有时间上的特定性。

C在编制测验时，表面效度是一个必须考虑的特性。最高行为的测验要求有较高

的表面效度

2、构想效度：（1）也叫构思效度，或结构效度。

（2）主要涉及的是心理学的理论概念问题

（3）指测验能够测量到理论上的构想或特质的程度

（4）测验的结果是否能证实或解释某一理论的假设、术语或构想，解释的程度如何。

构想效度的估计方法：1、对测验本身的分析法A用测验的内容效度可以作为构想效度的证据。

B测验的内部一致性指标可以作为构想效度的证据

C分析被试者对题目的反应特点可以作为构想效度

的证据

2、测验间相互比较法：A相容效度：计算两种测验之间得分的相关，其中一种测验是待研

究效度的，是一种是已有效度证据的成熟测验。但相

者测量的是同一种心理特质，假如相关高，说明新测

验所测量的特质确实是老测验所反映的特质或行为。

B区分效度：

C因素分析法：

3、效标效度的研究证明法

4、实验和观察法证实法（实验法=再测法；观察证实法=经验推测法）

3、效标效度（实证效度）：是测验预测个体在某种情境下行为表现的有效性程度。分为：A同时效度

B预测效度

一个好的效标必须具备的条件：A效标测量本身必须有效。效标必须能最有效地反映测验的目标。

B效标必须具有较高的信度，稳定可靠。

C效标是可以测量的，即可用数字和等级表示。

第五章心理测量学知识

D效标测量的过程要是方法简单，节省实用。

效标效度的评估方法：1、相关法：相关法是求分数与效标资料间的相关，结果称为效度系数。

最常用的方法： A积差相关

B二列相关公式

C点二列相关公式

D贾斯朋多系列相关公式。

2、区分法：是检验测验分数能否有效地区分由效标所定义的团体的一种方法

3、命中率法：是指当测验用来做取舍的依据时，用其正确决定的比例作为效度指标的

一种方法。

命中的情况是指：（1）预测成功而且实际也成功

（2）预测失败而且实际也失败

三、效度的功能

预测误差：1、效度系数的实际意义常常以决定系数来表示，如测验的效度是0.80，则测验的总方差中

有64%的方差是测验分数的方差。

2、rxy2代表效度系数的平方，即决定系数；Sy代表效标成绩的标准差

预测效标分数：Y对X的回归方程：其中Y是预测的效标分数，a是纵轴的截距，b是斜率

预测效率指数：E=100（1-K）

预测效率

5第五章心理测量学知识8

指数E的大小说明使用测验比盲目猜测能减少多少误差。

如一个测验的效度系数为0.80，E=40，这表明由于该测验的使用，使得我们在估计被试的效标分数时减少了40%的误差。

四、影响效度的因素：（一）测验本身的因素：1、测验材料必须对整个内容具有代表性。

2、测题设计时避免误差题型的使用。（如事非题）

3、测题难度适中，有区分度。

4、测验长度要恰当。

5、测题的排列按先易后难的顺序。

（二）测验实施中的干扰因素：1、主试的影响因素。

2、被试的影响因素。

（三）样本团体的性质：1、样本团体的异质性：（1）团体越同质，分数分布范围越小，测验效

度起低，团体越异质，分数分布

范围越大，测验效度越高

2、干涉变量：团体的性质包括年龄、性别、教育水平、智力、动机、兴趣、职业和

任何有关的特征，使得测验对于不同团体具有不同的

预测能力，故测量学上称这些特征为干涉变量。

找出干涉变量的方法（美国心理学家吉赛利）：

1、用回归方程求得每个人的预测效标分数，将该分数与与实际效标分数相比

较，获得差异分数D，如果D的绝对值很大，说明测验中可能存在干涉变

量

第五章心理测量学知识

2、根据样本团体的组成分析，找出对照组，分别计算效度，从而找出干涉变

量。

3、对于欲测团体，根据某些易见的干涉变量将其区分为预测性高和预测性低

两个亚团体，对于预测性高的团体，获得的测验效度

会有所提高。

效标的性质：（1）使用皮尔逊积差相关系数的的前提条件是：假设两个变量的关系呈线性分布。

（2）效标测量本身的可靠性如何亦是值得考虑的一个问题，效标测量的可靠性即效标

测量的信度。

第五节项目分析：项目分析：1、定性分析：包括内容效度，题目编写的恰当性和有效性等。

2、定量分析：包括题目难度和区分度的分析。

一、项目的难度

难度：1、是指项目的难易程度。

2、难度的指标通常以通过率表示，即答对或通过该题的人数百分比来表示：

P＝(R/N) ×100%，P代表难度，R代表通过的人数，N代表总人数，P值越大，难度越低

3、通俗性：在非能力测验中与难度类似的指标，

难度的计算（1）定义公式 P＝(R/N) ×100%〖200学生，答对某项目120人，则该项目难度120/200＝0.6〗

（2）二分法公式：：P＝(Ph+Pl)/2〖370名被试，高分低分组各100人，高分组70人答对1题，

低分组40人答对1题，则1题难度（0.7+0.4）/2＝0.55〗

（3）非二分公式：：P＝（X平/Xmax）X100%〖某题满分15，考生平均分9.6分，则该题难度9.6/15＝0.64〗

排除猜测对结果的影响的矫正公式：Cp＝(KP-1)/(K-1)，Cp为较正后通过率，P为实际通率，K为备选答案题目

难度水平的确定1、难度P值越接近0或1，越无法区分被试之间能力的差异，

2、P值越接近0.5，区别力越高

3、为了使测验具有更大区别力，应选择平均难度在0.50左右的试题比较合适

4、各题的难度在0.30-0.70之间。

5、

对于选择题，其难度应该大于概率水平，如是非题为0.75，四选一题为0.63左右

二、项目的区分度：项目的区分度也叫鉴别力，是指测验项目对被试的心理特性的区分能力。

鉴别指数的计算步骤：（1）按测验总分高低排列答

（2）确定高分组、低分组，每一组取答卷总数的27%，

（3）分别计算高分组和低分组在该项目上的通过率或得分率

（4）按下列公式估计出项目的鉴别指数：

D＝Ph-PL，D为鉴别指数，

Ph为高分组在该项目上的通过率或得分率，

PL低分组在该项目上的通过率或得分率

5第五章心理测量学知识8

2、二列相关：适用于两个连续变量，但其中一个变量被人为分成两类。

3、ф相关：两个变量都为二分称名变量时。

区分度与难度的关系： 1、较难的项目水平对高水平的被试者区分度高

2、中等难度的项目对中等水平的被试区分度高

3、项目的难度分布以常态为好，并平均P为0.50，这样不仅能保证多数项目具有较高的区

分度，而且可以保证整个测验对被试具有较高的区分能力。

第六节测验编制的一般程序

第五章心理测量学知识

一、测验的目标分析：1、测验的对象：即施用团体。必须掌握施测者的：（1）年龄

（2）受教育水平

（3）社会经济水平

（4）阅读水平

2、测验的用途：（1）编制测验前应明确：①诊断

②选拔

③预测。

（2）测验用途分类：①显示性测验：A样本测验

B标记测验

②预测性测验

3、测验的目标：是指编制的测验是测什么的，即用来测量什么样的心理变量或行

为特征

分析步骤：（一）工作分析：1、确定哪些心理特征和行为可以使要预测的活

动达到成功。

2、建立衡量被试是否成功的标准，这个标准我

们称之为效标。

（二）对特定概念下定义

（三）确定测验的具体内容

双向细目表说明了选题的方向和比例，并要使其更具体化，与相应的测题对应。

二、测验的编写1、搜集资料：测验题目的来源（1）已经出版的标准测验。

（2）理论和专家的经验

（3）临床观察和记录①②③④

2、命题的一般原则：（1）内容方面：①要符合测验目的

②取样有代表性

③避免贪多而乱出题

④题目间内容相互独立。

（2）文字方面： ①使用准确的当代语言

②语句简明扼要

③一句话只说明一个概念

④排除与答案无关的因素

（3）理解方面： ①除了创造力和人格测验外不应具有引起争议的可

能

②有确切答案

③内容不要超出受测团体的知识水平和理解能力

④格式要不被人误解。

（4）社会敏感性方面：菲力普鼓励被试对敏感问题回答的方法：

①命题时假定被试具有某种

行为

②命题是时假定规范不一致。

③提出该行为是觉的，虽然是违

规的。

3、测题的编制要领：（1）选择题：①题干问题明确，避免与选项用词一致

②选项简明扼要，长度相等

③每题只给一个正确答案

④选项最好用同一形式

（2）是非题：①内容应以有意义的概念、事实或基本原则为基础

②每道题只能包含一个概念

③尽量避免否定的叙述

④“是”和“非”的题数应基本相等，随机排列

（3）简答题：①宜用问句形式。

②填充形式的空格不宜太多

③每题应只有一个正确答案，

第五章心理测量学知识

（4）操作题：①明确所要测量的目标，并将其操作化

②尽量选择真实性程度较高的项目

③指导语要简明扼要

④制定评分标准，确定计分方法。

三、测验的编排与组织：1、选择试题形式需要考虑：（1）测验的目的

（2）材料的性质

（3）接受测验的团体的特点

（4）各种实际因素

2、审定试题要注意题目的：（1）范围应与测验计划的双向细目表相一致

（2）数量要比最后所需的数目多一倍至几倍

（3）难度必须符合测验目的的需要

（4）说明必须清楚明白

3、测题的编排原则：1、测题难度排列宜逐步上升，先易后难。

2、尽可能将同类型的题放在一起。

3、依据各种类型测题本身的特点编排题目与选项。

4、测题的排列方式：（1）并列直进式

（2）混合螺旋式

5、预测应注意： 1、预测对象应取自将来正式应用测验的群体

2、预测实施过程与情境应力求与正式测验时的情况相近似。

3、预测的时限可稍放宽，最好使每个被试者都能将题目做完。

4、预测过程中，随时记录被试的反应情形。

6、编写指导手册：1、测验的目的和功用。

2、测验编制的理论背景，选材的原则、方法。

3、实施测验的说明，测验的标准答案和记分方法。

4、测验的心理计量学特征、常模资料。

第七节心理测验的使用

一、主试者的知识结构：（1）心理学基础知识

（2）心理学专业理论知识

（3）本行业的专业知识

（4）心理测验专业技能

主试心理测验专业理论知识包括：A对心理测验的特点和性质、作用的认识

B对心理测验局限性的认识

C了解测验的基本特征

D熟悉保证心理测验标准必要性

主试的专业技能：主测必须具有实际操作心理测验的专业技能和经验，接受严格、系统的心理测验专

业训练，熟悉有关测验的内容、适用范围、测验程序和记分方法等。

主试的职业道德： 1、测验的保密和控制使用。

2、测验中个人隐私的。

二、测验的选择应注意：1、所选的测验适合测量的目的。

2、所选的测验必须符合心理测量学的要求

三、测验前的准备工作：1、预告测验

2、准备测验材料

3、熟悉测验指导语

4、熟悉测验的具体程序

测验中主试的职责：1、按照指导语的要求实施测验

2、测验前不讲太多无关的话。

3、主试者不应对被试者的反应做出任何暗示性反应

4、对特殊问题要有心理准备，

协调关系：是指主试与被试之间一种友好的、合作的、能促使被试最大限度地做好测验的一种关系。

四、测验实施的程序1、指导语1、如何选择反应形式

2、如何记录这些反应

3、时间限制

第五章心理测量学知识

4、如果不能确定正确反应时该如何操作

5、例题，要附答案。

6、有时告知被试测验目的

2、时限：典型行为测验：大多不受时间限制。

最高作为测验，在速度测验中尤其要注意时限。

3、测验的条件： 1、完全遵从测验手册对环境的要求。

2、记录下任何意外的测验环境因素。

3、在解释测验结果时也必须考虑环境因素。

五、被试误差及控制方法1、应试技巧：测验油子的表现：（1）能觉察正确答案与错误答案间的细微差别

（2）懂得合理分配测验时间

（3）常常是各种题型都见过

（4）熟悉测验的程序

2、练习效应影响的表现：1、教育背景较差，经验较少或智力较高者，练习效应

较大。

2、着重速度的测验，效应明显。

3、着重实施相同的测验，受影响大于复本测验。

4、两次测验间的间隔越长，效应越小，三个月以上可忽

略。

5、一般练习效应在1/5个标准差以下，三次以不再明显。

3、受应试动机影响较大的测验：（1）成就

（2）能力倾向

（3）智力测验

4、适度的焦虑：会提高成就、能力倾向、智力测验的成绩

5、影响测验焦虑的因素：1、能力高的人，一般较低，而对自己能力没有把握的

人，易焦虑。

2、抱负水平过高，求胜心切，易焦虑。

3、缺乏自信、患得患失、情绪不稳的人易焦虑

4、测验成绩与被试的关系重大，压力过大，易焦虑。

5、经常接受测验的人焦虑较低。而对测验程序不熟时

焦虑增加。

6、反应定势：是指独立于测验内容的反应倾向，即由于每个人回答问题的习惯不同，而使

能力相同的被试得到不同的测验分数。常见的有四种：

（1）求“快”求“精确”的反应定势：给被试较充分的时间

和注明每道题的答题时间。

（2）喜好正面叙述的反应定势：“是”、“否”大致相等或“否”

多一些，可控制肯定定势。

（3）喜好特殊位置的反应定势：正确答案在各位置出现的概

率相等，可控制这种位置定势。

（4）喜好较长选项的反应定势：避免这类问题，尽量使选项

的长度一致

（5）猜测的反应定势

六、测验的评分

各种测验评分尽可能客观的三点要求：1、及时而清楚地记录反应情况。

2、要有一张标准答案或正确反应的表格，即记分键。

3、将被试的反应和记分键比较，对反应进行分类。

三点综合：准确无误的计分、合分

七、测验结果的报告

根据心理测验的特点进行分析：（1）应把测验分数当成一个范围而不是一个点。

（2）如韦氏智力测验中，通常是用测得的IQ值加减5（85%～90％的可信限水平）

的方法判断IQ值的波动范围

不能把分数绝对化，或一次结果轻下结论： 1、考虑个人在测验前经历。

2、考虑测验情境。

第五章心理测量学知识

3、有常模和信度、效度资料：（1）最匹配的情境

（2）最相近的团体

4、不直接比较来自不同测验的分数：

不同测验分数进行比较的计算方法：1、等百分位等值法

2、线性等值法：用相同的标准分数作等值的基础

报告测验分数应注意：（一）不应把测验分数直接被试本人或家长、学校班主任等有关人员，应告诉的十分谨慎。

是测验分数的解释和建议。（二）使用专业术语。如标准差和标准分数等。（三）要保证人知道这个测验是测量或预测什么（四）要使当事人知道他是和什么团体在进行比较。（五）要使当事人知道如何运用他的分数。针对选择和安置问题。（六）要考虑测验将给当事人带来什么心理影响。因会影响其自我评价，要（七）要让当事人积极参与测验的解释。鼓励其对分数提出相关问题。 12

相关推荐

第五章 心理测量学知识习题

第二篇：5第五章心理测量学知识8

专栏推荐

第五章心理测量学知识习题