心理测量学复习重点

心理测量与测验期末复习整理

第一章心理测量的历史

1.中国古代心理测量方法：观察法、访谈法、自然实验法

2.冯特1879年在莱比锡大学建立第一所心理实验室。

最先倡导测验运动的是优生学创始人高尔顿。他开创了个别差异心理学研究，并采用定量研究方法。

卡特尔1890年在《心理》杂志上发表的论文《心理测验与测量》，这是心理测量第一次出现在心理学文献上。

艾宾浩斯1885年发表《记忆》，开了用实验方法研究记忆的先河，使他成为第一位对记忆这种高级心理过程进行科学定量研究的心理学家。

比奈是发明智力测验常模量表的第一人。1905年，比奈与西蒙合作，编制世界上第一个智力测验——比奈-西蒙量表。

美国斯坦福大学的推孟教授1906年修订了斯坦福-比奈量表，首次采用智商（IQ）概念。

美国心理学家桑代克1904年出版《心理与社会测量导论》，是关于测验理论的第一部著作。

人格测验的先驱是克雷佩林，于1892年最早使用自有联想测验诊断精神病人。

3.心理测验的发展，主要受了发面影响：心理学理论的发展、统计学方法的进步。

第二章心理测量概述

1、测量就是根据一定的法则用数字对事物加以确定。

2、测量的三要素：事物、数字、法则。

3、测量的两个要素：参照点、单位 (参照点是确定事物的量时计算的起点，参照点有两种，绝对零点和相对零点。“0°C”属于相对零点，并不意味着没有温度。//好的单位要有确定的意义（即对同一单位），还要有相等的价值。但心理、教育测量所用单位不等值)

4、量表：要测量某个事物，必须有一个定有参照点和单位的连续体，将要测量的每个事物放在这个连续体的适当位置上，看它距离参照点的远近，以此得到一个测量值，这个连续体就叫量表。

※ 根据测量的精确程度（测量单位的理想/不理想），量表分为四类：

（1）命名量表：只能按照事物的某种属性对其进行分类或分组。如性别（男、女）、学历、企业性质、职业、地区等。

（2）顺序量表：是对事物之间等级差别或顺序差别的一种测度。它不仅可以将事物分成不同的类别，而且还可以确定这些类别的优劣或顺序。如： 1考试成绩：优、良、中、及格、不及格。 2教育水平：小学及以下、初中、高中、大学及以上。 3具有“>和<”、“＝和≠”数学特性，但不能进行加、减、乘、除运算。

（3）等距量表：不仅能将事物分为不同类型并进行排序，而且还可以准确地指出类别之间的差距是多少，表现为数值。如考试成绩百分制、温度等。

等距量表中没有绝对“零点”。“0”表示一个数值，即“0”水平，而不表示“没有”或“不存在”。如“0”度表示一种温度水平，并不是没有温度。

具有类别量表和顺序量表的数学特性外，其结果还可以进行“加、减”运算。

（4）比率量表：它具有上述三种尺度的全部特性外，还可以计算两个测度值之间的比值。既有绝对零点，又有相等单位。如长度米、重量千克、收入元等。

比率量表中“0”表示“没有”或“不存在”。

※ 等距量表只能进行加、减运算，而等比量表可进行加、减、乘、除运算。

5、心理测量a:根据一定的法则用数字对人的行为加以确定。即根据一定的心理学理论，使用一定的操作程序，给人的行为确定出一种数量化的价值。

6、心理测验b：通过观察人的少数有代表性的行为，对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。a是b的一种工具，是根据一定法则对人的行为用数字加以确定的方法。

7、心理测量的性质：3个

间接性：无法直接测人的心理，只能测量人的外显行为，如通过对测验题目的反应来推断他的心理特质。

相对性：P28

客观性：实际上就是测量的标准化问题。标准化程度越高，其测量结果的客观性也越高。（补：测验的客观性包括测验的刺激、对反应的量化、对结果的推论是客观的）

8、心理测量的基本功能是测量个体间的差异或同一个体在不同场合下的反应。测验在实际工作中 a 和理论研究中 b 有着广泛的应用。a:选拔人才、人员安置、诊断、预测、评价、咨询 b：搜集资料、建立和检验假说、实验分组。

第三章心理测量的误差

1、测量误差：指在测量过程中，那些与测量目的无关的因素所导致的测量结果不准确或不一致的测量效应。

可分1.随机误差2.系统误差。1.指那些与测量目的无关的偶然因素引起的误差。既影响测验的一致性、准确性 2.指…引起的一种恒定而有规律的效应。不影响一致性，只影响准确性。

要想使测量准确可靠，就必须减少误差；而要控制误差，就必须了解误差的来源。同物理测量一样，心理测量误差主要来自：1测量工具，2测量对象，3测量过程。（1造成的误差主要来自测验的编制过程，其中项目取样的影响最大。2即被试本身引起的误差最复杂最难控制。3的误差最容易控制和检验。）要想控制误差，就必须使测验标准化，即测验的编制、施测、评分、解释都必须标准化→控制导致误差的因素，减少误差，使测验分数更可信、有效。

2、测量理论一般分经典测量理论、概化理论和项目反应理论三大类。将以真分数为核心假设的测量理论及其方法体系，统称为经典测验理论（CTT），或真分数理论。~是最早实现数字形式化的测量理论。

真分数的操作定义：无数次测量结果的平均值。

CTT的基本思想：把任何一个测验成绩都看作是真分数和测量误差的和。即CTT假定，观察分数（X）与真分数(T)之间是一种线性关系，并且只相差一个测量误差（E).公式：X=T+E，这就是CTT数字模型。（注：此处误差指引起测量不一致的因素产生的效应，即指随机误差，不包括系统误差，后者不引起分数改变，因此包含在真值中。）

3、CTT不足、局限性：

⑴统计量的样本依赖性，抽样变动大⑵能力与难度量表的不一致性，测量误差大⑶信度估计的不准确性，复本编制难⑷测验结果拓宽的有限性，预测力缺乏⑸测量分数的测验依赖性，分数难比较。

第四章心理测量的信度

1.信度：指同一被试者在不同时间内用同一测验（或用另一套相等的测验）重复测量，所得测量结果的稳定性与一致性程度。（书上只是划线部分）在测量理论中，信度定义：一组测量分数的真变异数与总变异数（实得变异数）的比率，即 r_XX= S_T²^→真值方差 S_X²^→观测值方差

2.信度作用：⑴…是测量过程中随机误差大小的反映（注：信度并不反映系统误差）⑵…可以帮助在不同测验分数之间进行比较⑶…可以用来解释个体测验分数的意义

4.影响信度的因素：…是测量过程中随机误差大小的反映。随机误差大，信度就低。所以引起随机误差的因素一般都影响信度。主要有：⑴被试因素⑵主试-⑶施测情境-⑷测量工具-⑸两次施测的间隔时间

5.提高信用的常见方法：⑴适当增加测验项目的长度⑵因素分析和鉴别力分析⑶弱势矫正⑷控制测验项目的难度⑸选取适当的被试群体，提高测验在各同质性较强的亚团体上的信度。

第五章心理测量的效度

1.效度：（指一个测验或量表实际能测出其所要测的心理特质的程度。）/所有变异中，只有由所观察的心理特性引起的变异部分才是要真正测量的，它在变异中所占比重就是效度的大小。/效度的基本问题是：测验要测量的是什么。/信度不考虑系统误差，效度考虑。

2.效度性质：⑴效度是针对测验结果的eg.这个智力量表真的能考查智力吗？；⑵-是针对某种特定的测量目的的→所以不具有普遍性；⑶-只有程度上的差异。心理特质较隐蔽，通过其行为表现来推测，只能达到某种程度上的准确。所以效度是程度上的差别，而不是全或无的差别。（补充说明：相对性：在评鉴测验的效度时，必须考虑其目的与功能）

3.效度验证：收集大量资料和证据来检验测验效度的工作过程。

常用的效度概化验证的方法：⑴交叉效度评定 ⑵元分析

4.效度与信度的关系:⑴信度高是效度高的必要非充要条件。所以，3种组合：高信高效，高信低效，低信低效/从信度和效度定义可解释：效度Val=Sv²/Sx²,信度r_XX =S_T²/S_X²，而S_T²=Sv²+S_I²，因此信度的提高只给Sv²的增加提供可能性，至于是否能提高效度还要看S_I²的大小。可见信度高效度不一定高，但一个测验要想使效度高，信度必须高。⑵测验效度受信度的制约。

5.效度种类：最常见分类方式是根据效度验证的证据来源，把效度分为：内容效度效标关联效度、构念效度。

6.注：楷体书上无，属于补充

7.其他效度：⑴表面效度：（是测验要求被试做的事情和被试对比理解之间的互动）在技术意义上，它不能算是一种效度；它不是指测验实际上所测量的效度，而是指测验表面上看起来所要测的东西。表效影响被试测验动机。适当的表效是可以的，测验题目引起被试的动机与兴趣，但也有较好的隐蔽性⑵

⑶合成效度与区别效度：职业心理学家发展出来的两个新的效标关联效度。

区别效度与区分效度在概念和使用范围上都有所区别：ab区分效度与聚合相对的，是用以检验构念效度的指标。而区别效度用以检验职业测验关联效度的指标，它有不同含义：某个心理测验的得分，与两种不同性质的职业绩效之间的相关系数的差异，可以作为该测验的区别效度，用以推测选择哪种职业其成功的可能性如何。

⑷内部效度a与外部效度b：a=内部一致性效度，反映测验的构念效度。b：指将研究结果概化到其他情境和总体的程度。

8.影响效度的因素：测验本身因素1.测验的、校标因素、样本的代表性、干涉变量。

9.效度的应用：?效度在测验编制中的重要作用?-在选拔中的重要影响?-在决策中的重要影响④-与信息组合⑤-在人员分类与安置中的重要影响。

第六章心理测验的编制

1.心理测验的编制的程序：“三阶段六步骤”

⑴测验编制的准备阶段：①确定测验目的②拟定编题计划

⑵测验的正式编制阶段：①产生测题（1搜集有关资料 2选择测题形式 3编写修订测题）

②合成测验（1预测和复核2项目选择和编排3等值复本的编造）

⑶测验编制的完善阶段：①测验的标准化（测验内容、实施过程、评分计分、分数解释标准化）

②测验性能评估 ③编写测验指导手册

2.心理测验编制的主要原则：

（一）~基本原则：1.信度好 2.效度高 3.难度适中 4.区分度强

（二）~具体要求：4点：针对题目内容、语言、表达、理解的要求

心理测验编制的具体技术：（想要编制良好的测验，除了必须遵循前述测验编制的程序和命题原则外，还要掌握命题的方法与技巧。）（一）客观性题目的编制要领：1.多选题 2.是非题与改错题 3.匹配题与排列题

（二）主观性……： 1.填空题与简答题 2.论文题 3.应用题 4.操作题 5.联想题

3.项目分析含义&意义（why进行xmfx）：信度与效度是对测验整体的分析，而xmfx则是细化的、对测验中每个项目（item）的具体分析。信度好与效度高必然是高质量的项目的综合反映。通过预测，对测验的各个项目或题目进行分析，是编制和修订测验的重要环节。在xmfx基础上，通过对项目的筛选、修订，可以改进测验的信度和效度，使测验更加简洁、实用、有效、可靠。（评价项目质量的主要指标是难度和区分度）

4.难度：指项目的难易程度。最高作为测验中称“难度”，经典作为测验中指“通俗性”。两者都指在总体中，能够正确或确切回答某项目的人数。

5.测验难度水平的确定：效标参照测验、掌握测验，一般不考虑难度；选拔测验，nd最好接近录取率；对于选择题，nd一把把应大于猜测概率。题目nd接近或等于0.50比较理想，此时项目具有最大鉴别力。（一般，使项目平均nd接近0.5，而各项目nd在0.5±0.2间变化即可，若nd都为0.5，题目过分同质，也降低区分力。)

6.难度对测验的影响：nd影响测验分数的分布形态、测验的信度、测验的鉴别力（区分度)

7.区分度：指测验项目对被试心理品质水平差异的区分程度，又称鉴别力。qfd也是评价项目质量和筛选项目的主要指标和依据。（qfd好的测验实际水平高的被试应的高分，低得低分。Qfd高的项目，将不同水平的被试区分开来；qfd低的项目，不能很好鉴别被试水平。)

8.难度计算：p157（一）二分法计分项目的难度计算 1.通过率2.两端分组法

（二）非… 1.用被试得分平均数估计2.用难度的校对公式计算

9.区分度计算：p162

10.区分度与信度的关系：关系密切，一般测验的信度随区分度的提高而增长。（所以，提高题目区分度是提高信度的方法之一）

区分度与难度关系：二者都针对一定团体而言。一般，较难项目对高水平被试区分度高，较易…低水平…高。/难度中等的题目区分度最高。

11.CTT中，测量误差是一个统计量，依赖于样本；而在IRT中，测量误差不是一个统计量，它是关于θ的函数。

12. 保证试题的稳定性、分数的公平性、和合格试题的有效存储、高效成批生成等，涉及到测量理论中两个问题：测验等值、题库建设。

一、1.测量（/项目）等值：在心理与教育测量中，把测量同一种心理特质的不同测验分数，通过一定的数学模型转换成同一单位系统中的过程。简言之，等值是将测验不同版本的分数统一在一个量表上的过程。

2.等值的性质与条件：等值是有条件的，并非任意两个测验都可以等值。等值的条件由测验的性质决定。因此，测验等值的条件与性质是统一的。首先，进行等值的测验必须是测量同一心理特质或能力（即同质性）。只有同质的事物相比较才有实际意义。其次，只有信度相等的测验才能等值（即等信度性）。两个测验即使测量同一心理特质，但信度不同，也不能等值。//具体说来，性质&条件要求如下：1公平性。又叫等价性，测验等值转换关系应具有公平性。（包含等信度性、同质性、等难度性）2对称性。又叫可逆性，指…是双向的3横跨群体的不变性。…应具有唯一性、不变性4样本组间的一维性。又叫一致性、同规格性，指被等值的测验必须是测量同一维的心理特质。

3.的等值数据资料的收集方法有很多，一般分为两大类：一是采用以“人”为媒介的共同组等值设计；二是以“题目”为媒介的共同题等值设计。

等值设计：①单一组设计②共同考生设计③共同参照测验设计④共同参照测验和共同考生的混合设计

二、1.★题库：现代意义上的题库，一般指由适用于不同目的、技能和任务需要，且具有必要参数的大量合格或优质的试题的集合。（它严格遵循心理与教育测量理论，在精确的数学模型基础上建立起来的测量评价工具。)

2.题库建设的一般程序：试题开发--分析等值--存储建库--动态维护。

第七章心理测量分数的处理与解释

1.常模参照测验c：在分数解释时如果参照的是被试总体的分数分布（常模），则测验称为…。

标准参照测验b:…… 是某一事先定好的标准，则…。

2.c与b没有非常严格的界限，但二者有重要的区别：①两者测验目的不同②对题目统计量的考虑不同③内容领域规范的详略不同④对测验分数的推断不同。

3.c主要对测验的内容领域，对被试进行比较分析→ 判明被试在团体中的位置&发展水平。所以，c通常使用年龄分数、年级当量、百分等级分数、标准分数等常模。

4.c的分数解释可采用1发展量表、2商数、3百分等级、4标准分数等形式。（商数包括比率智商、教育商数、成就商数） ★注：2中，(1916推孟)比率智商IQ_R=（智龄MA/实际年龄CA）*100 智龄表心理发展水平，绝对量数，智商表心理发展速率，相对量数；

4中，离差智商：将一个人的测验分数与同龄组的人比较所得到的标准分数。（1949韦克斯勒）离差智商IQ_D= 100+15*Z ， 100为平均数，15为标准差，Z为根据每个被试的总量表分数在常模团体中的百分等级。

5.c和b的分数解释：

第八章心理测验的使用

1.选择测验要考虑到因素：(一)所选测验必须适合测量目的和对象(二)--必须符合测量学要求1.测验的功效性2.--敏感性3.--简便性4.--科学性5.--时效性(三)测验选择的其他考虑因素。Eg.测验的经济性、可得性、文化适用性。

2.标准化施测：当给被试的指示、施测条件、评分计分步骤都遵循同样详细和一致的程序时，此过程可称为…。否则分数解释的准确性和互比性↓。

3.测验标准化，包括：测验的指示语、测验时间限制、测验的环境条件、测验的评分计分都要标准化。

第九章能力测验

1.个体智力测验：指在一定时间内只能测量一个被试，其主要特点在于精确、反馈及时，但不经济。目前使用最广泛的个体测验：比奈量表、韦氏量表、考夫曼量表。

2.比奈-西蒙智力量表是世界上第一个智力量表，诞生于1905年。斯坦福-比奈智力量表使用智力商数(IQ)表示智力水平。1960年，该量表舍弃比率智商，引入离差智商。1924年，陆志韦在斯坦福-比奈量表（1916年版）基础上，修订《中国比奈-西蒙智力测验》，1936年又与吴天敏合作完成第二次修订。

3.韦氏量表（成人、儿童、学龄前和学龄初期儿童）的三个智力分数（言语智商、操作智商、全量表智商）的平均数都为100，标准差都为15。韦克斯勒在1949年出版的WISC中第一次用离差智商代替比率智商。

4.考夫曼儿童成套评价测验（K-ABC)于1983年编成（2.5岁-12.5岁)

…青少年和成人智力测验（KAIT）1993年(11岁以上青少年及成人)，由2个分量表组成：晶体量表、流体量表。麦卡锡幼儿智力测验（MSCA）1972年编制，用于对儿童心理发展作综合的测定与评价。（2.5-8.5岁儿童)

5.团体智力测验：指可以同时对多名被试同时实施的智力测验。（目前以纸笔测验为主，操作测验较少，题目以客观题为主，便于施测和计分）

6.能力倾向测验：?多重--?特殊--。?是有各种测量不同能力的分测验组合而成，用于了解一个人的潜能方向?用于了解能力的某一特殊方面的具体情况。

7.晶体智力：代表个体已经融入自身的在他们文化中得到认可的知识的程度。

流--：代表个体感知、记忆以及对基本观念进行广泛思考的“纯”能力。换言之，流--包含了不是由文化进行传递的智力能力。

第十章人格测验

1.人格测验：--就是通过一定的方法，对人的行为中起稳定的调节作用的心理特质和行为倾向进行定量分析，以便进一步预测个人未来的行为。

2.种类：自陈式人格测验、投射式--、情境式--。（投射式是为了克服自陈式所不能克服的问题——无意识动机造成的“防御心理”而发展出来的。）

3.编制方法：合理建构法、经验标准法、因素分析法以及三者的综合技术。

4. 基于因素分析的自陈式人格问卷:

①卡特尔16种人格因素问卷（16PF）是用因素分析法编制问卷的典型。16PF主要功能是对个体的人格因素作出分析，从16个方面描述个体的人格特征。16种人格因素各自独立，每种因素和其他因素的相关较小。

②《艾森克人格问卷》（EPQ）的理论基础是艾森克提出的人格三维度理论，三个基本维度是：内外倾、神经质、精神质，此处人格维度是个连续体。EPQ有四个分量表：E、N、P、L。问卷分成人和儿童两种，常模采用T分数。

联想型投射实验：罗夏墨迹测验（RIT）时非常具有代表性的投射测验，也是最流行的之一。由瑞士精神病学家罗夏1921年编制完成，主要是通过观察受测者对一些标准化的墨迹图形的自由反应，评估受测者投射出来的个性特征。

第十一章临床测验

1.概念：广义上，所有用于临床诊断的测验都可称之为…。狭义上，指专为医学临床诊断而设计的测验。

2.功能：

第十二章职业测验

1.概念：当测验应用于职业指导以及选拔、评估程序时，我们便称其为…。

2.霍兰德的职业兴趣理论：美国职业指导专家约翰.L.霍兰德，6类型：艺术型（A），传统型（C），经营型（E），研究型（I），现实型（R），社会型（S）。

3.霍兰德的职业兴趣量表主要包括：职业偏好量表（VPI）和自我导向探查表（SDS)。

第十三章

1.未来测验的发展：①新测验不断涌现②测验的专业品质将不断提高③测验的应用领域越来越专门化④测验形式更加灵活多样⑤电脑与网络心理测验的兴起与问题

2.测验的中国化：完全不受文化制约的测验时不存在的，所以对外国的测验要从内容和常模两方面进行修订。从以下方面入手：①全面了解西方测验②初试和修订测验③评价测验的应用价值④修订测验常模

相关推荐

心理测量学复习重点

专栏推荐