心理与教育测量知识点汇总

e心理与教育测量知识点汇总

第一章心理与教育测量概论

一、名词解释

1. 测量：依据一定的法则使用量具对事物的特征进行定量描述的过程。

2. 测量的参照点：测量工作中必须有一个量的起点，这个起点就叫做测量的参照点。

3. 量表：能够使事物的特征数量化的数字的连续体就是量表。

4. 心理与教育测量：依据一定的心理学和教育学的理论，使用测验对人的心理特质和教育成就进行定量描述的过程。

5. 测验的标准化：是编制测验的一个重要步骤，是指测验的编制、实施、记分以及测量分数解释的程度的一致性。

二、简答与论述

1. 简述理性测量单位应具备的条件？P4

一是要有确定的意义，即对同一单位，所有的人的理解都是相同的，不允许作出不同的解释；二是要有相等的价值，即第一个单位与第二个单位之间的距离等于第二个单位与第三个单位之间的距离。但是在某些情况下，要具备这两个条件是相当困难的。

2. 简述四种测量量表及其特点？P5-6

①命名量表，是最低水平的测量量表，它只是用数字代表事物或用数字对事物进行分类。数字只是事物的符号，没有任何数量的意义，不能进行代数运算。可进行的统计方法有百分比、次数、众数和X2检验。

②顺序量表，是次低水平的测量量表，不仅能够指代事物的类别，而且能够表明不同类别的大小、等级或事物具有某种特征的程度。在顺序量表中，数字只表示等级、大小和程度的顺序，它既没有相等的单位，也没有绝对的零点，因此不能进行代数运算。可进行的统计方法有中位数、百分位数、等级相关系数和肯德尔和谐系数等。

③等距量表，是较高水平的测量量表，不仅能够指代事物的类别、等级，而且具有相等的单位，可以进行加减运算。但它没有绝对零点，不能进行乘除运算。可进行的统计方法有平均数、标准差、积差相关系数以及t检验和f检验。

④比率量表，也叫等比量表，是最高水平的测量量表，除了具有类别、等级、等距的特征外，还具有绝对的零点，可进行加减乘除运算。可进行的统计方法除了与等距量表相同外，还与几何平均数、变异系数相同。

3. 论述心理与教育测量独特的性质？（或心理与教育测验的特点）P7

心理与教育测量是依据一定的心理学和教育学的理论，使用测验对人的心理特质和教育成就进行定量描述的过程，其独特性表现在以下几方面：

①心理与教育测量依据的法则在很大程度上只是一种理论，很难达到如同物理测量依据的法则那样普遍被人们接受的水平。

②心理与教育测量的对象是人的心理特质和教育成就。教育成就的含义比较明显，是指一个人通过接受教育而获得的知识水平。心理特质的含义比较含混，不大能够给予清楚的界定。这就决定了心理与教育测量只能是一种间接测量。

③心理与教育测量的量具是由有关领域的专家编制，经过长期的试用、修订、完善而逐渐形成的标准化测验。

④心理与教育测量的目标虽然是对人的心理特质和教育成就进行定量分析，但这种定量分析的精确度远不及物理测量的精确度高。

4. 论述心理与教育测量究竟是否必要和是否可能？P8

（1）我国古代学者孟子早在两千多年前就给予了明确的并且是肯定的回答。

（2）19xx年，桑代克提出“凡客观存在的事物都有其数量”，19xx年，麦柯尔指出“凡有其数量的事物都可以测量”，这两个命题被公认为是心理与教育测量的理论基础。

（3）从辩证唯物主义的观点看，任何事物都是质和量的统一，事物的质的差异是分类的前提，而事物的量的差异则是测量的前提。根据这一前提，我们认为：

①人的心理现象和知识水平如同其他一切物理现象一样是有差异的，这种差异不仅包括质的方面，也包括量的方面。因为有差异，所以有必要测定差异的数量，描述差异的程度。 ②心理特质和知识水平虽然不是物理实体，不能直接测量，却必然要表现于人的外部行为之中，并调节着人的外部行为。因此，通过观察人的外部行为的差异就有可能测量出人的心理特质和知识水平的差异。

③心理与教育测量的准确性、可靠性和精确度如同其他一切测量技术一样是相对的，也同其他一切测量技术一样必然随着科学技术的进步和发展而逐步提高。

5. 为什么从本质上讲，心理与教育测量的量表属于顺序量表？P8-9

(1)从所使用的参照点来说，教育测量与心理测量的领域的参照点均为相对参照点。

(2)从所使用的单位来说，，教育和心理测量的单位远没有其他测量的单位成熟和完善。 ①教育与心理测量所使用的单位的意义不太明确。

②在教育与心理测量中的单位常常不等值。这就决定了心理与教育测量的量表不是直接的等距量表。

6. 测验标准化应具备的条件（或测验标准化的内容是什么）P10-11

（1）测验内容的标准化。标准化的首要前提，是所有接受测量的个人实施相同的或等值的测验内容。测验内容不同，所测得的结果便没有可比较的基础。

（2）施测条件的标准化。标准化的第二个条件，是所有接受测量的个人必须在相同的施测条件下接受测验。包括：相同的施测条件、相同的指导语、相同的测验时限。

（3）评分规则的标准化。评分规则的标准化要求评分结果具有客观性，只有当评分的结果具备了客观性，才能将测量分数的差异归之于个人心理特质和知识水平的差异。

（4）测验常模的标准化。编制测验的一个重要步骤是编制测验的常模。

7. 简答个别测验的优缺点？P13

优点：①主试对被试的做题行为有仔细的观察，有机会获得测量分数之外的信息。 ②主试与被试面对面交流的机会更多，容易与被试建立起融洽的合作关系。

③对于一些特殊被试（如幼儿、文盲），只能采用个别测量，以便主试代替被试记录其行为反应。

缺点：①费时间，难以在短时间内收集大量的测量资料。

②测量手续比较复杂，需经过较高水平训练的人担任主试。

8. 论述心理与教育测验的功能？P15-17

（1）理论研究功能

①收集研究资料

②建立和检验理论假设

③实验分组

（2）实际应用功能

①选拔人才

②人员安置

③心理诊断

④描述评价

⑤心理咨询

第二章心理与教育测量的产生与发展

简答与论述

1. 中国古代心理与教育测量思想的特点？P26

①中国古代社会的心理与教育测量思想都是描述性的，是非定量的。这当然和当时的整个科学技术水平是相适应的。

② 中国古代社会的心理与教育测量是分类式的。就能力测量和成就测量（即科举考试）而言，分成高、中、低几个层次；就性格测量而言，分成若干种类型。

③在中国古代社会的心理与教育测量思想中注重对人作整体的鉴定和评价，并倾向于和人的道德品质联系起来。

④中国古代社会的心理与教育测量思想与教育中的因材施教及人才使用有着密切的联系，它一开始就具有强烈的应用性质。

2. 简述心理与教育测量的当代趋势？p33

①由于信息加工心理学的兴起，测量学界倾向于将实验法和测验法相结合，产生了信息加工测验。

②由于计算机技术的迅速发展，传统的纸笔测验逐渐被电脑程序测验所取代，从而大大提高了测验的效率。

③针对经典测验理论（即真分数理论）的某些缺陷，提出了一些新的测量理论，尤其是项目反应理论和概化理论，不仅在理论上取得了巨大成就，而且在应用上显示出强大的生命力。

第三章经典测验理论的基本假设

一、名词解释

1. 测量误差：是在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。

2. 随机误差：是那种由与测量目的无关的、偶然因素引起的而又不易控制的误差。

3. 系统误差：是那种由与测量目的无关的变因引起的一种恒定而有规律的效应。

4. 真分数：反映被试某种心理特质真正水平的那个数值叫做该特质的真分数。

二、简答与论述

1. 简述心理特质的含义？ P38-39

表现在一个人身上所特有的相对稳定的行为方式为人的心理特质，可从以下几方面理解： ①特质是一组具有内部相关的行为的概括，具有一定的抽象性。

②特质是“一种一般的神经心理系统……它可以综合不同的刺激，使人对这些刺激作出相同的反应”。

③特质是一个人身上比较稳定的特点。

④一个人的精神面貌（人格）是由多种特质分多个层次有机组合而成的。

⑤特质可以决定一个人对特定刺激的反应倾向，可以对人的行为进行某种预测。

2. 简述测量误差的来源？P41

心理测量的误差来自3个方面，即测量工具、被测对象和施测过程。

①在测量工具方面，心理测量与物理测量有所不同。心理测量工具通常是一套以测验（问卷）为核心的刺激反应系统（通常称作量表）。当量表在测查人的某种心理特质时，若项目所测

的东西与我们预测的目的之间出现偏差（如项目取样太少或太偏），则测量会出现误差。 ②在被测对象方面，造成测量误差的主要原因是受测者真正水平是否得到正常发挥。一般地，受测者的某种心理特质水平是相对稳定，但是他在接受测量时的心理和生理状态会影响其水平的正常发挥。

③在施测过程方面，产生测量误差的原因主要是一些偶然因素（恒定因素较易控制）。比如，在物理环境方面：实测现场的温度、光线、声音、桌面好坏、空间阔窄等会造成误差。在主试者方面：主试者的年龄、性别、外表及其施测时的言谈举止、表情动作、是否按规定实施测验等也会造成误差。此外，评分计分环节也是容易出现差错的地方。还有，若是出现意外干扰（如考场突然停电、有人作弊、计时表停了、试卷印刷或装订出错等），则同样会让考生分心或造成考场混乱，导致测量误差。

3. 简述真分数（或CTT）的数学模型及其假设？P42

既然观察分数很难等于真分数，那两者之间是个什么关系呢？经典测验理论假定，观察分数（记为X）与真分数（T）之间是一种线性关系，并只相差一个随机误差（记之为E）。即： X=T+E 这就是CTT的数学模型。

根据这一模型，引申出三个相关联的假设公理：

（1）若一个人的某种心理特质可以用平行的测验反复测量足够多次，则其观察分数的平均值会接近于真分数。即ε（X）=T 或ε（E）=0

（2）真分数和误差分数之间的相关为零。即ρ(T,E)=0

（3）各平行测验上的误差之间相关为零。即ρ(E1,E2)=0

第四章测量信度

一、名词解释

1. 信度定义：多次测量的结果间的一致性程度就叫信度，有时也叫测量的可靠性。

2. 重测信度：指的是用同一个量表对同一组被试施测两次所得结果的一致性程度，其大小等同于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。公式为：rxx=[∑（x-?x）

22（y-?y）]/√∑(x-?x)×∑(y-?y)

3. 复本信度：指的是两个平行的测验测量同一批被试所得结果的一致性程度，其大小等于同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。

4. 分半信度：指的是将一个测验分成对等的两半后，所有被试在这两半上所得分数的一致性程度。

5. 同质性信度：也叫内部一致性信度，是指测验内部所有题目间的一致性程度。

6. 评分者信度：指的是多个评分者给同一批人的答案进行评分的一致性程度。

二、简答与论述

1. 简述信度的作用？P46-47

（1）信度是测量过程中所存在的随机误差大小的反应。

（2）信度可以用来解释个人测验分数的意义。

（3）信度可以帮助进行不同测验分数的比较。

2. 简述信度的五种估计方法及其使用的前提条件？P48-53

（1）重测信度。它必须满足三个条件：①所测量的心理特性必须是稳定的。②遗忘和练习的效果基本上相互抵消。③在两次施测的间隔期内，被试在所要测查的心理特质方面没有获得更多的学习和训练。这一点，实际上也是要保证被试具有稳定的心理特质。

（2）复本信度。条件之一是首先要构造出两份或两份以上真正平行的测验（即A、B卷）。条件之二是被试要有条件接受两个测验。这种条件主要取决于时间、经费等几个方面。另外，

在报告结果时，应报告两次施测的间隔，以及在此间隔内被试的有关经历。

（3）分半信度。通常是在只能施测一次或没有复本的情况下使用。而且，在使用斯皮尔曼—布朗公式时要求全体被试在两半测验上得分的变异数要相等。当一个测验无法分成对等的两半时，分半信度不宜使用。

（4）同质性信度。

（5）评分者信度。

3. 论述影响测量信度的主要因素？P55-56

①被试方面。就单个被试而言，被试的身心健康状况、应试动机、注意力、耐心、求胜心、作答态度等会影响测量误差。就被试团体而言，整个团体内部水平的离散程度以及团体的平均水平都会影响测量信度。

②主试者方面。就施测者而言，若他不按指导手册中的规定施测，或故意制造紧张气氛，或给考生一定的暗示、协助等，则测量信度会大大降低。就阅读评分者而言，若评分标准掌握不一，或前紧后松，甚至是随心所欲，则也会降低测量信度。

③施测情境方面。在实施测验时，考场是否安静、光线和通风情况是否良好、所需设备是否齐备、桌面是否合乎要求、空间阔窄是否恰当等都可能影响到测量的信度。

④测量工具方面。以测量为代表的心理与教育测量工具是否性能稳定是测量工作成败的关键。一般地，试题的取样、试题之间的同质性程度、试题的难度等是影响测验稳定性的主要因素。

⑤两次施测的间隔时间。在计算重测信度和稳定性与等值性系数（复本信度之一）时，两次测验相隔时间越短，其信度值越大；间隔时间越长，其他因素带来影响的机会就多，因而其信度值就可能越小。

4. 简述提高测量信度的常用方法？P56-57

(1)适当增加测验的长度。

(2)使测验中所有试题的难度接近正态分布，并控制在中等水平。

(3)努力提高测验试题的区分度。

(4)选取恰当的被试团体，提高测验在各同质性较强的亚团体上的信度。

(5)主试者严格执行实测规程，评分者严格按标准给分，实测场地按测验手册的要求进行布置，减少无关因素的干扰。

第五章测量信度

一、名词解释

1. 效度：指一个测验或量表实际能测出其所要测的心理特质的程度。

2. 内容效度：指一个测验实际测到的内容与所要测量的内容之间的吻合程度。

3. 结构效度：指一个测验实际测到所要测量的理论结构和特质的程度，或者说它是指测验分数能够说明心理学理论的某种结构或特质的程度。

4. 实证效度：指一个测验对处于特定情境中的个体的行为进行估计的有效性。

5. 效标：是衡量一个测验是否有效的外在标准，它是独立于测验并可以从实践中直接获得我们所感兴趣的行为。

6. 效标测量：我们所感兴趣的行为往往是一个观念上的东西（观念效标），它必须用一个数字或等级来进行表达，即效标测量，它具有多样性、复杂性、特殊性和时间性。

二、简答与论述

1. 简述对效度概念的认识与理解？P59-60

（1）效度是一个相对的概念。表现在两个方面：①效度是相对于一定的测量目的而言的。②心理特质是较隐蔽的特性，只能通过他的行为表现来进行推测，因此，心理测量不可能达到百分之百的准确，而只能达到某种程度上的准确。

（2）效度是测量的随机误差和系统误差的综合反映。

（3）判断一个测量是否有效要从多方面搜集证据。

2. 简述效度与信度的关系？P61

根据公式SX2=SV2+SI2+SE2 ，可以得到信度与效度的关系如下：

（1）信度高是效度高的必要而非充分的条件。当随机误差的变异数SE2减小时，真实分数的变异数ST2增加，测验信度ST2 / SX2随之提高。信度的提高只给有效变异数SV2的增加提供了可能，至于是否能提高效度，还要看系统误差变异数SI2的大小。可见，信度高不一定效度高。但一个测验要想效度高，真分数的变异数必须占较大的比重，即测验的信度必须高。

（2）测验的效度受它的信度制约。根据效度和信度的定义（rxy2= SV2 / SX2 ，rxx= ST2 / SX2 ）以及公式（ST2=SV2+SI2）可得。

3. 简述内容效度及其应用范围？P62

指一个测验实际测到的内容与所要测量的内容之间的吻合程度。估计一个测验的内容效度就是去确定该测验在多大程度上代表了所要测量的行为领域。这里，所要测量的内容或行为领域是依据测量目的而定的，它通常包括欲测的知识范围，以及该范围内各知识点所要求掌握的程度两个方面。

内容效度主要应用于成就测验，因为成就测验主要是测量被试掌握某种技能或学习某门课程所达到的程度。内容效度也适合于某些用于选拔和分类的职业测验。这种测验所要测的内容就是实际工作所需的知识和技能，编制这种测验应首先对实际工作作较细的分析，否则，题目取样的代表性就难以令人满意。需要注意的是，内容效度不适合用于能力倾向测验和人格测验。此外，要避免与表面效度相混淆。

4. 简述内容效度的确定方法？P62-63

（1）主要是逻辑分析法，其工作思路是请有关专家对测验题目与原定内容范围的吻合程度做出判断。其具体步骤是：①明确欲测内容的范围，包括知识范围和能力要求两个方面。这种范围的确定必须具体、详细，并要根据一定目的的规定好各纲目的比例。②确定每个题目所测的内容，并与测验编制者所列的双向细目表（考试蓝图）对照，逐题比较自己的分类与制卷者的分类，并做记录。③制作评定量表，考察题目对所定义的内容范围的覆盖率、判断题目难度与能力要求之间的差异，还要考察各种题目数量和分数的比例以及题目形式对内容的适当性等，对整个测验的有效性做出总的评价。

（2）统计分析方法。具体方法是：从同一个教学内容总体中抽取两套独立的平行测验，用这两个测验来测同一批被试，求其相关。若相关低，则两个测验中至少有一个缺乏内容效度；若相关高，则测验可能有较高的内容效度（除非两个测验取样偏向同一个方面）。

（3）再测法。操作过程是：在被试学习某种知识之前作一次测验（如学习电学之前考电学知识），在学过该知识后再作同样的测验。这时，若后侧成绩显著地优于前测成绩，则说明所测内容正是被试新近所学内容，进而证明该测验对这部分内容而言具有较高的内容效度。

5. 简述结构效度的含义、特点及应用范围？P63

（1）含义：结构效度是指一个测验实际测到所要测量的理论结构和特质的程度，或者说它是指测验分数能够说明心理学理论的某种结构或特质的程度。

（2）特点：①结构效度的大小首先取决于事先假定的心理特质理论。②当实际测量的资料无法证实我们的理论假设时，并不一定就表明该测验结构效度不高，因为还有可能出现理论假设不成立，或者该实验设计不能对该假设作适当的检验等情况。这就使得结构效度的获取更为困难。③结构效度是通过测量什么、不测量什么的证据累积起来给以确定的，因而不可

能有单一的数量指标来描述结构效度。

（3）应用范围：结构效度主要用于智力测验、人格测验等一些心理测验方面。

6. 论述结构效度的确定方法？P64

总的来说，结构效度的确定一般包括3个步骤：①提出理论假设，并把这一假设分解成一些细小的纲目，以解释被试在测验上的表现。②依据理论框架，推演出有关测验成绩的假设。③用逻辑的和实证的方法来验证假设。

具体地说，结构效度的估计可以有以下一些方法：

（1）测验内部寻找证据法。首先，我们可以考察该测验的内容效度，因为有些测验对所测内容或行为范围的定义或解释类似于理论构想的解释，所以，内容效度高实质上也说明结构效度高。其次，我们可以分析被试的答题过程。若有证据表明某一题目的作答除了反映所要测的特质以外，还反映其他因素的影响，则说明该题没有较好地体现理论构想，该题的存在会降低结构效度。再次，我们足可以通过计算测验的同质性信度的方法来检测结构效度。若有证据表明该测验不同质，则可以断定该测验结构效度不高。当然，测验同质只是结构效度高的必要条件。

（2）测验之间寻找证据法。首先，我们可以去考察新编测验与某个已知的能有效测量相同特质的旧测验之间的相关。这种方法叫相容效度法。其次，我们也可以去考察新编测验与某个已知的能有效测量不同特质的旧测验间的相关。这种方法也叫区分效度法。再次，我们还可以通过因素分析的方法来了解测验的结构效度。

（3）考察测验的实证效度法。有两种做法：其一是根据效标把人分成两类，考察其得分的差异。其二是根据测验得分把人分成高分组和低分组，考察这两组人在所测特质方面是否确有差异。

（4）多种特质——多种方法矩阵法。该方法实质是相容效度和区分效度法的综合运用。

7. 实证效度的含义、种类、作用及确定方法？P66-68

(1)含义：实证效度是指一个测验对处于特定情景中的个体的行为进行估计的有效性。也就是说，一个测验是否有效，应该以实践的效果来作为检验标准。实证效度又称效标关联效度。

(2)种类：根据效标资料搜集的时间差异，实证效度可以分成同时效度和预测效度两种。

(3)作用：同时效度主要用于诊断现状，在于用更简单、更省时、更廉价和更有效的测验分数来取代不易搜集的效标资料。预测效度的作用在于预测某个个体将来的行为。无论是同时效度还是预测效度，其目的都是想通过对测验在一个有代表性的样本上，用实证的方法来证明测验有效，于是在今后就可以用简便的测验去预测类似于样本的其他团体或个体的行为。

(4)确定方法：大体上可以分为一下几个步骤：①明确观念效标。②确定效标测量。③考察测验分数与效标测量的关系。从效度估计的方法上看，实证效度可以用一下方法进行估计：①相关法。计算测验分数与效标测量的相关系数（积差相关系法、等级相关法、二列相关法、四分相关法等）。②区分法。被试接受测验后，让他们工作一段时间后，再根据工作成绩（效标测量）的好坏分成两组，这时再回过头来分析这两组被试原先接受测验的分数差异，若这两组人的测验分数差异显著，则说明该测验有较高的效度。③命中率。当用测验作取舍决策时，决策的正命中率和总命中率是测验有效性的较好指标。

8. 论述影响测量效度的因素？P69-70

①测验的构成。当组成测验的试题样本没有较好地代表欲测内容或结构时，测量的内容效度或结构效度必然会不高。同时，若题目语义不清、指导语不明、题目太难或太易、题目太少或安排安排不当等，都会降低测量效度。一般而言，增加测验的长度可以提高测量信度，进而为提高测量效度提供了可能。

②测验的实施过程。一个测验在实施过程中，如不遵从指导语的要求，或出现意外干扰，或评分、计分出现差错等，都会降低测量效度。

③接受测验的被试。一般情况下，被试的应试动机、情绪、态度、身体状态等，都会影响测量信度，造成较大的随机误差，进而影响测量的效度。就整个团体而言，如果缺乏必要的同质性，则很可能会得到不恰当的效度资料。

④所选效标的性质。由于同一个测验可以有不同的效标，同一个观念效标也可以有不同的效标测量，因此在评价测量效度时，所选效标的性质是很重要的考虑因素。

⑤测量的信度。测量信度是测量随机误差的反映，而任何误差的增加，都会降低测量的信度，所以在考察测量效度时，一定要注意测量信度。

9. 论述提高测量效度的方法？P70

要想提高测量效度，就必须设法控制随机误差、减小系统误差，同时，还要选择好特别恰当的效标，把效度系数准确地计算出来。具体来说，下述方法能提高测量效度：

①精心编制测验量表，避免出现较大的系统误差。这就要求题目样本能较好地代表欲测内容或结构，要避免出现题目偏倚。同时，题目的难易程度、区分度、也要恰当，题目的数量也要适中。此外，测验试卷的印刷、题目作答的要求、评分计分的标准、题目意思的表述等，都必须严格检查，避免一切可避免的误差的出现。

②妥善组织测验，控制随机误差。测验实施者一定要严格按手册指导语进行操作，要尽量减少无关因素的干扰。

③创设标准的应试情境，让每个被试都能发挥正常的水平。应让被试调整好应试心态，让他们从生理上、心理上、学识上等做好应有的准备。否则，焦虑因素和其他无关因素影响过大，必然会降低测量效度，测不到欲测的内容或结构。

④选好正确的效标，定好恰当的效标测量，正确地使用有关公式。在评价一个测验是否有效时，效标的选择是一个重要方面。假若所选效标，或所选效标无法量化，则很难正确地评估出测量的实证效度。如果效标及效标测量都合乎要求，则公式的选择是影响估计的另一个重要方面。

第六章测验的项目分析

一、名词解释

1. 难度：指测验项目的难易程度。

2. 区分度：是指测验项目对被试心理品质水平差异的区分能力。

3. 鉴别度指数：当效标成绩是连续变量时，可以从分数分布的两端个选择27％的被试，分别计算出每道题目上各自的通过率，两者只差就是鉴别度指数（D）即：D=PH-PL，式中PH和PL分别是高分组和低分组在该项目上的通过率。

二、简答与论述

1. 难度的计算方法 p72

（1）二分法记分项目的难度。①通过率。如果不考虑被试作答是猜测成功的机遇，二分法记分测验项目的难度通常以通过率来表示，即以答对或通过该项目的人数的百分比来表示。P=R/N,式中，P代表项目难度，N为全体被试数，R为答对通过该项目的人。②极端分组法。当被试人数较多时，则可以先将被试依照测验总分从高到低排列，分成三组，总分最高的27％被试称为高分组（NH），总分最低的27％被试称为低分组（NL），分别计算高分组和低分组的通过率，然后求项目的难度。P=(PH+PL)/2或P=(RH/NH+RL/NL)/2，式中，PH、PL分别表示高分组和低分组的通过率；RH、RL分别表示高分组和低分组通过该项目的人数；NH、NL分别代表高分组和低分组的人数。

（2）非二分法几分项目的难度。对于论述题，每个项目不止有答对和答错两种可能结果，而是从满分至零分之间有多种可能结果。对于这类项目，常常用下面的公式来计算其难度。P=?x/xmax 式中?x为被试在某一项目上的平均得分，xmax为该项目的满分。

2. 如何确定测验的难度水平？P74

进行难度分析的主要目的是为了筛选项目，项目的难度水平多高合适，取决于测验的目的、项目形式以及测验的性质。

教育工作或实际工作中，若测验的目的是为了了解被试在某方面知识技能的掌握情况，可以不必过多地考虑难度，只要教育者认为重要的内容就可以选用，甚至那些100％通过或通过率为零的项目都可以采用。如果测验的目的是用于选拔、录用人员，就应该将项目的难度控制在接近录取率左右，即较多地采用那些难度值接近录取率的项目。

3. 简述难度对测验的影响？P76

（1）测验难度影响测验分数的分布形态。测验的难度直接依赖于组成测验项目的难度。通过考察测验分数的分布，可以对测验的难度作出直观分析。若测验项目的难度普遍较大，被试的得分普遍较低，使得测验分数集中在低分端，其分数分布呈现正偏态；当测验题目的难度普遍较小，被试的得分普遍较高，测验分数集中在高分端，分数分布呈现出负偏态。测验难度过大或过小，都会造成测验分数偏离正态分布。

（2）测验难度影响测验分数的离散程度。过难或过易的测验，会使测验分数相对地集中在低分端或高分端，从而使得分数的全局缩小。项目的难度以集中在0.50左右最佳，以集中两极端最差。

4. 简述区分度与难度的关系？P83

难度与区分度有着密切的联系。以鉴别度指数D为例，难度越接近0.50，项目潜在的区分度越大，而难度D越接近1.00或0时，项目的潜在区分度越小。这也是人们的在常模参照测验中，要求项目保持中等难度的道理之一。实际测验中，一般各种项目之间都具有某种程度的相关，考虑到这一点，我们在利用项目分析选择试题时，应使项目的难度分布广一些，梯度大一些，使整个测验的难度分布呈正态分布，且平均水平保持在0.50左右。这样才能把各种水平的人都区分开来，并且区分得比较细。

5. 区分度的相对性与什么有关？P85

（1）不同的计算方法，所得区分值不同。

（2）样本容量大小影响相关法区分度值的大小。一般来说，样本容量越小，其统计值越不可靠。所以在计算出r值后，不能仅从数值大小判断试题的优劣。而应运用统计显著性检验法，检验区分度值是否显著。

（3）分组标准影响鉴别指数值（D）。极端组划分标准的不同，求得的区分长值也不同。分组越极端，其D值越大。通常取27％作为极端分组划分的标准。

（4）被试样本的同质性程度影响区分度值的大小。被试团体越具有同质性，即个体之间水平越接近，其测题的区分度就越小。反之，若是施测于具有较大异质性的被试团体，即使是对另外一同质团体来说区分度很小的项目，也可能具有很高的区分度。所以，项目的区分度大小是针对特定团体而言的。

6. 论述猜测校正的优缺点？P88

优点：①可避免降低测验的信度。

②校正后的得分可以范瑛被试的真正水平和能力。

③在教育测验中，可以培养被试诚实的美德。

④比较公平。

缺点：①公式的基本假设不成立。

②只要被试能答完全部试题，则猜测校正无实质作用。

③不采用猜测校正对信度并无重大影响。

④有时会出现无法解释的现象。

⑤实际生活中，京城缺乏充分的证据和资料，必须凭借部分知识来判断，且进行合理猜测是值得培养的习惯。

总之，对于是否需要采用猜测校正，并无定论。但是在答题时间充裕，备选答案数目（k）在四个或以上的选择题，则没有必要进行校正记分。

7. 对多重选择题作项目分析可解决什么问题？P89

（1）项目是否具有所预期的功能？对于常模参照测验，测题是否有足够的区分度？对目标参照测验来说，测题是否能充分地测量到教学的结果？

（2）项目的难度是否得当？

（3）项目是否有缺陷？

（4）诱答选项是否都有效？

8. 对多重选择题作项目分析的具体步骤是什么？P90

（1）按被试测验的总分，从高到低依次排列试卷。

（2）从最高分依次向下取全部试卷的27％作为高分组。

（3）从低分组依次向上取全部试卷的27％作为低分组。

（4）分别登记高分组与低分组选中各选择项的人数（亦可将人数换为人数比例），然后登记。

（5）根据登记结果进行选择项的质量分析。

第七章测验常模

一、名词解释

1. 原始分数：被试在接受测验后，根据测验的记分标准，对照被试的反应所计算出的测验分数。

2. 导出分数：是在原始分数转换的基础上，按照一定的规则，经过统计处理后获得的具有一定参考点和单位，且可以相互比较的分数。常用的导出分数有百分等级、标准分数、T分数等。

3. 标准分数或Z分数：是一种具有相等单位的量数，又称作Z分数，以Z表示。它是将原始分数与团体的平均数之差除以标准差所得的商数，是以标准差为单位度量原始分数离开其平均数的分数之上多少个标准差，或是在平均数之下多少个标准差。

4. 正态化的标准分数：为了是来源于不同分布的分数进行比较，可使用非线性变换，将非正态分布的分数强制性地扭转成正态分布，具体做法为：将每个原始分数转换为百分等级，然后使用正态分布表，将对应的百分等级直接看成是正态分布曲线下的面积值，找出所对应的Z值（偏差值），这种方式所得到的分数即正态化的标准分数。

5. 常模：是根据标准化样本的测验分数经过统计处理而建立起来的具有参照点和单位的测验量表。

6. 常模团体：是由具有某种共同特征的人所组成的一个群体，或是该团体的一个样本。

7. 发展量表：人的许多心理特质，如智力、技能等，是随时间而发展的，所以可以将个人的成绩与各种发展水平的人的平均成绩相比较，制定出发展量表。在这种量表中，明确指出个人的按正常途径发展的心理特征处在什么样的发展水平。

8. 年级当量：将被试的测验成绩与某一年级的学生的平均分数作比较，，而说成相当于某一年级水平。

9. 剖析图：把一套测验中几个分测验分数同图表（图形）表现出来。从剖析图上可以很直观地看出被试在各个分测验中的表现及其相对应的位置。

10. T分数：由于Z分数常常带有小数和出现负值，使用起来常觉不便，也容易出错，并且与日常生活中的评分形式不一致，不直观。因此产生了多种将Z分数作线性变换，使负号与小数消失，全部变为正数的转换方法。T分数就是由标准分数直接转换而来的，计算公式为T=10×Z+50，式中，T为T分数,Z为标准分数。

二、简答与论述

1. 为什么将原始分数转化为导出分数？P93

被试在接受测验后，根据测验的记分标准，对照被试的反应所计算出的测验分数称作原始分数。原始分数反映了被试答对题目的个数或作答正确的程度。但是原始分数不能直接反映出被试之间的差异状况，不能刻画出被试相互比较后所处的地位，也不能说明被试在其他等值测验上应获得什么样的分值。为了使原始分数本身具有意义，使不同测验的分数可以相互比较，就必须将原始分数转换为导出分数。

2. 百分等级分数的优缺点？P95-96

（1）优点：百分等级是一种相对位置量数，具有可比性，且具有易于计算、解释方便等优点，对一般教师、学生和家长来说，均能了解百分等级的意义，所以它较适用于不同的对象和性质不同的测验。另外，百分等级不受原始分数分布状态的影响，即使分数分配不是正态的，也不会改变百分等级常模的解释能力。但百分等级是一种顺序量数，它在统计分析中不具有可加性。

（2）缺点：①单位不等，尤其在分配的两个极端。②百分等级只具有顺序性，而无法用它来说明不同被试之间分数差异的数量。

另外，在运用百分等级时应注意到，百分等级是相对于特定的被试团体而言的，所以，解释时不能离开特定的参照团体。

3. 标准分数或Z分数的特点？P97

Z分数是以一批分数的平均数为参照点，以标准差为单位的等距量表。Z分数不仅具有可比性，而且还具有可加性，它由符号与绝对值两部分构成。正负符号表示原始分数在平均数之上或之下，绝对值表示原始分数与平均数的距离。除此之外，Z分数还具有一下两个重要性质：

（1）Z分数与原始分数X的分布形态相同。

（2）任何一组原始分数经转换为Z分数以后均有?Z=0,SZ=1，所以可以利用Z分数对不同测验分数进行比较。如果原始分数属正态分布或近似正态，则Z分数的范围大致在-3.00到+3.00之间（约占全体的99.73％）。

4. 标准分数变式的优缺点（或标准分数变式的评价）P99

（1）优点：①具有等单位特点，便于进一步进行统计分析工作。②正态分布下，可以利用正态分布表将各种导出分数与百分等级分数作换算。③正态分布下，运用变式分数可以将几个测验上的分数作直接的比较。即使是非正态分布，也可运用由正态化的Z分数转换而得的变式分数进行直接比较分析。

（2）缺点：①分数过于抽象，不易理解，正如在介绍麦柯尔的T分数时所提到的那样不为一般人所熟悉。②在非正态分布下，分布形态不同的的变式分数，仍然不可以作相互比较，也不能相加求和。

5. 分数合成中存在什么问题？P102

每当将测验分数组合时，必须考虑以下3个问题：

（1）采用什么方法来合成分数？

（2）什么形式是最适当的分数组合？

（3）需要多少及何种测验分数作最适当的组合分数？

6. 简述分数合成的方法及其优缺点？P103-105

（1）临床诊断——直觉合成。优点：①具有高度的综合性。②具有灵活的针对性，能就特定的个人作具体的结论。缺点：①主观加权易受决策者的偏见影响，不够客观。②缺乏精确的数量分析，，没有精确的数量指标。

（2）加权求和合成。

（3）多重回归。

（4）多重划分。

7. 确定常模团体的注意事项（或如何选择好的常模团体）P106-107

①群体构成的界限必须明确。

②常模团体必须是所测群体的一个代表性样本。

③取样的过程必须明确且有详尽的描述。

④样本大小要适当。

⑤常模团体必须是近时的。

⑥注意一般常模与特殊常模的结合。

8. 制定常模的过程？P108

（1）确定测验将用于哪一个群体。根据测验群体，选定最基本的统计量，决定抽样误差的允许界限，在此基础上设计具体的抽样方法，并对该群体进行抽样，得到常模团体。

（2）对常模团体进行施测，并获得团体成员的邪恶眼分数及分数分布。

（3）确定常模分数类型，制作常模分数转换表，即常模量表，同时给出抽取常模团体的书面说明，以及常模分数的解释指南等。

9. 呈现常模资料的方法及其注意事项？P111-115

呈现常模的方法主要有两种：转化表与剖析图。

（1）转化表又称常模表，常模表有简单转化表与复杂转化表两种。利用转化表解释分数时应注意：①只能将分数与表中所描述的常模团体作比较，要和其他常模团体比较，则需其他的常模表。②在没有效度资料时，转化表只能将原始分数转换为另一种分数，而不能作任何推论，即使有效度资料，效标行为也只能从常模资料推论来的。

（2）使用剖析图作解释，要求各个分测验所使用的必须是同一个常模团体，否则无法进行比较。

第八章心理与教育测验的编制与实施

简答与论述

1. 编制标准化心理与教育测验的步骤？P117

①确定测验目的。

②制定编题计划。

③编辑测验项目。

④预测与项目分析。

⑤合成测验。

⑥测验标准化。

⑦鉴定测验。

⑧编写测验说明书。

2. 预测应注意的问题（或如何做好预测）P120

（1）预测对象应取自将来正式测验时准备施用的群体，虽然人数不必太多，但要具有代表性。

（2）预测的情境应力求同正式测验的情境一致。

（3）预测的时限可以适当延长，以便每一受测者都能将题目做完。

（4）施测者应对受测者的反应加以记录。如在同一时限内，受测者所完成的题数，以及受测者反映的题意不清之处等，以便修改项目时等参考。

3. 选择测验项目的指标是什么？P121

①测验的性质，即要选择那些能够测量所要测量的东西的项目。假若要测量的是语言推理能力，就不能选择测量阅读能力或运算能力的项目。

②项目的难度。选择多大难度的项目并无固定的标准，选拔性测验要求难度大些，考察性测验则要求难度不可太高，人格测验则不要求难度。

③项目的区分度。一般来说，项目的区分度越高越好，对于选拔性测验尤为如此，但有时也可以保留若干区分度不高的项目，这要视项目的重要性而定。

4. 测验说明书包括哪些内容？P124

①本测验的目的与功能。

②本测验的理论依据。

③测验内容的及实施测验的方法，包括：何种测验、内容分几部分、每部分有多少测验项目、如何作答等等。

④测验的标准答案和评分方法。

⑤关于测验的信度、效度资料的说明。

⑥常模表，即如何依据常模解释测验结果。

5. 论述解释测验分数时遵循的原则（或如何正确解释测验分数的意义）P129-131 ①主试应充分了解测验的性质与功能。

②对导致测验结果的原因的解释应慎重，谨防片面极端。

③必须充分估计测验的常模和效度的局限性。

④解释分数应参考其他有关资料。

⑤对测验分数应以“一段分数”来解释，而不应以“特定的数值”来解释。

⑥对来自不同测验的分数不能直接加以比较。

6. 论述向当事人报告测验分数的基本原则？P131-132

①使用当事人多理解的语言。

②要保证当事人知道这个测验测量或预测什么，这里并不需要作详细的技术性解释。 ③如果分数是以常模为参考的，就要使当事人知道他（她）是和什么团体在进行比较。 ④要使当事人认识到分数只是一个估计。

⑤要使当事人知道如何运用他的分数。

⑥要考虑测验分数将给受测者带来什么影响。

⑦测验结果应向无关的人员保密。

⑧对低分者的解释应谨慎小心。

⑨报告测验分数时应设法了解当事人的心理感受，并采取适当的措施加以引导。

第九章测验等值

1. 测验等值的实质？

（1）从本质上来说，测验等值就是通过对考核同一种心理品质的多个测验形式作出测验分数系统的转换，进而使得这些不同测验形式的测验分数之间具有可比性。在实际操作中，测验等值可使各个不同形式的测验分数均对应起来，测验主持者可以任意指定其中的一个分数形式作为基准，而使所有其他形式的分数都转化到这个基准形式上。

（2）测验等值中所说的测量分数系统的转换与测验原始分数及导出分数之间的转换是不相同的。等值转换的目的是为了比较两个不同测验形式之间的实测分数，导出分数转换是为了将一个实测分数转换到一个可评价个体相对位置的分数系统上去。等值转换是两个或多个不同测验形式分数系统的转换，两者之间是有本质差异的。

2. 论述测验等值的条件？P136

（1）同质性。被等值的不同测验形式所测的必须是同一种心理品质，测验的内容与范围也应该基本相同。不是测同一种心理品质的测验是不能被等值的。

（2）等信度。被等值的不同测验形式必须有相等的测验信度。不能指望一个低信度的测验通过与一个高信度测验等值而提高自身的可靠性。

（3）公平性。公平性是指考生参加被等值的不同测验形式中的任一个测试，等值后的结果都是一样的，不能出现参加不同形式的测试等值后的结果有高有低的现象。

（4）可递推性。如果测验x与测验y之间有等值转换关系f(x)=y，测验y与测验z之间有等值转换关系g(y)=z，那么一定有测验x与测验z之间的关系h存在,h(x)=g[f(x)]=z。这种递推关系还可以推至更多的已等值的测验形式。如果这种递推关系不存在，或者不同途径递推的结果不相同，那么这些测验形式中必有不等值的形式存在。

（5）对称性。对两个待等值的测验形式x与y，无论等值转换从哪个测验出发，所获得的等值对应关系是相同的，即如果从形式x出发，获得等值关系f(x)=y；从形式y出发，获得等值关系g(y)=x，则一定有f=g-1，也就是说，f 与g一定是互逆的关系。

（6）样本不变性。测验与测验的等值关系是由与本身的内在性质决定的，与为寻找这种等值关系而采集数据时所使用的样本没有关系，也与采集数据时测验的情境没有关系。如果测验等值关系会受到测验样本的影响而变化，则所寻获的测验等值关系是虚假的。

第十章目标参照测验

一、名词解释

1. 目标参照测验：是根据某一明确界定的内容范围而缜密编制的测验，并且，被试在测验中所得结果，也是根据某一明确界定的行为标准直接进行解释的。

二．简答与论述

1. 为什么相关系数表示的信度指标在目标参照测验上不太适用？P161

由于以相关表示的测验信度的高低在很大程度上受到受测者团体异质性的影响，即被试异质性越高，测验分数分布就越广，从而相关系数越高，测验信度相应也就越高，因而，这些信度指标在目标参照测验上的应用价值就不免受到怀疑：目标参照测验的目的一般不在于鉴别个体差异，而在于了解个体在所测内容上的掌握水平，因而在大多数情况下，被试团体在目标参照测验上的分数分布比较集中，如高中毕业会考，一般来说绝大多数考生都能达到所要求的水平。这样一来，若用相关系数作信度指标，由于其受到分数分布的影响，那么即使测验本身具有较高的稳定性和一致性，所得的信度系数也会很低。

2. 比较目标参照测验与常模参照测验的异同？

第十一章学绩测验

一、名词解释

1. 学绩：通常是指个体经过对某种知识或技术的学习或训练之后所取得的“成绩”，一般表现为个体心理品质在知识、技能或某种能力方面的增加和提高，是个体认识性心理品质的发展。

2. 学绩测验：是对个体在一个阶段的学习或训练之后知识、技能的发展水平的测定。

3. 标准化学绩测验：是指在心理与教育测量学原理指导下，遵循一定的程序所编制的各方面质量都达到规定标准的学绩测验。

4. 斯坦福成就测验：属于综合性学绩考察测验，也是一种供团体使用的常模参照测验。它有两个配套测验，一个是斯坦福早期学校成就测验，一个是斯坦福学业技能测验。

二、简答与论述

1. 简述学绩测验的作用？P171

①学生经过一个阶段的学习，到底获得了多少知识，提高了多大的能力，可以通过学绩测验进行测定。学绩测验的结果反馈给学生，学生可以总结学习经验，纠正不足，利于学生进一步学习。

②学绩测验结果反馈给教师，教师可以总结教学经验，利于教师进一步改进教学。

③学校还使用学绩测验甄别学习困难儿童，诊断学生学习困难的原因，以便即时制定和采取补救措施，帮助学生全面掌握所学知识，全面提高专业能力。

④学校还应用学绩测验辅助教学管理。升学、毕业、升级、留级、划分班级组别都需要学绩测验的信息。

⑤现代社会的人事管理也应用学绩测验。人员录用、晋职提级都可以利用学绩测验，以测验成绩作为重要的取舍依据。

2. 标准化学绩测验的基本要求？P174

①命题组卷标准化。标准化试卷的所有试题都是经过精心编制的，试题测量目标明确，语词意义清晰，试题难度、区分度、达到规定标准。

②施测标准化。标准化测验必须在统一标准的环境下施测。统一标准环境包括测验场所的标准统一、测验时间统一、测验的指导语统一、提供给考生的测验材料统一、材料出示的顺序统一。

③评分标准化。标准化测验的评分在测验编制的同时就要制定好标准答案和评分规则。标准答案要正确、规范，最好是唯一的。评分规则应尽量细致、客观，最好是没有伸缩性的。 ④测验分数解释标准化。对于常模参照性测验，其意是编制测验时必须搜集常模样本，编制好测验常模。

3. 标准化学绩测验的编制步骤P175-177

①确定测验目的，选定测验编制的方法。

②分析测量目标，拟定测验编制计划。

③编题征题与选题组卷。

④调查测验质量参数，编制测验常模。

⑤编写测验指导书，正式出版发行。

4. 题库的基本要求有哪些？你认为建设题库有什么好处？P179

（1）基本要求：植根于一种科学的测量理论；储备有一定数量的试题，所有试题品质优良，技术参数完备；题库内部结构层次清楚、分类严谨、试题检索方便；题库管理方便、可控性强、易于维护更新；保密性强。

（2）好处：一些大规模的标准化学绩测验应用范围广，施测周期短，对试卷的需要比较频繁。每次都临时编题组卷，耗费大而效率又不高。解决这个问题的一个有效办法就是建设一个题库。应用题库组拼标准化学绩测验的试卷，具有经济、高效而且保密性强的特点。

5. 教师自编课堂测验的特点？P182-183

①测验形式灵活多变，与测验目的完全一致。

②测验内容与教材内容高度一致。

③测验难度切合学生的实际水平。

④测验编制简易快速。

6. 教师自编课堂测验应注意的问题（或教师如何做好自编课堂测验）P184-186

①教师要深入研究教材，深入调查学生。

②要维护准确稳定的合格标准。

③要客观评价自己的命题技术，合理使用各种题型。

④要注意总结命题经验，提高命题技术。

⑤要尽量控制评分误差，防止简单粗糙。

⑥要做一些定量分析研究。

第十二章能力测验（上）

一、名词解释

1. 比内-西蒙量表：

2. 斯坦福-比内量表：

3. 韦克斯勒量表：

4. 瑞文推理测验：是由英国心理学家瑞文编制的一种团体智力测验，又称瑞文渐进图阵。它是非文字型的图形测验，分为3个水平：瑞文标准推理测验、瑞文采图推理测验、瑞文高级推理测验。

二、简答与论述

1. 论述传统智力测验的若干问题？P192-196

（1）传统智力测验的结构效度。

（2）传统智力测验的功能。

（3）传统智力测验的公平性。对此持怀疑态度者主要从以下几个方面提出质疑：①性别差异。②职业差异。③文化和教育差异。

（4）传统智力测验的预测效度。在用智力测验对个体未来可能成功程度作预测时，一般都假定所测的智力是个体相当稳定的特质。而事实上，人的智力并非一成不变，它会由于某些因素的影响而发生变化。智力的可变性主要表现于以下几个方面：①智力随年龄成熟而发展。②智力随环境而变化。③智力随个性特质的不同而产生不同变化。

2. 论述智力测验存在的合理性？P197

首先，智力本身虽具有可变性，但从另一个角度来说，它也具有稳定性。

其次，智力测验实际运用于选拔和安置人员时，往往被实践证明其对学生和职业等效标的预测具有较好的效度，因而可以有效地帮助决策者提高决策正确率。

再次，由于智力测验对不同团体可能存在的不公平性，人们已经试图从改善智力测验本身来缓解这一问题，比如改善题目结构，或据亚文化群的特点为不同团体编制不同的测验，或在同一测验中为不同团体制定子常模等。

最后，虽然人们指出传统智力测验的种种不是和局限，并且从各种角度提出了更全面更完善的智力评估手段的设想，也有很多人在实践中作了诸多尝试，但至今仍未出现成熟的、超越于传统智力测验之上的智力评估工具。因此，传统智力测验在智力评估中的地位目前仍是不可取代的。

第十三章能力测验（下）

一、名词解释

1. 学术能力倾向测验：简称SAT，相当于我国的高考，是大学录取新生的一项主要参考依据，每年在美国和世界各地举行多次。

2. 分辨能力倾向测验：简称DAT，是由美国心理公司于19xx年初版，并于19xx年和19xx年两次修订和进一步完善，是应用最广泛的成套能力倾向测验之一，主要适用于初中和高中学生的教育咨询及就业指导。

3. 一般能力倾向成套测验：简称GATB，是20世纪40年代由美国劳工部就业保险局设计而成的综合式职业性向测验。

二、简答与论述

1. 简述能力倾向测验的特点？P211

（1）测验的目的。能力倾向测验的目的不在于总结过去，而在于预测未来，即预测个体在将来的学习或工作中可能达到的成功程度。与智力测验相比，能力倾向测验预测的目的性更强，它试图说明个体在多种能力上的潜在优势，并进而和专业或工作所需结合起来。

（2）测验的编制。能力倾向测验一般同时测量几种能力因素，以分测验形式组成，每个分测验针对一种能力，每个测验应该是独立的，并且，各分测验间的相关要尽可能低。测验的内容涉及广泛，不像成就测验那样具有明确限定的内容范围，且较少涉及与学校习得知识有关的内容。另外，各分测验必须使用相同的常模样本，且应具有较高的信度。

（3）测验结果的解释。①一般能力倾向测验往往会用能力剖面图来呈现个体内差异。②针对不同工作，不同能力因素的权重应有变化。一般采用多重回归模式解决这一问题。

2. 现在流行的创造力测验依据的理论基础是什么？

（1）19xx年，吉尔福特在美国心理学年会上作了题为《创造性》的著名演讲。

（2）吉尔福特将创造力定义为发散思维的能力，即对规定的刺激产生大量的、变化多端而又独特的反应的能力。他指出，现有的传统的智力测验一般注重于聚合思维的测量，测验项目通常要求被试从给定的若干备选答案中选出一个，评分则以固定的正确答案为标准，并不鼓励被试作出多样化的与众不同的反应，因此，被试的创造力在智力测验中无法得到充分的反映。

（3）吉尔福特的发散思维测验与其关于创造力的定义和他关于智力结构的阐述结合起来：视创造力为发散思维能力，发散思维又是智力三维结构中操作维度所包含的五个因素之一；而作为操作因素，发散思维又可以与智力结构中的5种内容因素，以及6种结果因素组合出30种心理能力因素。

第十四章人格测验

一、名词解释

1. 自陈人格量表：自陈人格测量就是根据测量的人格特质，编制许多有关的问题，要求受测者根据自己的实际情况逐一回答这些问题，然后根据受测者的答案，去衡量受测者在这种人格特之上表现的程度。为完成自陈人格测量而编制的测量工具叫自陈量表或自陈问卷。

2. 投射：指个人对客体特征的想象式解释，在这种解释中，个人具有将自己身上发生的心理过程无意识地附着在客体身上的倾向。换句话说，投射是个人把自己的思想、态度、愿望、情绪、性格等心理特征无意识地反应在对事物的解释之中的心理倾向。

3. 投射技术：弗兰克认为投射技术能够唤醒被试内心世界或人格特征的不同表现形式，从

而在对测验项目的反应中投射出被试内在的需要和愿望。基本方式是向受测者提供预先编制的一些未经组织的、意义模糊的标准化刺激情境，让受试者在不受任何限制的情况下，自由地对刺激情境作出他的反应，然后通过分析受测者的反应，推断受测者的人格特质。

二、简答与论述

1. 对人格定义的理解？P228

现代西方心理学家对人格本质的理解至少在4个方面是一致的或基本一致的。第一，绝大多数心理学家都强调或事实上承认人格的整体性。人格虽然可能表现为各种不同的具体形式，但各种心理成分彼此交织，互相结合，组成一个整体。第二，所有心理学家都承认人格的独特性，即承认没有两个人的人格是完全相同的。第三，绝大多数心理学家都承认人格对个人行为的调节功能，即认为人的行为至少部分地决定于行为者的人格特征。第四，所有的心理学家都主张人格的相对稳定性，即认为人格对行为的调节功能具有跨时间和跨情境的特征。因此，一个人格定义无论用什么样的词语表述，只要包含了上述4方面的内容，就抓住了人格的实质。根据这一认识，我们把人格（或性格）理解为个人在与环境的相互作用过程中形成的相对稳定的心理特质和行为倾向的整体组织，它决定着个人行为的独特性。这个定义并不意味着完善，但它包含了人格的主要性质，也容易理解。

2. 自陈量表的特点？P232

（1）自陈量表的题量较大，多数用于测量人格的若干特质。

（2）自陈量表通常采用纸笔测验，即将测验项目印在纸上装订成册，另有一张答卷纸，将备选选项印在答卷纸上，被试一边阅读测验项目，一边在答卷纸上选择适合于自己的选项。这样可以同时测量许多人。

（3）自陈量表的计分规则简单而客观，施测手续比较简单，测验分数容易获得解释。因此一般对测验情境和施测者的要求不像智力测验那样严格。

3. 投射测验的特点？P242

（1）测验材料没有明确的结构和确切的意义，这就为受测者提供了针对测验材料进行广阔自由联想的机会和空间。

（2）受测者对测验材料的反应不受限制，可以根据自己对测验材料的理解作任何想象式解释，因此受测者对测验材料的解释在很大程度上不是决定于测验材料的性质，而是决定于受测者的人格特征和当时的心理状态。

（3）测验的目的具有明显的隐蔽性，受测者事先并不知道施测者对他的反应作何心理学的解释，这就在很大程度上避免了受测者的伪装和防卫，使测验的结果更能反映受测者真实的人格特征。

（4）对测验结果的解释重在对受测者的人格特征获得整体性的了解，而不是对某个或某些单个人格特质的关注。

（5）投射测验的内容多为无明确意义的图片，在测验时不受语言文字的限制，所以，被广泛地应用与人格的跨文化研究。

（6）相对于自陈量表，投射测验的最大局限是计分上的困难，这使得研究者对测验结果难以进行确定的定量分析。

第十五章其他心理与教育测验

一、名词解释

二、简答与论述

1. 瑟斯顿量表的优缺点

其信度一般在0.8~0.9之间。不足主要有以下有几点：第一是制作过程复杂，选题目、找专家评价都很困难；第二是用中位数代表态度等级不一定合适，因为中位数相同，但其余的反应未必一致；第三是项目的挑选和等级确定以专家的评判为依据，专家的意见是否代表一般人值得怀疑；第四是等距量表事实上是是否真正等距，亦把握不准。尽管如此，《瑟斯顿量表》在主题比较清楚、调查范围不广的态度问题调查上效果还是比较好的。

2. 利克特量表的优缺点

优点是制作过程简单，而且能广泛接受与态度主题有关的项目；另外可通过增加项目而提高效度，并且允许受测者充分表达态度的强烈程度。问题与不足是相同的态度分数者可能持有不同的态度模式，从总分只能看出一个人的赞成程度，而无法对态度差异作进一步的解释。第十六章测量的综合应用

一、名词解释

1. 心理咨询：是求询者就其心理冲突、心理障碍或轻度心理疾病向有专业技术的咨询人员诉说、询问，咨询人员分析问题的原因和症结并寻求解决问题的办法，提高对生活的适应性和对周围环境的调节能力。

2. 教育评价：是根据教育目标，在系统收集资料的基础上，对教育过程及其结果进行价值判断的过程。

二、简答与论述

教育评价的功能与阶段

（1）其功能大致可以概括为3点：一是导向功能，由于教育评价的标准是教育目标，这个标准的确立为人们指明了努力方向，一旦经过评价发现偏离了教育目标，人们就会主动调整自己的行为，向符合目标的方向前进；二是管理功能，科学的教育评价，可使人们明确自己的现状和职责，一旦人们发现自己的不足，就会想办法予以改进，从客观效果上讲，达到了激发人的动机，调动人的积极性的效果；三是诊断和选拔功能，这是教育评价的基本功能，教育评价可以使我们了解人的德、能、勤、绩等多个方面的情况，是进一步施加影响或进行选拔的依据。

（2）教育评价过程通常分为3个阶段：第一是确立明确的可操作的教育目标，作为对事实进行判断的标尺，这个标尺是明确与否、正确与否会直接影响评价结果；第二是根据教育目标选择或编制可以测量这些教育目标的工具或方法，选择或编制测量工具或方法应以测量理论为指导，力求使用最有效的手段来获取事实资料；第三是通过测量所收集的资料和数据，对照教育目标形成一个价值判断。

第十七章心理与教育测量理论的新发展

一、名词解释

二、简答与论述

1. 经典测验理论的局限性P288

第一是经典测验理论的信度估计精度不高。

第二是经典测验理论的误差指标笼统单一、不精细。

第三是经典测验理论各种参数的估计对样本的依赖性太大。

第四是经典测验理论参数指标之间的配套性较差。

相关推荐

心理与教育测量知识点汇总

专栏推荐