内隐

内隐

内隐联合测验实验

摘 要:内隐联想测验(Implicit attitude Test,简称IAT)是由格林沃尔德(Greenwald)在19xx年提出的。本实验以反应时为指标,通过一种计算机化的分类任务来测量两类词(概念词与属性词)之间的自动化联系的紧密程度,继而对个体的内隐态度等内隐社会认知进行测量的。 关 键 词:内隐社会认知,IAT,相容任务,不相容任务

1 引言

1.1 IAT 概述

内隐社会认知起源于内隐记忆的相关研究,是新近兴起的社会认知领域的研究热点。由于内隐社会认知发生的过程具有无意识、自动化的特征,因此,很难通过传统的自陈式量表直接进行测量,因此,在内隐社会认知研究方面比较常用的间接测量方法有句子填充法、投射测验法、传记分析法、反应时法和情景测验法等。

内隐联合测验(Implicit Association Test,IAT)是Greenwald 等人(Greenwald,McGhee, & Schwartz, 1998)于1998 年提出的一种计算机化的辨别分类任务,采用反应时为指标,通过测量概念词和属性词之间联系的紧密程度,从而推断个体内隐态度的一种新的研究方法,是反应时范式在社会认知研究中的拓展。其基本原理是当两个概念联系紧密时,人们容易对其样例作同一反应;反之,当两个概念联系不紧密甚至存在冲突时,对它们的样例作同一反应则较为困难。利用人们对不同概念的样例作同一反应的难易程度便可获得个体对不同概念的内隐认知层面上的联系强度。

在经典IAT 范式中,要求被试对呈现的刺激(文字或图片)进行分类,并记录反应时。刺激材料分属两类词:概念词与属性词。例如,花卉(如玫瑰、月季)和昆虫(蚂蚁、蜘蛛)构成了概念词,而积极(快乐、奖励)和消极(灾难、悲伤)则构成属性词。测验中包含两类任务:“相容任务”(compatible task)和“不相容任务”(incompatible task)。相容和不相容是针对被试的内隐认知结构而言,前者指被归为一类中的概念词和属性词与被试的内隐认知结构相一致(例如,花卉对应积极、昆虫对应消极),而后者则相反(例如,花卉对应消极、昆虫对应积极)。因此,在相容任务中,概念词和属性词在被试内隐认知结构中联系紧密,表现为被试的联合任务的反应时较短;而在不相容任务

1

中,由于概念词和属性词会引起被试的认知冲突,从而导致联合任务的反应时延长。最后,这两类任务的平均反应时之差即反映了被试的内隐态度。由于IAT 克服了句子填充、投射测验、传记分析法和情景测验法等难以量化、主观性强、缺乏良好效信度等缺点,因此,其研究范式在内隐社会认知的研究领域(自尊、刻板印象、自我概念等)中被广泛采用(Greenwald & Farnham, 2000; Greenwald &Nosek, 2001)。

1.2 IAT 的特点

在IAT 范式产生之前,在内隐社会认知研究领域产生了诸多的实验范式:(1)反应时范式。常见的反应时范式有:评价性启动任务(Evaluative Priming task)(Fazio,Sanbonmatsu, Powell, & Kardes, 1986)、情感性西蒙任务(Affective Simon Task,AST)和外加情感性西蒙任务(Extrinsic Affective Simon Task,EAST)(Houwer, 2003)、情绪性Stroop 任务(Emotional Stroop Task)等;(2)内隐记忆研究范式,这类范式主要源自于内隐记忆方面的研究,要求被试完成特定的言语加工任务,通过被试完成任务的数量和质量来推测其态度或观念。主要有:1)词干补笔(Word Stem Completion)、2)姓名字母偏好效应;3)词汇判断任务(Lexical Decision task);(3)生理反应范式,即通过测量被试的各种生理反应指标来了解其内隐社会认知的情况。常见的测量指标有:肌电、皮肤导电性、惊吓眨眼反射、心血管反应水平、瞳孔的收缩与扩张以及ERP、fMRI 等。可见,上述范式可谓种类繁多,然而真正获得广泛应用的却只有IAT 范式。这主要是由于IAT 有以下两方面的优势:高适应性和高稳定性。 (1)范式的高适应性

由于IAT 可以使用词汇或图形来表征绝大多数的概念,因此它既可以用来测量各种内隐态度,如种族、年龄、性别、民族、政治团体等,又可以用来测量各种刻板印象,如性别一学科、性别一强弱等,还可以用来测量内隐自尊和各种自我概念,

内隐联合测验实验

而且还可以用来测量群体归属或社会认同——绝大多数内隐社会认知研究领域都可以应用IAT。此外,由于采用同一范式,使得不同领域间的测量结果还具有可比性。相比之下,很多其它研究方法的应用范围显得过于狭窄。如姓名字母偏好效应,尽管可以用来在一定程度上测量内隐自尊,但是它无法用来测量其他目标。其他的大部分内隐测量方法都或多或少地存在柔性不足的缺点,一种方法或程序只能测量有限的对象。 (2)范式的高稳定性

IAT 的结果比较稳定,经得起检验。其指标IAT 效应,在很多研究中都达到了极高的显著性水平,d 效应值(IAT 效应平均/标准差)一般高于0.8,而p 值一般小于0.01。这说明IAT 效应非常显著。此外,内隐联想测验的结果非常可靠,得起检验。在很多采用标准程序对相同对象进行的研究中都发现了相互一致的IAT 效应,说明在样本水平上IAT 的结果是可靠的。在个体水平上IAT 的重测稳定性也达到了很高的水平。因此,从总体上看,IAT 比其他的内隐测量方法更有效,同时也具有较好的重测信度和复本信度,且具有较好的结构效度、区分效度和预测效度,更重要的是,IAT能够有效地避免自我报告测验带来的自我矫饰和印象整饰等作用。综上,在反应时范式中几乎没有其他测量方法能与其比肩,由于IAT 自身明显的优点,使得它迅速成为内隐社会认知领域最主要的研究方法之一。

1.3 IAT 研究的变式

Brandl 等用非单词字母代替Greenwald 经典IAT 实验中的花的名字,结果发现昆虫比非单词字母更积极。如果用IAT 理论来加以解释,就会得出就是“昆虫与积极而不是消极的词联系更紧密”的结论。因此,为了弥补IAT 不宜用来测量单一概念的不足,近来研究者提出了三种IAT 测验的改变形式。

1.3.1 Wigboldus IAT(WIAT)

Wigboldus 重新设计了IAT,他提供一个目标概念和两个属性概念。例如,第一个任务,要求被试看到积极的词和与伊斯兰信仰有关的词(如古兰经)时按左键,看到消极的词时按右键。第二个任务则要求被试看到积极的词按左键,看到消极的词和与伊斯兰信仰有关的词按右键。如果被试在第一个任务上做得更好则说明对伊斯兰有积极的态度,反之亦然。结果发现,IAT 结果与被试的自我报告

2

呈正相关。在研究被试对不同食物的态度中也发现IAT 的结果与被试的行为呈现一定的一致性。

1.3.2 Go/NO-Go Association Test (GNAT)

反应/不反应联合任务(Go/No-Go Association task,GNAT)由Nosek 和Banaji提出。GNAT 保留了IAT 的关键任务,有一对属性概念,但对目标概念没有强制性规定,采用信号检测论的思想,利用辨别力指数(d′)作为指标。

在GNAT 的联合任务中,包含两种条件下:第一种条件是当出现指定的目标类别(如水果)或属性类别(如积极)的样例时,被试作按键反应,出现任何其他干扰类别时不作反应;第二种条件是当出现指定的目标类别(如水果)或另一种属性类别(如消极)的样例时,被试作按键反应,出现任何其他干扰类别时不作反应。因此,如果被试的内隐态度中认为水果与积极联系更紧密,则会发现,第一种条件下的辨别力(d’)要高于第二种条件。与IAT 相比,GNAT 的特点在于不需要有作为比较的一对目标类别,就可以获得较“直接”的而非相对的内隐态度。

1.3.3 Extrinsic Affect Simon Task (EAST)

Mierke 和Klauer 曾指出IAT 的最大缺陷在于被试对任务的重新编码。如在花—虫IAT 中,相容联合任务为对花和褒义词按左键反应,对虫和贬义词按右键反应,而被试往往会将任务简化成对所有褒义刺激(包括花)按左键,对所有贬义刺激(包括虫)按右键,被试对相容任务的重新编码缩短了相容任务的反应时,提高了IAT 效应。为了避免重新编码对IAT 效应的污染,De Houwer 设计了EAST。其实验材料为5 个消极名词、5 个积极名词、5 个消极形容词和5 个积极形容词。实验有两种条件:一是所有形容词以白色呈现,要求对词义做反应,即对积极形容词按右键(积极反应),对消极形容词按左键(消极反应);二是名词都以彩色出现,要求对词的颜色做出反应,即一半被试对绿色词按右键,对蓝色词按左键,而另一半被试对蓝色词按右键,对绿色词按左键。只记录被试对名词的反应时和错误率。结果发现被试对积极名词做积极反应比对积极名词做消极反应来得快,错误更少,同样,对消极名词做消极反应比对消极名词做积极反应来得快,错误更少。这是由于个体依照所呈现的形容词的评价性特征(积极或消极)做出判断,并分别做出反应,使得原先中性的按键反应获得了积极或者消极的意义,从而影响了个体的颜色

内隐联合测验实验

分类反应。

1.4 IAT 的内在机制

尽管IAT 得到了非常广泛的应用,而且有关的研究层出不穷,但关于IAT 的内在作用机制,至今为止并没有一个真正意义上的、完整的解释。 关于IAT 的原理,Greenwald 等人只做出了如下假设:如果两个概念密切联系,那么当它们对应同一个反应时会比较容易,对应不同的反应则比较难。而对IAT 的有效性主要还是通过间接地提供有关的效度和信度指标来加以说明。

Banaji 认为,IAT 建立于以下基本假设之上:(1)概念之间的评价性联系可以进行测量;(2)概念之间进行匹配的难易程度不同,这反映了概念之间的评价性联系的程度;(3)测量评价性联系的方法之一是考察目标和评价之间匹配的速度;(4)在时间压力下通过反应速度的不同而测量出来的评价性联系的强度是对自动化的态度。从中可见,内隐联想测验测量的是评价性联系的强度,然后用这种评价性联系的强度来反映自动化的态度。

社会认知领域认为,在人的头脑中存在着一个社会认知的网络结构,用不同的节点表示各种事物、概念或评价。如果特定的对象和一定的评价相联系,那么激活该对象就会导致活动水平在概念网络上进行扩散,使得有关的评价信息容易被激活,因此就比较容易产生相应的评价倾向,这种现象称作态度的自动激活。一般认为,只要态度对象和评价之间存在联系,那么加工态度对象时就必然会及或相应的评价,这个过程不受意识的控制,却会对个体随后的情感体验和行为反应产生影响(Devine, 1989)。这样,在概念联系和社会认知之间就形成了紧密的对应关系,从而只要测量出概念之间的联系就等于测量到了个体的倾向性。

1.5 IAT 的数据处理

IAT 实验结果的统计分析的数据来源主要是两个联合任务(相容与不相容任务)的数据。Greenwald 等人对原始数据进行了如下处理:(1)每一段的最前面两次尝试不进行统计;(2)反应时低于300 毫秒的,转化为300 毫秒,反应时高于3000 毫秒的,转化为3000 毫秒;(3)先对反应时进行对数转化,然后再求平均数;(4)在求平均数 时,错误反应的反应时也计算在内;(5)错误率超过25%的被试其数据视为无效。最后将不相容任务的平均反应时减去相容任务的平均反应时得到的差值,称为IAT 效应(IAT Effect),它表明了目标

3

概念和属性概念之间联系的方向和相对强度。如在花—虫的实验中,如果IAT 效应大于0,说明被试认为花与积极评价相联系,虫则与消极评价相联系。IAT 效应的数值越大,说明这种差异越大,也就是被试对花的偏好越强烈。反之,如果IAT 效应小于0,说明预先的假设不成立,实际情况与预先的假设相反。最后,如果IAT 效应和0 没有显著的差异,则说明要么不存在预想的联系,要么两个目标概念和属性维度的联系基本一致,没有什么差异,也即被试没有明显的偏好。相容任务和不相容任务上的正确率的差异也具有统计价值。由此得到的结果和由反应时得到的IAT 效应的意义基本一致。

Greenwald 后来发现IAT 效应和被试的平均反应速度存在一定的相关,反应速度慢的被试,其IAT 效应往往比较大。为了克服年龄和反应速度对IAT 效应的影响,Hummert等人采取了一种新的IAT 效应算法,称为z 值法(z-score)。即将所有的反应时转化成z 分数,再用这些z 分数来计算IAT 效应。通过如此转换能够比较好地排除被试反应速度不同所带来的影响。

此后,Greenwald 又在此基础上对实验数据同时进行了多种处理方式,具体有以下几种计算方式:

(1)中数法,即分别计算不相容任务和相容任务反应时的中数(median),然后相减得到IAT 效应。 (2)均数法,即分别直接计算不相容任务和相容任务的反应时平均数(mean),然后相减得到IAT 效应。

(3)对数法,即先将反应时转换成自然对数,然后再分别计算相容与不相容任务平均数并相减得到IAT 效应。

(4)倒数法,即以1000 为分子,以每次的反应时为分母,进行倒数转换,然后分别计算不相容任务和相容任务的平均数。由于转换成倒数以后不相容任务的均值小于相容任务的均值,因此IAT 效应等于相容任务的平均数减去不相容任务的平均数。 (5)D 值法,先计算不相容任务和相容任务的反应时平均数之差,然后除以两个任务上所有反应时的标准差。

经过大量在线实验数据的综合比较,Greenwald 发现最后的D 值法的效果最好,可以保持较高且稳定的内隐效应与外显主观测量结果的相关程度,同时极大地降低反应速度对IAT 效应的影响,显著地

内隐联合测验实验

降低先前测验经历对IAT 效应的影响。

1.6 IAT 的应用

由于IAT 非常适合于测量自动化的、不要求有意识回忆的不合理信念。因此,许多研究者采用IAT 在临床心理学方面进行了深入系统的研究,尤其是在对抑郁、焦虑和恐怖症者的治疗效果评估以及根据内隐认知对行为的预测方面取得了一些有益的研究成果。

1.6.1 社交恐怖症的相关研究

社交恐怖症的研究都是通过自我报告方式进行,其研究表明,由于消极的自我评价是社交焦虑者的主要特质,故低自尊是导致人们社交焦虑的主要原因。但de Jong 等人采用IAT 范式的研究结果却表明高、低社交焦虑者有相似的积极的自尊,对他人的消极尊重,但是高社交焦虑者的这种自我偏好效应更小一些。也即,高社交焦虑者对自己与对别人尊重程度的差异小于低社交焦虑者。可见,自我报告得出的高社交焦虑者有低自尊的结论可能更准确地反映了这些被试自我整饰的程度,而不是自尊的真实情况。故不是低自尊,而是对自我和对他人的内隐尊重程度的差异才是造成了被试的社交焦虑的主因。

1.6.2 抑郁康复者的相关研究

以往采用认知评定量表等自我报告测验对抑郁病人的研究发现,在正常的情绪状态下,抑郁康复者和正常人没有差别,但是,如果有意引起他们一种轻微的消极情绪,则会使抑郁康复者的认知方式又回到抑郁时的消极状态,而从来没有得过抑郁的人则不会有这种变化。Gemar 等人采用IAT 范式研究表明抑郁康复病人之所以在引入消极情绪后会重回消极状态,其主要原因在于消极情绪继续激发了抑郁康复病人更消极的自我内隐态度。

1.6.3 IAT 成瘾行为的预测

Jajodia 等人采用IAT 对不同程度的嗜酒者进行了对酒精的内隐认知研究。结果发现通过IAT 得到的结果能够预测被试的嗜酒行为,且优于自我报告测验的预测。这些研究表明在对成瘾行为的预测中IAT 是一种有用的工具。此外,Wiers 等人也发现不论是嗜酒程度高的还是嗜酒程度低的人在外显测验上对酒精都有积极的态度(严重嗜酒者更积极),但是在内隐测验上,他们都对酒精有很强的消极态度。可见,IAT 的研究结果可以为更好地预测和诊治成瘾行为提供帮助和指导。

1.7 IAT 总结

4

尽管IAT 是一种相对有效的研究内隐社会认知的工具,且应用范围也日趋广泛。但它毕竟是刚出现不久的新方法,信、效度指标还不够完善,对其测验原理还存在许多争议,需要深入探讨。在应用IAT 及对其结果加以解释时,应当谨慎,要注意以下几方面问题:

首先,作为考察内隐社会认知的工具,IAT 的机制尚不明晰,已有研究指出个体的反应速度、反应定势的差异以及某些纯感知觉因素都会干扰测验结果。在IAT 测验中还发现了任务的顺序效应(不相容任务在前会减小IAT 效应)、练习效应等系统误差。这说明IAT 与具有个体诊断价值的测验还存在一定距离,还有进一步改良的空间。

现有研究对IAT 信效度的比较分析还相对宽泛。由于IAT 的灵活性,使得这种方法更类似Likert 量表是一种施测形式,而不是有具体指向的问卷或量表,即便是测量同一对象,IAT 的刺激项目也未能标准化。将这些内容不同、形式各异的IAT 研究笼统放在一起比较,当然会得到自相矛盾的结果。另外,IAT 以精确到毫秒的反应时作为测验指标,其数据的范围和精确度与传统意义上的量表数据有很大不同,因此,将其纳入传统心理测量学标准体系加以衡量或许还存在问题。

最后需要指出的是,社会认知结构的稳定性并不能和人格、智力等特质相提并论。近来,基于外显测量的一些研究提醒我们:诸如态度、自尊等范畴可能并非是稳定“特质”,也许只是临时的建构(build on the spot)。于是有的研究者退而认为内隐的社会认知是相对稳定的成分,但是包括IAT 在内的内隐测验结果对这个假设并没有很好的支持。因此,人们不禁会感到困惑:究竟是IAT 信度存在缺陷,还是内隐社会认知自身就不是一个稳定的特质?这也许是IAT 测验以及内隐社会认知研究亟待解决的关键问题。

本实验旨在对Greenwald 的经典的内隐联合测验实验(花虫测验)进行验证,了解IAT 方法的实验范式及其结果的处理,并进一步探讨IAT 范式的特点及其影响因素。

2 实验方法

2.1 被试

被试为浙江大学本科学生55名,其中男生18名,女生37名,年龄范围19~23岁,平均年龄(20.3?0.9)岁。

内隐联合测验实验

2.2 仪器与材料

IBM-PC 计算机一台,认知心理学教学管理系统。本实验呈现的刺激材料包含四种词汇:花卉词、昆虫词、积极词和消极词(各类词汇详见附录)。

2.3 实验设计与流程

本实验采用单因素被试内设计。自变量为任务的性质,共有2 个水平:相容任务和不相容任务,因变量为反应时。任务的顺序在被试间对抗平衡。 经典IAT 实验的具体流程参见表1。实验分为练习和正式两部分,一半的被试先进行相容任务,后进行不相容任务;另一半被试则先进行不相容任务,后进行相容任务。

被试先进行练习,相容任务(或不相容任务)的练习共有两部分组成:(1)概念词(花卉与昆虫)的分类任务;(2)属性词(积极与消极)的分类任务。在进行相容任务的练习时,首先进行概念词(花卉与昆虫)的分类任务。此时,屏幕一左一右分别呈现一个类别词,左侧为“花卉”,右侧为“昆虫”。而后在屏幕中央呈现一个词(如“蒲公英”),被试的任务是判定该词属于左侧类别还是属于右侧类别,属于左侧类别按左键(默认为“F”键),属于右侧类别按右键(默认为“J”键)。概念词的分类任务结束后,进入属性词的分类任务。同样,屏幕一左一右分别呈现一个类别词,左侧为“积极”,右侧为“消极”。而后在屏幕中央呈现一个词(如“甜蜜”),被试的任务是判定该词属于左侧类别还是属于右侧类别,属于左侧类别按左键(默认为“F”键),属于右侧类别按右键(默认为“J”键);而在进行不相容任务的练习时,首先进行概念词(花卉与昆虫)的分类任务,屏幕一左一右分别呈现一个类别词,左侧为“昆虫”,右侧为“花卉”。而后在屏幕中央呈现一个词(如“蒲公英”),被试的任务是判定该词属于左侧类别还是属于右侧类别,属于左侧类别按左键(默认为“F”键),属于右侧类别按右键(默认为“J”键)。概念词的分类任务结束后,进入属性词的分类任务。同样,屏幕一左一右分别呈现一个类别词,左侧为“积极”,右侧为“消极”。而后在屏幕中央呈现一个词(如“甜蜜”),被试的任务是判定该词属于左侧类别还是属于右侧类别,属于左侧类别按左键

5

(默认为“F”键),属于右侧类别按右键(默认为“J”键)。

正式实验则要求被试对概念词和属性词进行联合反应。在相容任务条件下,屏幕一左一右分别呈现两个类别词,左侧为“花卉或积极”,右侧为“昆虫或消极”,而后在屏幕中央呈现一个词(如“蒲公英”),被试的任务是判定该词属于左侧类别还是属于右侧类别,属于左侧类别按左键(默认为“F”键),属于右侧类别按右键(默认为“J”键);在不相容任务条件下,同样,屏幕一左一右分别呈现两个类别词,左侧为“昆虫或积极”,右侧为“花卉或消极”,而后在屏幕中央呈现一个词(如“蒲公英”),被试的任务是判定该词属于左侧类别还是属于右侧类别,属于左侧类别按左键(默认为“F”键),属于右侧类别按右键(默认为“J”键)。正式实验单次试验流程见图 1。

相容任务(不相容任务)的练习共100 次(其中,50 次为概念词归类,50 次为属性词归类)。被试做出按键反应后,无论反应正确、错误或超时均有反馈,并提示反应时,但结果不予以记录。练习正确率达到90%以上方可进入相容任务(或不相容任务)的正式实验。正式实验在被试做出正确反应后没有提示,反应错误或反应超时则会有提示。相容任务(不相容任务)的正式实验共有200 次试验,分4 组(每组50 次),组与组之间分别有一中断,被试可自行控制休息时间。整个实验持续约40 分钟。

内隐

图1 内隐联合测验正式实验流程图

内隐联合测验实验

表1经典IAT 实验序列(花与虫)

组 B1 B2 B3 B4 B5 B6

任务性质 相容

任务类型 概念词分类 属性词分类 联合分类 概念词分类

试验次数

50 50 200 50 50 200

功能 练习 练习 正式 练习 练习 正式

左键对应项目

花卉 积极 花卉或积极

昆虫 积极 昆虫或积极

右键对应项目

昆虫 消极 昆虫或消极

花卉 消极 花卉或消极

不相容 属性词分类 联合分类

注:对于一半的被试,B1、B2、B3 组分别与B4、B5、B6 组互换,即相容与不相容任务顺序互换。

3 结果分析

IAT 实验数据的处理与一般反应时数据处理稍微不同,最初,Greenwald 等人采用的方法是,将大于3000 毫秒或小于300 毫秒的反应时数据剔除,而后将反应时数据进行对数转换(Log-transform),最后将得到的数据按相容与不相容条件进行平均后计算差值,用差值的方向和大小来代表被试的内隐态度。后来,Greenwald 对算法提出了改进(Greenwald, Nosek, & Banaji, 2003),并取消了对数转化,同时引入D 值的概念(D=反应时的平均数/反应时的标准差),用D 值的方向和大小来代表被试的内隐态度。

顺序效应不显著。

(2)将相容与不相容条件下的反应时对数

转化后,并计算两者对应的差值mLOG;

计算得,相容条件下的反应时对数平均值为(2.75?0.04),不相容条件下的反应时对数平均值为(2.87?0.06),mLOG=0.121?0.049。

用mLOG值表征IAT效应,考察实验的顺序效应。方差分析得,IC条件下的mLOG大于CI条件下的,但是差异不显著(F(1,53)=0.031,p>0.05)。即顺序效应不显著。

1.以任务性质为横坐标,反应时为纵坐标,

绘制柱形图。

内隐

(3)分别计算相容与不相容条件下的平均反应时和两者的联合标准差,并计算两者对应的差值mD。

计算得,相容任务对应的D=2.82?0.93,不相容任务对应的D=3.71?0.93,mD=0.89?0.23。 用mD值来表征IAT效应,考察实验的顺序效应。方差分析得,CI条件下的mD大于IC条件下的,但是差异不显著(F(1,53)=0.277.p>0.05)。即顺序效应不显著。

4 讨论

4.1 分别比较上述三种计算方法的优缺点。

图2 不同任务性质被试反应时柱形图

均数法计算简单,但是数据处理的效果不好,会受到顺序效应、练习效应、个体加工速度差异等影响。

对数法是以往研究中数据正态化的通行办法,可以使数据有满意的方差稳定性( stability of variance) 以便于做进一步分析。但Hurmmert等发现在相同测验中,老年被试的IAT效应会显著高于年轻被试,他们认为这可能与认知老化、整体加工速度减缓有关。如果将被试的每一次反应时按测验中所有反应的平均反应时和标准差转化为Z分数后再计算IAT效应,年龄间的差异就不明显。该研究提示人们传统的IAT数据转化方法可能无法对被试认

2.分别采用以下三种方法计算IAT 的实验

结果并考察是否存在顺序效应:

(1)分别计算相容与不相容条件下的平均反应时,并计算两者对应的差值mRT;

计算得,相容条件下的平均反应时为(570.2?60.9)ms,不相容条件下的平均反应时为(777.9?133.5)ms,mRT=(207.7?109.63)ms。

用mRT值来表征IAT效应,考察实验的顺序效应。方差分析得,IC条件下的mRT大于CI条件下的,但是差异不显著(F(1,53)=0.045,p>0.05)。即 6

内隐联合测验实验

知加工速度造成的误差进行有效的控制(利用图片材料获得的IAT效应要比利用姓名材料获得的IAT效应小也可能是基于同一原因)。

而D值法提高了IAT测验的内部一致性以及与外显测量间的相关系数,而且对顺序效应、练习效应、个体加工速度差异等方面能更好地加以控制,是效果最好的数据处理方法。

4.2 相容与不相容条件下的差值反映了被试何种内隐态度?

客体概念和属性概念在被试内隐认知结构中联系越紧密,相容任务就越为容易,被试的反应时就越短;而在不相容任务中,则会引起更大的认知冲突,反应时就长。这两类任务平均反应时之差就是IAT 获得的测量指标,该指标间接反映了被试内隐认知中对客体的相对态度或概念。

相容任务与不相容任务的差值的方向反映了被试内隐认知的倾向,大小则反映了被试内隐认知倾向的程度。

本实验的结果表明,被试更倾向于将花卉与积极属性词联系在一起,将昆虫与消极属性词联系在一起。

4.3 IAT 在研究被试的内隐态度方面有何优势?

IAT能避免自我报告中被试的自我掩饰(self-present),也不受按键左右、相邻反应间隔时间以及项目的数量等因素的影响。而且IAT还可灵活利用不同的客体概念和属性概念设计出适应不同方面内隐认知的测量。

IAT范式可以广泛应用于心理学研究, 不仅可以用来测量和态度有关的问题, 还可以用来测量与积极、消极没有直接联系的其它的想法和联系;效度较高, 容易重复测量; 容易施测, 有关软件容易得到。

4.4 顺序效应

对于顺序效应,前人的研究发现不相容任务在前会减小IAT 效应。但是在结果分析中,均数法和对数法得到的结果与前人研究不符,只有D值法与前任研究相符。这应该是由于D值法的计算中引入了反应时的标准差,使得数据受反应速度和个体差异的影响更小。

而不相容任务在前减少IAT效应可能的原因是,当不相容任务在前时,由于练习效应,被试把昆虫与积极属性词,花卉与消极属性词联系在了一起,而对后来的相容任务造成影响,增加了相容任

7

务的困难程度。而当相容任务在前时,由于被分类在一起的属性词和客体词符合被试的内隐认知,所以练习对于二种词的联系紧密度没有太大的影响。

5 结论

结合讨论结果,给出本实验研究结论。

被试对相容任务的反应时比对不相容任务的反应时更快,表明被试被试更倾向于将花卉与积极属性词联系在一起,将昆虫与消极属性词联系在一起。

6 思考题

6.1 如果要研究人们对单一事物(如伊斯兰

教、日本)的内隐态度,应如何设计IAT实验,实验应注意哪些问题?

使用IAT的变式WIAT范式,第一个任务, 要求被试看到积极的词和与伊斯兰信仰有关的词( 如古兰经) 时按左键, 看到消极的词时按右键。第二个任务, 要求被试看到积极的词按左键, 看到消极的词和与伊斯兰信仰有关的词按右键。如果被试在第一个任务上做得好, 说明对伊斯兰有积极的态度, 反之亦然。

实验中需要注意的问题:1.相容任务和不相容任务的呈现顺序。2.要避免使用高突出性的概念。

7 意见与建议

对该实验程序,有何意见与建议。

本实验中相容任务(不相容任务)的正式实验共有200 次试验,分4 组(每组50 次)。可以通过每组的IAT效应来考察随着练习的增加被试IAT的变化,从而考察IAT效应的稳定性。

8 参考文献

[1]侯珂,邹泓,张秋凌.内隐联想测验:信

度、效度及原理.心理科学进展[J],2004,12(2):223-230 [2]崔丽娟,张高产.内隐联结测验( IAT) 研究回顾与展望.心理科学,2004,27(1): 161- 164

相关推荐