评价法-信号侦察论实验报告

评价法-信号侦察论

邱亚伟(2010210790)

华中师范大学心理学院  武汉—430072

摘要:本实验为心理学实验,信号侦察论实验是测定人对信号的反应与人对噪音的反应的实验。实验者通过信号侦察论实验能够将人的感受性与其判断标准区分开,并将其分别用不同的数量来表达,而此实验应用的评价法更可以在相同的时间内获得被试更多的信息。我们在本实验的结果可以得到被试的实验击中成绩,击中率与虚报率,从结果中可以看出被试的判断很明确。

关键词:评价法,图片再认,ROC曲线,信号检测论。

1 引言 

信号侦察论不仅测定人对信号的反应,也测定人对噪音的反应,因而能够将人的感受性与其判断标准区分开,并且分别用不同的数量来表达,这是它优于古典心理物理法的地方。

信号侦察论有三个基础实验程序,即有无法、迫选法和评价法。其中,评价法可以在相同的时间内获得被试更多的信息。

在评价法中,不仅要求被试对有无信号作出判断,还要求按规定的等级作出评价,即说明每次判断的把握有多大。这样,被试就有了几个判断标准,因而用一轮实验的结果就可以绘制ROC曲线。

2.方法

2.1被试

华中师范大学心理学院,20##级学生一名,视力矫正正常,18岁,男,无色盲或色弱,右利手,以前未参加过类似实验。

2.2 仪器材料

计算机,键盘,PES系统,评价法—信号侦查论实验程序。

2.3 实验设计

本实验用图片再认来做评价法实验。刺激有两套:一套是识记过的图片,共60张(每个图片内容不同)作为信号SN;另一套是没有识记过的图片,共60张(每个图片也不同,但与相应的第一套相似),作为噪音N。

第一步,先让被试识记第一套图片,计算机屏幕随机呈现每张图片2s,间隔1s,60张图片连续呈现;第二步,把这60张识记过的图片与第二套60张图片混在一起,仍按上述的方法呈现给被试,让被试判断是否是刚才识记过的,并按照规定的等级按键作出评价。

主试指导被试认真阅读指示语,解释五等级评价的方法,让被试直接点击对应的数字按钮来进行反应。被试明白后开始做实验。

2.4实验程序

当被试进入实验程序后,在屏幕上会呈现出指导语:“屏幕中央会呈现一幅一幅的图片,一共60幅。你要尽量记住图片中画的是什么。明白这段话的意思后,点击“确定”按钮开始。”。当被试点击确定以后,屏幕上开始连续呈现60张图片,每张图片呈现2S,每两张图片之间呈现空白刺激1S。当60张图片全部呈现完以后,屏幕上又会出现指导语:

“下面要给你呈现120幅图片。其中一半是你刚才看过的,另一半是新的。每呈现一幅图片时,你应当判断它是不是刚才看过的。请按照下面的标准点击对应的数字按钮反应。

    1 ——    0%的把握你刚才看过它

    2 ——  25%的把握你刚才看过它

    3 ——  50%的把握你刚才看过它

    4 ——  75%的把握你刚才看过它

    5 ——100%的把握你刚才看过它

请尽快判断,每幅图片呈现一段时间后会消失。明白这段话的意思后,点击“确定”按钮开始”

3.实验结果

实验结果如下所示:

----------------------------------

类型 1 2 3 4 5 合计

----------------------------------

信号  3  0  0  0 57 60

噪音 55  1  0  1  3 60

----------------------------------

实验结果图:

中率与虚报率:

----------------------------------------

反应      4       3       2       1

----------------------------------------

击中率   0.95    0.95    0.95    0.95

虚报率   0.05    0.07    0.07    0.08

----------------------------------------

根据以上实验结果,即可利用软件制作出ROC曲线

  

4. 讨论

从结果中可看出,被试在判断图片有没有出现时,记忆很清晰,击中率非常高,虚报率很低,而且并没有很多模糊性的判断。有可能是实验材料(60张图片)数量过少,以导致被试不能出现很明显的漏报和虚报,或者模糊性的判断。根据《实验心理学》(第二版,北京大学出版社)P70上的实验数据例证,他们使用了600张图片,实验材料很大,以致被试在判断时记忆模糊,出现了一些虚报、漏报和模糊判断,使得实验区别于有无法,得到了跟好的结果。如果本实验增大实验材料可能会得到比较理想的结果。

5,参考文献

杨博民主编 心理实验纲要 北京大学出版社 42-61页

    朱滢主编    实验心理学 北京大学出版社 68-70页

 

第二篇:信号检测论——评价法

信号检测论——评价法

姓名

(小组成员:     )

要:本实验选取了两名上师大心理系本科生,两名被试均为女性,采用了信号检测论的评价法考察了两名被试对汉字再认的准确性和判断标准。实验发现:(1)信号检测论的评价法是一种进行记忆再认研究的有效工具;(2)在同一种判断标准下,被试二的击中率和虚报率均高于被试一;(3)在同一种判断标准下,被试一的判定标准要大于被试二的,辨别力要小于被试二的。

关键词: 信号检测论评价法;ROC曲线;辨别力d’;判定标准

1

信号检测论是现代心理物理学最重要的内容之一,它的出现彻底改变了以往人们对阈限的理解,将个体客观的感受性和主观的动机、反应偏好等加以区分,从而解决了传统心理物理学所无法解决的问题[1]

信号检测论认为:被试觉察信号有一个中枢神经效应,这种效应随着每次剌激呈现,时刻都在变化。信号总是在噪音的背景上产生,信号的影响和噪音的影响都被假定为正态分布,这两种分布由于信号比噪音微弱增强,故有一定的重叠,而使信号和噪音都可能引起同一程度的感觉。人类觉察是建立在统计决策论的基础上。就是说被试选择一个标准,当给定的刺激超过这个标准时,被试就反应“有”,否则则说“元”,而这个反应标准的选择由很多因索(如感受性、利益得失、动机、态度、情绪、意志等)决定。这个反应标准就是阈限,而不是感觉本身的东西,它包括两个独立指标:一个是反应偏向,可用似然比值(B)或报告标准(C)来表示,它包括利益得失、动机、态度等因素;另一个是感觉辨别力指标(d’),表示感知能力。

信号检测论有三个基础的实验程序:有无法、迫选法和评价法。评价法又称多重决策法,或评级量表法。这一方法呈现刺激的方式同有无法一样,对信号和噪音的先验概率和奖惩办法,都可以随实验要求,由主试确定。但对被试的要求有所不同,对被试的反应不是简单的“有”或”无”的方式,而是将被试从“有信号”到“无信号”这一感觉的连续体,规定出不同的感觉评价等级。然后让被试根据对所呈现刺激的自信度情况,报告有信号(或元信号)的评定等级。一般评价从有信号到无信号这一感觉连续体的等级可划分为六个;六个等级含义为:第一等级,非常肯定有信号出现;第二等级,一般肯定有信号出现;第三等级,可能有信号出现;第四等级,可能无信号出现;第五等级,一般肯定无信号出现:第六等级,非常肯定无信号出现[2]

信号检测理论中的评价法在心理学实验中的应用是非常广泛的,如在研究“知道感”任务中的图片和字词的感受性和判断标准的实验中,该实验考察了在“知道感”(FOK)任务中的字词和图片的感受性和判断标准的差异。实验运用Hart的“回忆一FOK判断一再认”(RIR)范式,用字词和图片作为刺激材料,采用两种不同的加工水平,并根据信号检测论中的评价法对结果进行分析。结果表明,在知道感任务中,只有在线索回忆正确百分率和FOK判断等级上表现出了图片优势效应,而再认正确率和FOK准确性则没有图片优势;而且,不论是深加工还是浅加工,被试对字词和图片的感受性都没有显著性差异,但判断标准的变化较为复杂,且受加工水平的影响较大,显示出图片优势效应的产生与被试的反应偏向有关[3]

又如在汉字再认能力心理指标d’与的比较中可以看出,信号检测论的评价法可以直接引进模糊数学集值统计的方法处理试验所采集到的数据,求出 (平均置信度)。与d’相比较,除了具有“灵敏度高、不受影响的优点外,l) 比d’意义更清晰、更明确,在某些特殊情况下,表征汉字再认能力似乎更接近被试实际再认能力;2) 能够区别“击中”能方和“正确否定”能力;3)评价法的每一人次判断试验是集值统计试验,由于的计算原理不强求原始数据趋于正态分布,故可适当减少试验重复次数[4]

在再认指标的探讨中,记忆研究的再认法传统上常用计算保持量作为再认的指标,而信号检测论则用计算辨别力指数d’作为再认的指标。它们各有特点,又各有局限性。本文从理论和实验上探讨了这些问题,并提出修正的计算方法,同时还分析了应用模糊集合统计处理信号检测论评价法的结果,计算再认程度函数作为再认的指标,比传统的指标及d’更具优越性:(1)比较符合心理判断的实际;(2)无须信号检测论的基本假设;(3)可排除判断标准的影响,有利于不同被试个体再认能力的比较[5]

  经过查阅前人的实验研究,我们发现信号检测论的评价法主要是应用于再认测验的研究。我们本次实验的目的是通过比较被试对汉字再认的准确性和判断标准,学习用评价法进行信号检测论实验。

2

2.1被试:两名上师大心理系本科生,均为女性

2.2仪器与材料

2.2.1仪器:计算机及PsyTech心理实验系统软件

2.2.2材料:信号汉字100个,噪音汉字100个

2.3程序

2.3.1登录并打开PsyTech心理实验软件主界面,选中实验列表中的“信号检测论(评价法)”。双击呈现实验简介,点击“进入实验”到“操作向导”。 实验者可进行参数设置:改变刺激呈现时间等参数或默认参数。点击“开始实验”呈现本实验指导语。

2.3.2第一次指导语是:

这是一个用评价法进行的信号检测论实验。 实验开始后屏幕会逐个呈现一系列汉字,请你认真看并尽量记住这些汉字。 当你明白了上述指导语的意思后,就点击下面的“正式实验”按钮“开始”。

2.3.3被试按任意键后,实验先呈现100个作为信号的汉字,被试只看并记忆,不作其它反应。呈现完毕,点“确定”再次出现指导语。第二次指导语是:

   下面屏幕将再次逐个呈现一系列汉字。其中一半是你刚才看过的, 一半是没有看过的。请你对这些呈现的汉字作出判断,是否你刚才看过的, 并用鼠标对你判断的肯定程度作等级评价。如果100%肯定看过,请点击“1”;如果觉得可能(75%肯定)看过, 请点击 “2”;如果觉得不能确定(50%肯定)看到过,请点击“3”;如果觉得可能(25%肯定)没看过,请点击“4”;如果100%肯定没有看过,请点击“5”。当你明白了上述实验的步骤后,就请点击下面的“正式实验”按钮“开始”。

2.3.4将另外100个作为噪音的汉字与原来呈现过的汉字混合后再次随机呈现。被试按照实验指导语要求对每个呈现的汉字作出是“信号”还是“噪音”的判断, 并要求被试按五个等级评价。

2.3.5实验结束,点击结束提示语中的确定可直接查看结果,也可以换被试继续实验, 以后在主界面“数据”菜单中查看。

2.4数据处理:采用了EXCEL 2003进行数据处理

3

3.1计算两名被试五种评价等级下将刺激判断为信号和噪音的概率

表1:被试一五种评价等级下对刺激的判断

被试一对判断为“肯定看过”的信号汉字的概率为0.31,噪音汉字的概率为0.08;被试一对判断为“可能看过”的信号汉字的概率为0.22,噪音汉字的概率为0.13;被试一对判断为“不能确定”的信号汉字的概率为0.15,噪音汉字的概率为0.22;被试一对判断为“可能没看过”的信号汉字的概率为0.14,噪音汉字的概率为0.34;被试一对判断为“肯定没看过”的信号汉字的概率为0.18,噪音汉字的概率为0.23。

表2:被试二五种评价等级下对刺激的判断

被试二对判断为“肯定看过”的信号汉字的概率为0.56,噪音汉字的概率为0.17;被试二对判断为“可能看过”的信号汉字的概率为0.28,噪音汉字的概率为0.26;被试二对判断为“不能确定”的信号汉字的概率为0.05,噪音汉字的概率为0.12;被试二对判断为“可能没看过”的信号汉字的概率为0.07,噪音汉字的概率为0.35;被试二对判断为“肯定没看过”的信号汉字的概率为0.04,噪音汉字的概率为0.10。

3.2计算两名被试四种判断标准下的击中率和虚报率

表3:被试一四种判断标准下的击中率和虚报率

被试一在判断标准一下的击中率为0.31,虚报率为0.08;在判断标准二下的击中率为0.53,虚报率为0.21;在判断标准三下的击中率为0.68,虚报率为0.43;在判断标准四下的击中率为0.82,虚报率为0.77。

表4:被试二四种判断标准下的击中率和虚报率

被试二在判断标准一下的击中率为0.56,虚报率为0.17;在判断标准二下的击中率为0.84,虚报率为0.43;在判断标准三下的击中率为0.89,虚报率为0.55;在判断标准四下的击中率为0.96,虚报率为0.90。

3.3计算两名被试相应的辨别力d’和判定标准

表5:被试一四种判断标准下的辨别力和判定标准

被试一在判断标准一下的辨别力为0.91,判定标准为2.37;在判断标准二下的辨别力为1.56,判定标准为1.38;在判断标准三下的辨别力为0.64,判定标准为0.91;在判断标准四下的辨别力为0.18,判定标准为0.87。

表6:被试二四种判断标准下的辨别力和判定标准

被试二在判断标准一下的辨别力为1.10,判定标准为1.56;在判断标准二下的辨别力为1.17,判定标准为0.62;在判断标准三下的辨别力为1.10,判定标准为0.48;在判断标准四下的辨别力为0.47,判定标准为0.49。

3.4根据五个等级反应的次数,以评价等级数为横坐标,以次数为纵坐标,画出信号与噪音对比关系的直方图

被试一对判断为“肯定看过”的信号汉字数量为31,噪音汉字的数量为8;被试一对判断为“可能看过”的信号汉字数量为22,噪音汉字的数量为13;被试一对判断为“不能确定”的信号汉字的数量为15,噪音汉字的数量为22;被试一对判断为“可能没看过”的信号汉字的数量为14,噪音汉字的数量为34;被试一对判断为“肯定没看过”的信号汉字的数量为18,噪音汉字的数量为23。

被试二对判断为“肯定看过”的信号汉字的数量为56,噪音汉字的数量为17;被试二对判断为“可能看过”的信号汉字的数量为28,噪音汉字的数量为26;被试二对判断为“不能确定”的信号汉字的数量为5,噪音汉字的数量为12;被试二对判断为“可能没看过”的信号汉字的数量为7,噪音汉字的数量为35;被试二对判断为“肯定没看过”的信号汉字的数量为4,噪音汉字的数量为10。

3.5根据两名被试的四组虚报率和击中率数据,分别画出其ROC曲线

由图可看出,被试一的击中概率和虚报概率都随着先定概率的增大而增大。

由图可看出,被试二的击中概率和虚报概率都随着先定概率的增大而增大。

4

4.1根据统计的数据及ROC曲线,比较两名被试对汉字的再认能力及采用的判定标准

根据表3和表4可得,在同一种判断标准下,被试二的击中率和虚报率均高于被试一,这说明被试二的判定标准低于被试一的判定标准;而由表5和表6也可以看出,在同一种判断标准下,被试一的判定标准要大于被试二的,辨别力要小于被试二的。同样,由两名被试的ROC曲线也能看出,被试二的曲线较被试一的更远于45度对角线,这说明被试二有更强的感受性和辨别力。

4.2对评价法和有无法不同之处及优缺点的讨论

评价法呈现刺激的方式同有无法一样,对信号和噪音的先验概率和奖惩办法都可以随实验要求,由主试确定,但对被试的反应要求有所不同。在评价法中,对被试的反应不是简单的“有”或”无”的方式,而是将被试从“有信号”到“无信号”这一感觉的连续体,规定出不同的感觉评价等级,然后让被试根据对所呈现刺激的自信程度,报告出相应的评定等级。本实验共有五个评定等级,分别为:肯定看过,可能看过,不能确定,可能没看过,肯定没看过。被试在实验中,根据以上五个等级对呈现的刺激作出是信号或噪音的判断。 在判断时实际依据的是四种不同标准(C1、C2、C3、C4), 判定当前刺激引起的感觉量是属于哪一类别。由于用评价法进行实验不必用其它实验措施 (如有无法中改变呈现信号的先定概率等),用一轮实验的结果就可以绘制ROC曲线。因此,评价法可以在相同的时间内得到更多的信息。

4.3讨论如果要比较7岁和10岁儿童对汉字记忆的能力,应如何用评价法进行实验

由于7岁和10岁的儿童认识的汉字数量及其有限,所以首先在设置汉字这一环节要特别注意,一定要选用他们学过并且记住的汉字,最好以他们的语文书为参考。而且儿童的记忆容量比成人的要小,所以在信号和噪音设置的数目上要有所减少。实验的评定等级可以还设为五个等级:肯定看过,可能看过,不能确定,可能没看过,肯定没看过。但是实验的指导语一定要简单易懂,这样儿童做出来的实验结果才有价值。

5

5.1信号检测论的评价法是一种进行记忆再认研究的有效工具

5.2在同一种判断标准下,被试二的击中率和虚报率均高于被试一

5.3在同一种判断标准下,被试一的判定标准要大于被试二的,辨别力要小于被试二的

6 参考文献

[1]郭秀艳著.实验心理学.人民教育出版社,20##年10月,276

[2]王志毅.传统心理物理学方法与信号检测论.辽宁师专学报,20##年,第5期:73~75

[3]李同归. “知道感”任务中的图片和字词的感受性和判断标准.心理学报,2000,32(3):264~268

[4]李永建. 汉字再认能力心理指标d’与的比较.四川师范大学学报(自然科学版),1989,46(4):106~111

[5]孟庆茂.再认指标的探讨.心理学报,1988,1:45~50

相关推荐