1、词语产生的模型我们往往可以从两个角度研究言语词汇的产生。一种是通过对自发或诱发的言语错误进行分析,从中得到能够解释言语错误分布的模型;另外一种是通过对图画命名反应时间的测量,从而得到一种精密时计的模型,用以解释词汇产生中反应时间分布的问题。然而两种模式论述的都是相同的潜在基本过程:()说话人选择语义,句法两方面都适合的词语;()检索词汇的语音体系特征;()在上下文中对词汇进行快速的音节划分;以及,()对相应发音姿势的准备。两种研究中的模型都是通过激活扩展来解释这些过程的,而激活扩展又是通过一种方位主义的,象征意义的网络结构得以体现的。大体上来说,它 们在主要呈现层面上是相同的,即:概念或语意层
2、面,句法层面,以及音系和语音层面。但它们在一些细节上还是有所区别,比如对于网络结构中串联和反馈现象的解释。 这些研究方法都是 近年来出现的,其中涉及了很有建设性的实验。目前,它 们就如同两把相互研磨的刀片,一把将它们有机结合的剪刀正在制作中。我们是如何产生言语词汇的呢?这是个令人着迷的课题。在正常流畅的对话中,我们平均一秒钟产生两个或三个词汇,相当于大约四个音节,十到十二个音素。 这些词汇不断地从我们的大仓库大脑词库中提取,一般,正常的有读写能力的成年人大脑词库中包含五到十万词汇。即使这样, 词汇产生的高速和复杂并没有使它容易出现错误。平均一千个 词汇当中,我们不会产生多于一两个的错误。无疑,
3、这样的功能 强健必定有它的生物学基础,我们是天生的谈话者。但是此外,却没有其他技能如词汇产生般被我们使用的如此频繁。在达到成年之前,我们在一天不到四十分钟的谈话中将会产生大约五千万的词汇。对于词汇产生的系统研究始于60年代末,那时心理语言学家开始收集和分析自发言语错误的语料。最初的理论模型是打算用来解释语料中观察到的口误模式的。在同时发展但起初相互独立的心理语言学中,心理语言学家采用已有的精密时计方法研究词汇产生(见框1)。他们最初的模型意在解释从不同实验环境中获得的图片命名反应时间的分布情况。虽然,在目前理论化的过程中两种方法正在恰当的融合,但所有存在的模型都有一种支配的亲属关系:它们的血统
4、或者源于言语错误分析法或者源于精密时计法。尽管如此,它们对于需要模型化的过程可以达成共识。词汇的产生是话语产生的核心部分;那么对于词汇产生的解释也成为解释话语产生的一个部分。话语产生过程中,我们要从某种交际意图到决定表达什么样的信息,也就是英语中的message。信息包括一个或多个概念,对于这些概念我们的大脑词库中有相应的词汇,而这些词汇需要被检索出来。这些词汇具有句法特征,比如在句子中它是做名词还是做及物动词,这些考虑实际是在进行“语法编码”。把这些句法特征综合起来,我们称其为词汇的“词目”。词汇还具有形态学和音系学方面的特征,我们需要用这些特征为词汇的音节划分和韵律做准备,即“音系编码”。
5、最后,我们还要为这些话语中的音节,词汇,和短语做发音姿势的准备。把 这些姿势付诸实践是整个过程中唯一外在的部分。两种模型所有目前研究词汇产生的模型都是网络式模型。而且,除一例外,它们都是方位式的,非分布式模型。这就是说它们的节点体现所有语言学单位,例如 语义特征,音节,或者音段。因此,它们都是具有象征意义的模型。在众多源于语言错误分析方法的模型当中,只有一小部分已经通过计算机实现。其中, Dell的两步互动性激活模型成为至今最有影响力的模型。图表1 描绘了Dell 网络结构的一部分。这个网络结构被称为“ 两步 ”是因为其中存在从语音 层到音系层两个步骤。语义特征节点将它们的激活扩展到相应的词汇
6、或词目节点,这些节点再转而将激活扩展到音素节点。激活经过网络中所有有效的连接从一个层面串联到另一个层面。这种模型被称为“ 互动式” ,是因为所有的连接都是双向;激活可以向两个方向扩展。互动性是这类所有模型的共同特点。实现这一特点的动机之一是,因为在对言语错误语料的数据统计中发现所谓的混合错误代表过多。它们既是语义上的错误又是音系学上的错误。图表1中的网络结构可以通过下述方式产生这种错误。词目节点cat 被它的显著特征组强烈激活。转而,它又把激活 扩展到音素节点/k/, /?/ 和 /t/。cat 的一些语义特征(如 animate和 mamalian)与rat的词目节点同时激活。但是,相同词目
7、节点rat通过当前正在活跃的音素/?/ 和 /t/ 的反馈效应进一步被激活。所有激活汇集在一起,使rat比起只是语意相关的dog和只是音系学相关的mat都有更大的机会作为错误出 现。互 动性还为错误往往是真实词汇这一现象做出了解释(比如错误是mat而不是gat)。同样,双向性的 实现也需要一个独立的动机(我们无法使它的功能性引发言语错误)。这类模型不断提示我们,这个网络结构既适用于词汇产生也适用于词汇认知。这就当然需要连接的双向性了。然而,Dell等人却反对这 一解释,因为很多失语 症患者既表现出了良好的听觉词汇识别又表现出了不正常的音系学编码。双向连接的功能性(因此也包括了互动性)更多体现在
8、支持词目选取的流畅性上。一些词汇形式,尤其是那些不常用到的词汇,比起其他词汇来说较难获取;而选取一个语音形式容易找到的词目也是相对容易的。词汇形式层面发出的反馈将会提供这种功能性(也许还可以解释最近的一个精密时计结果)。当然,人们也应该考虑到这种可能性,即:互动性只是一个错误机制的特征,也就是说,当不恰当的互动在一个离散性的系统中出现时,一个 错误就可能发生。 在精密时计研究方法中,大多数已经实现了的计算机模型都只达到从语义或概念基础获取词汇名称的程度。还不存在语音片段和语音编码的激活。只有Roelofs的织工(WEAVER) 模型包含了一个充分发展的音系部分。图表展示了织工词汇网络结构的一个
9、部分。这种网络模型的主要分析层面与互动模型相同,包括概念或语义层,词目层,和音系或词汇形式层。但这个模型只是部分互动。因 为我们有充分的理由认为概念层和词目层既存在于语言产生也存在于语言认知当中,所以模型中这两层的相互联系表现为具有双向性。但是词汇形式层是语言产生所特有的,它不会对词目层发出反馈。所以,相对互动性模型来说,这个模型常常被称 为分离式两步模型。尽管这个模型起初是为了解释对于刺激的反应时间,而不是分析言语错误的,但它对于解释不容忽视的言语混合性错误却发挥了重要的作用。模型所提供的大部分解释都是后词汇的。我们战略性的监测着我们的内部语音输出,并且及时截断可能出现的错误。如果一个语音错
10、误碰巧产生了一个正确语义范畴内的词汇(比如,对于cat ,出现rat),那么 这个词就比那些语义上毫无关系的词汇(比如对于rat,出现mat)更容易躲避掉检测。类似的,能够产生真实词汇的错误要比那些产生假词的错误更容易躲过检测。有实验可以证明,对言语错误的监测还处于战略性的控制之中。而混合 错误的起因问题仍然在语言产生的各种模型中颇具争议。概念准备获取如同cat或select等实义词的第一步是激活词汇概念,对于它,我们在大脑词库中有一个词汇或一个语素与之对应。往往一个概念只是较大信息的一个部分,但即使只是命名一个物体,决定到底应该激活指称物体的哪个概念也是非常重要的。到底你是把cat称为cat
11、,animal,siamese ,或是其他什么,完全由语篇上下文决定。Rosch指出,我 们更喜欢用基本词汇指称事物(我们说cat而不是说animal;说dog而不是说collie,等等), 词汇的选择 最终取决于你在对话者面前 对所指事物所持的主观看法。我可以把我的姐姐称为“我的姐姐“,“那位女士 ”,或者“那位物理学家” ,哪种称呼更有效呢?这完全由对话人之间的共有知识和语篇上下文决定。这种主观看法的随意性在生命早期就出现,并且在对话中无处不在。观点形成的时候,词汇产生的运作模型开始启动:也就是在要表达的目标概念被激活的时候。然而同一个目标概念的呈现随模型的不同而不同。图表1和图表2所描绘
12、的就是得到广泛认可的两种呈现。概念或者被呈现为分解状态或者被呈现为完整未分解状态。虽然在这一问题上还存在争议,但越来越多的观点倾向于在词汇产生模型中使用完整概念的呈现。其中一种观点被称为“ 上义词问题”:如果你激活了某个语义特征集合作为cat这个概念的呈现,那么 animal这个概念就会与这些语义特征的一个恰当子集相关联。因此,两个概念最终哪个将被表达出来是不确定的。 这并不能提供方便:不管怎样,上义词言语错误是很少见的,你需要一种额外的方法防止这一问题的发生。无论是整体概念呈现还是特征呈现都支持精确的语义推断(比如,推断a dog is an animal),不过这种推断的潜能在现实的词汇产
13、生过程中是不发挥作用的。词汇的选取在精密时计的研究方法中,词汇的选取是通过推断范式进行研究的,尤其是图像词汇推断。实验中再次发现,当一个 错误选项词汇和图像一同出现时, 对事物的命名速度会减慢;较之错误项词汇与目标词汇无语义关联的情况,当二者存在语义联系时,这种命名速度减慢的效果更为明显。而当 图像与错误项词汇同时出现的时候,这种效果达到最强。织工模型为大量图像词汇推断数据提供了量的解释,其中只涉及非常少的自由参数。这个模型是如何运作的呢?当命名一张羊(sheep)的图像时,你决定选用基本词汇,那么你就会激活 词汇概念sheep 作为目标,激活随即扩展到相应的词目。在任何一个单位时间间隔中,从
14、大脑词库中选取目标词目sheep的可能性就是该词目激活程度与所有词目激活程度的比率(包括goat, llama和sheep)。这被称为卢斯比率,用于计算期望选取潜伏值。换句话说,语义相关的词目之间存在一种竞争。活跃的选项延缓了选取的过程(尽管如此,织工模型中一种特殊的检验机制通常可以防止它们取代目标词目)。如果你让词义相关的词汇goat 作为错误选项出现,那么已经存在的同时被激活的词目goat就会受到额外的刺激,成为sheep的一个强大竞争 对手。与之相 对,如果你让比如chair这样无语义关联的词汇出现作为错误选项,那么就不会存在激活的汇聚,相应地, 竞争也就相对缓和得多。这就解释了语义制约
15、效应。语义网络结构中(无论何种类型的),激活扩展也为对语义命名错误提供了明确解释,语义命名错误是一种主要的言语错误类型(在通常的图像命名任务中,大约有2/3属于语义命名错误)。但什么又是 语义错误呢?选 取哪个词汇可以由说话者的主观看法决定,如果你决定把画上的狗(dog)称为animal 或者collie,那么这实际上是个有意图的行为而不是一个错误。目前有大量文献是关于失语症病人所产生的语义或其他类型的错误,但这些并不在本文论述的范围之内。通过“破坏”正常的网络系统来预计言语错误的分布是一项很大的挑战。Dell等人的例子令人印象深刻。在互动性两步模型中,他们仅仅通过控制两个参数就把不同失语症病
16、人的命名错误制作成模型。这两个参数分别是:网络连接的影响和节点活性衰退速率。词汇选取的时间计算没有被清楚地体现在以言语错误为基础的模型中。在互动性两步模型中,选取时刻由外在因素决定。如果要 产生一个句子,选取时刻只有在最具活性的词目被插入句法框架时才受到控制。当我们把错误分布制作成模型时,选取时刻往往被赋予一个不变的默认值。形态音系学编码当你在设计句子“ they are selecting me”时,你必须要从大脑词库中为每一个选取的词汇获 取形态音系学的代码,其中包括语素量级的代码select和ing(见图表3),然后 还 要计算它们的音节划分和在上下文中的重音结构。这就自然要把整个过程细
17、分为“ 代码获取”和“诗体化” 两步。代码获取一个语项的形态音系学代码包括它的形态音系学组成,它的韵律形式,和音段组成(如图表3中步骤1和步骤2所示)。获取代码信息是在激活或选取词目之后。不少人已经就这一问题进行了大量探讨。在织工模型中,音系学代码的激活和获取要严格以选取相应的词目为条件。比方说,你的目 标词汇是cat ,那么你要先选取它的词目,之后再将激活扩展到它的音系学代码(k?t)。 这就 预示了,另外一个活跃的但没有被选取的词目(比如dog一词的词目)不会将激活扩展到它们的音系学代码。最初的实验说明,图像命名中,在同一范畴备选词目中存在语义的而不是音系学的激活(如果cat是目标词汇,d
18、og就会表现为语义性而非音系学性的活 跃)。然而,所有以言语错误为基础的研究词汇产生的模型都认为,整个网络机构中存在随意性的激活串联。按这样的说法,活跃的备选词目也应该变得音系性活跃才对,至少 应该在某种程度上活跃。然而,最初的实验发现却得到反复证实。 语义备选词目的同时音系性激活只有在一种限制的情形中可以被发现:即当备选词目是目标词汇同义词的时候。当你命名一个沙发(couch)的图像时,sofa的音系学代码被被明显地同时激活。但这一重大发现的原因还不清楚。 这一发现说明,网络中的激活串联确实存在,但并不是所有词汇网络结构的普遍特征毕竟,它在例如cat和dog这种属于某个范畴的词条中就没有出
19、现。 这就暗示了,这种现象与说话人的主观看法有关。如果你有两种等效的方法去指称一个物体,偶尔你会把两个词目都选取,然后将激活扩展到它们的音系学代码。这意味着,当两个极富竞争力的词目被近乎同等激活时,织工模型的特殊检验机制(如上所示)也会偶然失去作用。一些暗示性的言语错误的证据可以证明这种情况确实存在:不属于同一范畴的词条,其音系性词汇的截搭很往往会成为相近同义词的截搭(比如close和near 截搭成 clear)。在词汇产生中还存在一种强大的词汇频率效应(其中部分应属语言认知年龄效应)。对照着概念偏向,你发出如同mouth这样的高频率反 应要比发出moth这样的低频率反应快很多。众所周知,这
20、种效应是在获取音系学代码而不是在选取词目时出现的(见图表3的步骤1)。这一事实与所谓的“话到嘴边现 象”存在预示性的关系。通常在说话的时候,你偶尔会想不起一个人,一朵花,一台设备,或者是什么东西的名字。这种现象可以在实验中通过向受试者出示待命名物体的定义诱发。如果这是个低频率出现的名字,那么你就可以在受试者身上诱发出“ 话到嘴边效应”。当一种语言是有性别标识的(比如意大利语),那么受试者很有可能知道这个出问题词汇的性别,这点也适用于无法记忆事物名称的病人在寻找词汇时遇到困难的情形。在词汇网络结构中,这已经成为区别 “在前的”的句法词目层面和 “在后的”的音系学代码层 面的理论之一。但是 这个理
21、论引发了一些尚未解决的争议。在音系学词汇替代错误中,几乎绝对的性别保留现象(比如在意大利语中对于lavagna,我 们有lasagna)成为与句法优先理论关系更密切的言语错误实证。诗体化递增式音节划分是这里的核心过程。让我们再回到我们要表达的句子they are selecting me (图表1的步骤3)。进行时词目select 的形态音系学代码由两部分组成:(s, I, k, t)和(I, )。音节划分从左至右进行。首先你要把前两个音素合在一起形成第一个音节 /si/,之后,再用下面三个音素形成音节/lk/,最后,再把剩余的音素合在一起形成/ti/。运用“潜在诱发范式” (见框2)的试验为
22、这一过程的严格递增性提供了最后的实证。要注意的是,最后一个音节/ti/跨于select和ing 两个语素之间。这种情况也可以出现在词和词之间。当你要说句子They will select us的时候,它的音节划分应该是si- lkt s,这里,/ ts /就跨于select和us两个词之间。但是如果你要说的是they select me, 音节划分就是/si- lk t-mi/,这里就不涉及跨于两 词之间的情况。显然,音节不体现在语素的音系学代码当中,但却取决于词汇和它的语素所在的上下文。 词汇的音素不是被标志在一个固定的位置上;根据上下文select中的/t/既可以位于音节开头又可以位于音节
23、末尾。音节划分的范围(比如selecting,selectus,select)被称为“音系学词汇” 。它可以比词汇词大也可以比词汇词小。即时音节组成中的递增式片段合并是根据一套严格的规则进行的,而这些规则在不同的语言中也不同,它 们不断地被迅速应用于流畅的言语产生当中。如果你说的是巴布亚语,那么你所有的音 节都有一个辅音(C)后跟一个元音(V)组成,即:CV。传统认为,音节划分就是填写 这些音节框架(见框1),但是这样的观点已经越来越没有说服力了。尤其,对于把音节代码中的音素标志在一个特殊音节位置上的观点人们发现了很多问题。对于为了保存音节位置而倾向于声音互换的现象,我们可以有其他的解释,我
24、们可以将其视为词汇首位置的易扰性,音素的相似性,和音位配列学限制的结合。然而,我们却有大量精密时计的实证可以证明韵律框架结构的存在(见图表3)。对于荷兰语或其他有重音分配的语言,如英语和德语,都存在一种重要的韵律模式:词汇重音放在第一个全元音音节上(morning,yellow,forget最后一个词中的“o” 不是全元音而是中性的混元音)。这可以在递增式音节划分中自动形成。但是如果一个词的重音模式不正常,那么自动性就会停滞(例子参见框2)。词汇不正常的韵律框架很可能作为部分音系学代码被存储起来;然后由它指挥不正常的诗体化过程。然而,不同语言因为它们不同的默认韵律而不同。区分获取词汇音系学代码
25、和之后的快速音节划分这两个过程,对理解词汇产生的神经学建构非常重要。对于词汇产生描绘研究的变化分析表明,获取代码与韦尼克区有关,而诗体化与大脑后部,下部,和前部皮 层有关。语音编码和发音递增式诗体化过程继续进行,已有的音节或更大的诗体学结构应该具有语音形态。作为说话者,你要递增式地为诗体化上下文中的音节做发音姿势的准备。织工模型的核心特征就是音节表的概念。荷兰人80%的谈话只用到大约不到500个不同的音节(尽管,在这些语言中存在了远远多于10000的不同音节)。音节表被描绘成一个存放这些过度使用,高频率出现音节发音姿势的仓库,其中一个“ 音节记号”对应一个音节发音姿势。每次形成一个例如/si/
26、 ,lk或者/ ts /这样的音系学音节,对应 的发音姿势记号就会被激活。这个记号说明了运动神经如何工作才能发出这个音节(比如关闭声门或者把闭合的双唇打开)。在织工模型中,发音姿势记号之间总有一种竞争。激活从个 别音段传递到所有它们参与的发音姿势记号(见图表2)。因此,相似的音节记号容易被同时激活;从这些记号中偶尔的误选可能会与目标发音姿势十分相似。选取潜伏期由卢斯法则决定(如同在词目选取情形中一样)。对于选取用于发音的音节记号还有更多的限制。某种音节的反复使用可以辅助发音(比如在产生无意义短语kem-til.fler时,kem和后面的til 都是CVC 音节)。相似的发音姿势记号显然可以互相
27、激活彼此(比如CV和CVC )。最后, 织工和两步互动性模型都为每一个音段提供了一个特征呈现。两个模型中,音系学编码的单位都是整个音素(有大量实证可以证明),但这些音素例如“ 浊音”,“鼻音” ,“响音”等特征已 经在音节划分的 过程中具有“ 可见性”了(参见图表3的说明)。在下一步的语音编码中,这些特征会在发音姿势的建构中起作用。至于对言语运动方案的研究,它已自成一门学科,本文就不加以论述了。结论源于言语错误分析和命名精密时计的两种研究传统要想达到完全的协调统一还需要很长的时间。但是,二者之间活跃和极具建设性的互动可以使我们更好地理解词汇选取和音系学编码。对于两种传统,一种 统一的力量在于计算的模型化。目前 实现了的模型都具有相同的分析层面,它们是方位主义和具有象征意义的;它们都计算十分相似的语言学呈现。另外一种统一的力量有望来自于大脑成像(参考文献57提供了对词汇处理进行大脑成像研究的最新论述)。词汇产生的大脑成像实验应该由词汇处理模型指导设计,而不是凭着本能的直觉,虽然这种凭直觉设计实验的现象仍然非常普遍。我们需要的是,对于某些特定处理部分以及它们之间互动性,支持和反对的两方面证据。