会道网
人文社科学术信息平台

国外基于语料库的隐喻研究:方法、问题与展望

摘要:语料库方法与隐喻理论相结合近年来已发展成为隐喻研究领域中的主流趋势。该方法为隐喻研究提供了实证性理据的支撑, 拓宽了隐喻研究的范围, 在一定程度上克服了早期隐喻研究在方法论层面的诸多缺陷与不足。然而这一研究范式在语料收集与识别等方面依然受到学界的质疑与挑战, 具体表现在语料的检索方法、语料的代表性与平衡性及语料的间接性方面的问题。文章对这些问题进行了系统梳理与分析, 并对未来的语料库隐喻研究提出了相关建议。
关键词:隐喻; 语料库; 语料检索; 隐喻识别;

作者简介:柳超健 浙江传媒学院; 曹灵美 上海财经大学浙江学院

1. 引言

概念隐喻理论 (Conceptual Metaphor Theory, 以下简称CMT) 在语料收集与识别等方法论层面的问题历来受到学界的质疑与挑战 (Murphy, 1997;K9vecses, 2008;Gibbs, 2011) 。因为该理论的研究语料是基于内省法获取的。具体来说, 研究者在语料收集时主要依赖自身的元语言直觉, 或是源于词典编纂人, 又或是缺乏专业背景的普通言语者。显然, 这种基于直觉的语料收集方法包含了较强的主观因素。既然内省法不是基于大型语料库, 因而也就无法保证其研究材料的有效覆盖率、代表性和穷尽性 (刘正光, 2001) 。Cameron&Low (1999) 同样认为, CMT的核心观点建立在具体的例证之上, 因而难以保证其恢复性。不可否认, 语言研究首先必须以真实可靠的语料为基础。然而, CMT自始至终并未提及语料的来源问题, 就更不必谈具体的识别方法与提取步骤了, 这在很大程度上加大了业内学者在这一领域进行系统研究的难度。CMT在方法论层面的这些问题促使诸多学者开始重新审视该理论, 并试图提出相关修正方案。

在认知语言学研究中, 语料库方法以其观察的系统性、解释的充分性和客观性, 形成了对传统内省法的有益补充 (束定芳, 2013:217) 。该方法通过考察语料库中大量使用中的真实语言, 以一种自下而上的研究思路来揭示语言形式背后的概念系统和认知规律, 从而有效解决了传统语言学研究方法中存在的主要问题。在过去15年里, 语料库方法已成为语言学研究中一个重要的实证性研究范式, 推动了对词汇和语法的深入研究, 几乎被运用到语言结构的各个层面 (Stenfanowitsch, 2006) 。

语料库方法与隐喻理论结合是近年来认知隐喻研究中的主流趋势。该方法为隐喻研究提供了实证性理据的支撑, 有效提高了隐喻研究的信度与效度, 在某种程度上促进了隐喻研究的“实证转向”。然而这一研究范式在语料的检索方法、语料的代表性与平衡性及语料的间接性方面依然受到学界的质疑与挑战。本文对这些问题进行了系统的梳理与分析, 并对未来的语料库隐喻研究提出了相关建议, 旨在进一步推动隐喻研究的发展。

2. 国外基于语料库的隐喻研究概述

2.1 研究模式

目前, 国外基于语料库的隐喻研究主要有以下四个类别:

1) 理论验证类。主要基于通用语料库来研究概念隐喻的系统性, 通常是为了证实CMT的科学性, 或通过语料库检索和语料分析来归纳和总结内省法无法观察到的语言类型及语法特征, 进而修补CMT的缺陷与不足 (Deignan, 1999, 2005, 2006;Semino, 2005, 2006, 2008;Hanks, 2006) 。例如, Deignan (2006) 基于Bank of English中的语料, 系统探讨了语言隐喻的语法问题。研究发现, 隐喻语法类型的差异主要体现在词性和句法层面;词汇的隐喻意义通常出现在相对固定的句法类型中。Semino (2008) 通过对rich的语料库检索和语料分析, 将Lakoff&Johnson (1980) 提出的概念隐喻ARGUMENT IS WAR进行了重新定义, 认为语言隐喻所产生的不同意义至少可以通过不同的脚本来解释, 而这些脚本应属于更加宽泛的概念域。

2) 语用功能类。在具体语篇中, 通过考察语言隐喻的使用频率、搭配和分布情况来挖掘概念隐喻的语用功能及特点, 或在不同语篇中通过考察语言隐喻的异同来揭示语言背后的意识形态 (Cameron&Deignan, 2003;Koller, 2004;CharterisBlack, 2003, 2004) 。例如, Koller (2004) 从批评认知视角对营销媒体话语与并购媒体话语中的隐喻与性别进行对比研究, 形成了语料库语言学、批评话语分析和概念隐喻理论相结合的“三位一体”研究方法, 反映了认知隐喻研究的“实证转向”和“社会转向”。Charteris-Black (2004) 基于语料库方法对比分析了政治演讲、媒体报道和宗教语篇中的隐喻使用及意识形态, 重点考察了在不同社会文化背景下隐喻的使用规律、类别及其相关的话语策略。

3) 跨语言比较类。利用语料库对比跨语言和文化背景下的隐喻使用, 考察其共性和特性, 并基于不同视角挖掘产生差异的理据 (Semino, 2002;Deignan&Potter, 2004;Simó, 2009) 。例如, Deignan&Potter (2004) 以大型语料库为基础, 在阐释CMT解释力的同时, 比较了英语和意大利语中以身体经验为基础的隐喻, 并分析了不同隐喻语言背后的文化因素。Semino (2008:206) 认为这类研究也可用于考察某种特定语篇和话题中的隐喻, 但通常基于更具体的小型专用语料库, 旨在从历史视角挖掘某种观点、态度及文化差异。

4) 语言研究技术类。利用信息技术来构建隐喻运作机制的模型, 从而实现对隐喻语言的自动处理 (隐喻的识别、理解与生成) 。例如, Wilks (1975) 基于优选语义理论, 通过语义选择优先的异常中断和辅助理解情景知识的“伪文本”, 进而来触发对隐喻的理解与识别。Martin (1990) 设计的MIDAS模型能够完成对常规隐喻和新生隐喻的认知描述, 并可处理Unix操作系统中的教学软件。在隐喻语料库建设方面, Lakoff等 (1991) 建立了第一个多功能在线隐喻标注知识库———重要隐喻目录 (Master Metaphor List) 。

2.2 研究方法

目前, 国外对隐喻语料收集的研究主要有两个分支:一是尽可能地将隐喻研究的方法论步骤透明化, 并试图通过构建一种可靠且易操作的识别程序使隐匿于语言形式背后的概念隐喻可以清楚地识别出来 (Pragglejaz Group, 2007;Steen et al., 2010) 。第二个分支并非将内省法替换为相应的方法论步骤, 而是彻底否定基于内省法获取的语料, 其研究步骤主要是从大型语料库中识别并提取相应的隐喻 (Deignan, 1999, 2005) 。以下分别从语料检索和隐喻识别两个方面来论述这两个分支中的研究方法。

2.2.1 语料检索

语料库隐喻研究方法首先必须关注如何从语料库中检索、识别和提取相关的语言隐喻。在概念层面, 隐喻与特定的语言形式之间并不存在直接关联, 而语料库的检索对象只能是语言形式。所以, 利用语料库对隐喻进行检索, 关键在于如何解决隐喻形式和意义之间的接口问题 (束定芳, 2013:71) 。鉴于目前国外还没有相对成熟且可利用的标注隐喻语料库, 本文只探讨在非标注语料库中常见的四类隐喻检索方法 (Stefanowitsch, 2006) :

1) 检索源域词汇。首先预设文本中可能存在的源域, 然后在语料库中检索与该语义域相关的所有隐喻表达式。例如, Koller (2004) 通过检索“战争”等源域中的词汇, 研究了以市场营销和企业并购为主题的媒体话语, 并基于定量和定性分析, 考察了隐喻在构建话语实践和社会经济实践方面的作用。这种检索方法还存在一种变体, 即首先从小语料库中人工识别出频率和相关度最高的隐喻, 然后在大语料库中自动检索出更多的隐喻类符 (Cameron&Deignan, 2003) 。

2) 检索目标域词汇。某些文本研究可能涉及特定的目标域及相关的概念结构, 因此也可对目标域词汇进行检索。例如, Chung (2008) 在研究英语、汉语和马来语对“市场”概念的不同构建方式时, 将检索词设定为目标域词汇market、“市场”和pasaran, 并从中分别提取500个索引行进行隐喻识别研究。

3) 检索同时包含源域和目标域词汇的句子。在检索过程中可以发现有些句子同时包含源域和目标域词汇 (如Your claims are indefensible) , 而有些句子只包含源域词汇 (如He is known for his many rapid conquest) 。Stefanowitsch (2006) 将前者称为隐喻模式 (metaphorical pattern) , 并将以检索目标域词汇为基础的隐喻识别过程视为隐喻模式分析。隐喻分析模式就是同时检索源域和目标域词汇的典型方法 (束定芳, 2013:73) 。

4) 检索隐喻话语标记语。许多隐喻表达式通常带有某些语言标记 (如, 元语言表达式metaphorically/figuratively speaking) , 因此可将其作为隐喻检索和识别的线索 (Goatly, 1997:172-199) , 这是一种相对直观的隐喻研究思路。

2.2.2 隐喻识别

如果将检索隐喻关键词视为隐喻研究的起点和基础, 那么隐喻识别就是隐喻研究中的关键环节;如果说语料库方法拓展了隐喻研究的范围, 那么隐喻识别就确保了语料的真实性和准确性。不可否认, 检索到的隐喻关键词中难免会存在一些与隐喻不相关的“噪音隐喻”。比如, 有些隐喻关键词在语篇中被用作专有名词或者该词汇本身被提及, 那么隐喻识别的功能就是过滤和剔除这些与研究不相关的词汇。早期隐喻研究更多关注的是利用语言层面的理据来构建和论证隐喻的理论基础。虽有少数零星研究涉及隐喻研究方法的问题, 但多数以评论或批判为主, 没有形成系统的研究套路或提出实质性的解决方案, 更没有提及隐喻语料的收集和识别问题。

基于以上问题, Charteris-Black (2004:35) 明确提出了多维度隐喻识别方法。他认为隐喻识别可分为两个阶段:一是根据语言、语用和认知的标准判定候选隐喻中是否存在由于概念域转移而造成的语义冲突, 并剔除其中不符合标准的候选隐喻, 进而定量统计隐喻关键词的频率;二是定性分析隐喻使用的语境, 判定隐喻关键词的隐喻性问题。显然, 该方法主要以概念域之间的语义冲突作为隐喻判定的标准。

此外, Pragglejaz Group (2007) 的隐喻识别步骤 (MIP) 切实为学界提供了一套清晰且易操作的隐喻识别程序。其核心内容在于只是比较词汇单元的基本义与语境义, 优势在于只涉及语言层面, 不必构建跨域映射的过程。这样就可以将隐喻识别限定于词义比较的研究范畴, 并可通过二元论法来判定语言的隐喻性。然而, CMT更多关注的是隐喻思维层面的问题, 而语言形式毕竟无法完全等同于概念结构。因此, 隐喻识别必须从语言和概念两个层面同时进行 (Kittay&Lehrer, 1981) 。

鉴于MIP的不足, Steen等 (2010) 提出了一套在跨域映射中识别所有隐喻相关词汇的规则, 即MIP的修正版本MIPVU, 该方法进一步阐释了隐喻在语言层面 (隐喻性词汇) 的识别, 并基于不同视角明确提出了“直接隐喻”、“间接隐喻”、“隐性隐喻”及“隐喻话语标记语”的识别方法。

3. 存在的问题

尽管语料库方法在很大程度上克服了认知隐喻研究在方法论层面 (尤其是语料收集与识别) 的缺陷与不足, 但该研究范式也存在以下问题:

1) 语料的检索问题:源域词汇检索法虽能穷尽性地检索语料库中的词汇, 但在检索之前必须预设可能存在的源域。其变体 (大、小语料库的结合) 在一定程度上缩减了这种主观性成分, 却始终无法检索到所有可能的语言隐喻;目标域词汇检索法只能检索到明确包含目标域词汇的隐喻, 因此其检索也不是穷尽性的;同时检索源域和目标域词汇的方法无法识别仅包含源域词汇的隐喻表达式, 而且该方法只是基于目标域的个别词汇进行检索, 因此也不具有穷尽性;此外, 鉴于大多数隐喻不具有明显的语言标记特征, 隐喻话语标记语也只能作为一种辅助方法来检索和识别隐喻。总的来说, 上述方法的共同问题是: (1) 语料的穷尽性和研究维度的限制性问题。所有检索词必须根据某种研究目标在检索之前由研究者先确定好, 其中包括检索词的派生词。换言之, 研究者只能获取已知或预设词汇索引的形符, 却无法获得这些索引之外的隐喻类符 (Koller et al, 2008) 。 (2) 过度依赖语言层面的问题。以上检索方法只涉及语言层面, 缺乏对概念层面的研究。因此, 语料库方法所得到的结论最好能有其他方面研究语料的支撑 (比如心理语言学研究层面) 。

2) 语料的代表性与平衡性问题:语料库方法研究隐喻的最大优势在于研究者能够从大量真实的语料中研究隐喻语言的使用频率等问题, 并通过分析和归纳隐喻现象来挖掘语言形式背后的重要信息。在跨语言对比研究中, 语料的选择必然会影响到不同语言现象之间频率使用的差异, 而频率正是语料库研究中最重要的参数之一。因此, 语料能否真实地反映语言事实之间的差异、能否得出客观、科学的结论在很大程度上取决于研究者所选取的语料库是否具有代表性以及不同语料库之间是否能够达到某种意义上的平衡。这种平衡特指不同语料库在类别、规模、文体及目标等方面的一致性。一言以蔽之, 语料的选取范围决定了研究结果的使用范围 (束定芳, 2013:143) 。例如, Charteris-Black (2003) 基于语料库方法对英语和马来语中以“口”、“唇”和“舌”为源域的隐喻与转喻进行了对比研究。该语料库题材相同, 规模相近, 内容匹配, 符合对比研究的基本要求。然而, 笔者也发现存在问题的个案研究。比如, Deignan&Potter (2004) 通过对比和分析英语和意大利语中关于“身体部位”的隐喻性语言, 提出了诸多仅凭内省法等传统研究手段无法挖掘到的语言事实和结论。研究发现:两种语言中存在一系列对等与不对等的意义, 以及隐喻意义大致相同但词汇化方式略显不同的情况。但两位学者承认该研究在语料收集方面存在问题, 即语料不具有代表性和平衡性。也就是说, 英语中包含了书面语和口语, 而意大利语中只包含了书面语;两种语料关于题材的分布也不成比例。在对比研究中, 如果连语料的平衡性和代表性都无法确保, 何谈研究结论的客观性与准确性?

3) 语料的间接性问题:语料库方法的局限性在于它只能提供语言事实的例证, 但是不能对其进行解释和推理, 也不能为文本数据直接提供文化和社会背景等方面的信息 (束定芳, 2013:144) 。换言之, 在隐喻研究过程中, 对于被检索到的隐喻语料的分析依然取决于研究者个人的主观判断。虽然语言隐喻是概念隐喻的实现方式, 但只能反映概念隐喻在语言层面的认知现象, 而目前大多数基于语料库的隐喻研究依然停留在隐喻的使用频率、类型、搭配及分布情况等方面, 因而无法直接考察隐喻在概念层面的运作机制和规律等问题。

4. 总结与展望

本文通过系统回顾国外语料库隐喻研究的基本现状, 在论述其优势的同时, 也指出了其存在的问题和面临的挑战。这些问题与CMT及语料库研究方法本身的缺陷相关。然而瑕不掩瑜, 语料库研究方法确实为隐喻研究提供了不同的研究视角和方法, 在很大程度上克服了传统研究在方法论层面的缺陷与不足。从某种意义上讲, 语料库方法促进了隐喻研究的“实证转向”和“社会转向”。鉴于此, 本文认为未来的语料库隐喻研究可从以下几个方面进行拓展和深化:

1) 隐喻语料检索方法的完善。语料库方法的优势在于能够为研究对象提供大量真实有效的数据。如果现有的信息技术无法对隐喻语料进行穷尽性检索, 那么语料库方法在隐喻研究中的优势就没有完全发挥出来。因此, 未来的语料库隐喻研究应该进一步完善在语料收集和识别等层面的问题, 利用计算机技术优势尽量使生成的索引行能够完全覆盖语义域中的词汇, 切实为隐喻的分析研究提供技术上的保障。

2) 隐喻在不同层面的研究。Hanks (2006) 认为, 隐喻具有层级性。因此, 隐喻研究应该涉及语言、概念及处理层面。笔者收集了1997—2015年间国际期刊Metaphor and Symbol中基于语料库研究隐喻的论文。其中大多数研究只涉及对隐喻语言的描述、解释或比较。比如, 研究隐喻使用的出现频率、趋势、类型、分布特点及话语功能, 并从不同视角揭示形成差异的深层次原因 (Semino, 2002) , 但普遍缺乏隐喻在概念层面的系统研究, 更没有从语法视角对概念系统进行深入探讨。语料库方法在验证隐喻理论的同时, 又引发了对现有理论和假设的质疑 (Deignan, 1999) 。因此, 如何从语料库中总结隐喻运作机制和认知规律, 不断完善和深化隐喻研究理论是未来隐喻研究的重大任务。

3) 隐喻的自动识别研究。认知语言学及相关跨学科领域的专家学者基于不同的研究目标陆续开发了诸多隐喻自动识别的计算模型, 其中具有代表性的是Mason (2004) 的Cor Met模型, Martin (1990) 的MIDAS系统及Fass (1991) 的Meta 5程序等。鉴于这些计算模型中存在的问题, 现阶段的隐喻识别大多依然采取“自动检索+人工识别”的方式, 即在语料检索阶段采用自动法, 在隐喻识别阶段采用人工法。因此, 如何最大程度地将隐喻语言形式化和智能化是未来研究需要解决的又一重大问题。

4) 隐喻的历时研究。隐喻是人类对客观世界进行概念化和范畴化的认知工具, 其语言形式与意义将随着历史发展而不断变化。语料库方法的优势在于能够反映隐喻语言的历时演变过程, 这有助于研究者更系统地挖掘隐喻语言的本质与认知规律。因此, 今后的研究不仅要从共时视角对隐喻语言进行描述与比较, 更要关注其历时变化与发展规律, 切实为语料库隐喻研究提供方法论上的平衡。

分享到:

评论 抢沙发

评论前必须登录!

 

会道网,社科学术信息平台

关于我们发布会讯
切换注册

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录
切换登录

注册