会道网
人文社科学术信息平台

许宏晨:结构方程模型在国内外应用语言学研究中的运用比较

摘要:本文首先简介结构方程模型 (SEM) , 然后结合近十年来国内外学术期刊中以SEM为研究技术的应用语言学文章, 从内容和形式两方面讨论国内外研究者的使用差异。从内容上看, 国外学者常用这一技术进行纵向、验证性的全面研究;我国学者多用它进行横向、探索性的专题研究。从形式上看, 国外学者对待SEM统计指标比较宽松, 模型呈现比较详细, 软件使用比较多元;国内学者对待SEM统计指标比较谨慎, 模型呈现形式简洁, 软件使用比较单一。

1. 引言

结构方程模型 (Structural Equation Modeling, SEM, 下同) 是一种建立、估计和检验因果关系的多元统计分析技术。它是一种借助于理论进行假设检验的统计建模技术, 能够帮助研究者检验其所设计的理论模型是否有效。这一研究手段多被应用在心理学、社会学、管理学当中 (柯惠新、沈浩, 2005) 。自20世纪90年代以来, 逐步开始在应用语言学研究中运用。

在国外, Gardner等早在1983年就把这一技术运用到应用语言学领域。国内应用语言学领域系统介绍这种方法是在2003年。王立非和鲍贵 (2003) 马广惠和文秋芳 (1999) 以及秦晓晴和文秋芳 (2002) 的研究为例, 系统介绍了LISREL软件的基本思想、使用方法和解释力度。近期, 韩宝成 (2006) Kunnan (1995) 的研究为例系统介绍了SEM在语言测试中的应用;文秋芳 (2007) 以“作文内容”的构念效度为例说明了AMOS 5在结构方程模型研究中的一些显著优势。

笔者在阅读文献的过程中发现, 国内外应用语言学研究者在使用SEM进行研究时既有共性又有差异。鉴于目前尚无对国内外应用语言学领域中运用SEM方法的比较研究, 笔者认为有必要进行国内外对比, 以便互相学习、取长补短, 也能为国内正在使用和有意使用此方法进行研究的应用语言学研究者提供借鉴。

2. 结构方程模型简介

SEM综合了传统的多元统计分析手段如因素分析、典型相关、回归分析、路径分析等, 同时又避免了这些手段的弊端。探索性因素分析虽然能帮助研究者进行变量概括, 但是无法验证所得出的因子 (即潜变量) 是否与理论概括吻合。典型相关分析虽能分析两组 (潜) 变量之间的相互关系, 但无法解释它们之间的因果关系。多元回归分析虽考虑了多个变量, 但作因果解释仍不太妥当, 且其假定测量中不含误差。路径分析可以推测变量之间的因果关系, 但也假定测量时不存在误差, 而这些在人文社会科学研究中是很难做到的。相比之下, SEM的优势就比较明显:它能更合理地解释变量之间的因果关系1;它能同时处理多个因变量 (包括潜变量) ;容许自变量和因变量含有测量误差, 而且能同时处理显变量、潜变量及误差项;它的测量模型灵活, 某一显变量可从属于两个 (或以上) 潜变量;它还能直观地揭示出潜变量之间的关系、估计模型与数据的拟合程度 (侯杰泰等, 2004) 。

SEM 的使用过程分为五个步骤:模型设定、模型识别、模型估计、模型检验和模型修正 (Schumacker & Lomax, 2004;韩宝成, 2006) 。它的模型可以分成两类:测量模型和结构模型。测量模型的实质是验证性因素分析, 主要考察潜变量 (即概念变量) 和显变量 (即测量变量) 之间的解释关系。结构模型又称因果模型或全模型, 事实上是 (潜变量间的) 多元回归分析, 主要考察外生变量 (自变量) 对内生变量 (因变量) 的影响程度和预测能力。至于研究者使用 哪种模型要依其研究问题和研究目的而定。在判定SEM构造出来的理论模型和样本数据拟合时, 要参考若干个指标 (侯杰泰等, 2004) , 而不像传统统计手段那样只考虑一个指标的值是否显著。一般说来, 只要多数指标达到或接近基本要求 (见表2) , 研究者所设计的理论模型就可以被接受。

SEM的应用软件种类繁多, 且各有特色。最常用的有统计学家J⌀reskog和S⌀rbom开发的LISREL (LInear Structural RELastionship) ;心理学家Arbuckle开发的AMOS (Analysis of MOment Structure) 和心理学家Bentler开发的EQS (EQuationS) 。

和其他统计手段一样, SEM也有统计前提, 如要求数据正态分布、变量之间为线性关系、变量之间要存在相关等。所以如果数据是严重的偏态、变量之间为非线性关系或变量之间存在伪相关时, 无论SEM的统计指标多么符合要求, 结论都是不可信的。这是研究者在实践中值得注意的。

3.近年来以SEM为手段的应用语言学学术论文

为综合考察SEM在应用语言学研究中的运用状况, 笔者以近十几年来 (1997年至今) 国内外共6本有影响力应用语言学期刊所刊登的用SEM方法进行研究的论文为例进行了比较研究。其中国外的期刊有Applied Linguistics (AL) , Language Learning (LL) , TESOL Quarterly (TQ) 和The Modern Language Journal (MLJ) 。国内的有《外语教学与研究》 (《外研》) 和《现代外语》 (《现外》) 2。十年来, 这些期刊共发表了26篇用SEM技术所做的科研论文, 其中国外17篇, 国内9篇。总的来说, 在20世纪90年代, SEM这一方法偶见于应用语言学研究的文章当中 (共6篇, 其中国外5篇, 国内1篇) 。进入新千年之后, 运用这一技术进行应用语言学研究的论文大量增加 (共20篇;其中国外12篇, 国内8篇) 。研究的领域涉及到应用语言学的主要方面 (见表1) 。笔者以这些文章为例进行国内外比较。

4. SEM运用的国内外比较

笔者发现国内外应用语言学研究者使用SEM进行研究时, 在内容和形式两大方面存在着不少共性, 但更多的是差异。

4.1 内容比较

4.1.1 研究课题:一维与二维的对应

从研究内容上看, 国内外研究者都把这个技术应用在了应用语言学主要课题上 (见表1) 。这些课题可以分为两大类:一类是有关学习者语言知识和技能等认知方面的研究;另一类是有关学习者动机和态度等情感方面的研究。除以上两种主要用途以外, SEM还被运用到教育政策的研究当中 (Gorsuch, 2000) 。

表1 近十几年来以SEM为手段的应用语言学学术论文     下载原表

表1 近十几年来以SEM为手段的应用语言学学术论文

    下载原表

表1 近十几年来以SEM为手段的应用语言学学术论文

但是, SEM的运用范围不同, 存在着一维与二维的对应。国外的应用语言学研究者既在学习者的认知因素研究中使用SEM, 也在情感因素研究中使用SEM, 表现出“并举”的二维特点。相比之下, 国内的研究者主要在学习者认知方面的研究中使用SEM, 他们在情感因素研究中很少使用, 表现出“一边倒”的一维特点。出现这种现象的原因可能是在情感等因素的研究中, 国内的研究者还没有认识到SEM的优势和作用。亦或这种方法还不够普及, 所以在研究中尚未使用。另外, 也可能是因为情感因素的变化比较大, 在变量的测量和模型拟合过程中不容易实现统一。

4.1.2 研究视角:横向与纵向的对应

在运用SEM进行应用语言学研究时, 国内外研究者的研究视角都以横向为主, 所使用的数据绝大多数是静态数据。国外17篇文献中有13篇是用静态数据进行的横向研究, 国内的9篇文献则全部是使用静态数据的横向研究 (见表1) 。

但是, 国内外应用语言学研究中在使用SEM这一技术时研究视角不完全相同, 表现出横向研究与纵向研究的差别。国外除了有以静态数据为基础做的横向研究, 还有4篇是用动态数据做的纵向研究, 表现出横纵结合的特点。而国内的9篇文献都使用静态数据进行横向研究, 未见纵向研究 (见表1) 。

SEM的优势是能同时进行多个模型的比较, 尤其对用纵向跟踪数据所做的研究更为适用。传统上常用重复测量方差分析来处理跟踪数据, 但是这样的做法无法看到变量在时间上的变化过程。而SEM可以用不同时间点上同一组被试的不同数据去拟合同一个理论模型, 从中得出不同时间点上的子模型。通过比较这些子模型间的差异, 就可以清楚地看到各个变量的变化过程。这种方法能最大限度地利用数据信息, 充分验证理论模型的解释力。国内应用语言学界目前尚无用SEM进行纵向数据跟踪研究, 原因可能在于研究者对于SEM了解和使用还在起步阶段, 对这一技术开发力度不足。

4.1.3 研究方案:探索与验证的对应

从研究方案的设计上来看, 国内外应用语言学者在运用SEM时的方法不同。国内学者通常用它来探索各个因素之间的关系, 而国外学者更倾向于用它来验证事先假定的理论模型。

SEM可以用来进行探索性分析, 可是它的优势在于验证性分析:即对事先假定好的理论模型进行检验 (如Tremblay & Gardner, 1995;Gardner, Tremblay & Masgoret, 1997;Gardner, Masgoret & Tremblay, 1999;文秋芳, 2007) 。在验证性分析的过程中, 研究人员是用收集到的数据来拟合事先提出的模型假设。这体现了国外研究人员对于SEM手段的深入理解和恰当应用。他们在文章中, 更多的笔墨花在模型建立上面。在模型得到验证之后的结果解释部分里, 他们的分析和解释就显得有理有据, 前后呼应得也很好。

国内学者在使用SEM的时候, 多数是将其用于探索性研究, 即事先并没有假定好的模型, 研究者期待通过自己的理论并结合SEM技术能够得到一个比较好的模型来解释一些二语习得中的现象 (如马广惠、文秋芳, 1999;王立非、文秋芳, 2004) 。在探索性分析中, 研究人员更多地是依赖SEM技术并结合相关的理论知识对诸多因素构成的若干可能模型进行检验, 从中挑选出一个相对来说最为合理的作为诸因素之间的解释框架。所以, 研究人员多把笔墨花在对模型的解释上面;但由于事先没有假定一个模型, 因此在解释的过程中显得底气不足, “可能”、“也许”之类的主观判断用得比较多, 分析显得有些乏力。

4.1.4 分析模式:作者中心与读者中心的对应

从分析模式上来看, 国内外学者在使用SEM时, 体现了一种作者中心和读者中心的对应。

国外的论文在把SEM技术运用到具体研究中之前都用很大的篇幅介绍SEM的基本概念和相关用法, 而国内的文献中只有王永庆和曾用强 (2006) 在其论文中有关于SEM各参数指标的简要介绍。国外的论文都有附录, 且在附录中列出了供SEM计算使用的方差协方差矩阵 (Gorsuch, 2000;Yashima, 2002;Woodrow, 2006) 、SEM软件的计算机程序 (Matsumura, 2003) 、拟合指数对照表 (Woodrow, 2006) 或者完整的结构模型 (Csizér & D⌀rnyei, 2005) 。相比之下, 国内的论文都没有附录, 而且在正文中不提供以上信息。

笔者认为, 国外的研究论文是一种以读者为中心的写作风格, 而国内的研究论文是一种以作者为中心的写作风格。之所以这么说, 是因为在阅读国外的研究论文时, 即便一个不懂SEM的人, 在读过文章中介绍SEM 的相关章节之后就能大致了解它的概况, 从而能够理解这种统计手段并跟上作者的思路。国内的研究论文没有专门介绍SEM的章节。文章的作者事实上假定了读者具备基本的SEM知识, 所以一个不懂得SEM的人在阅读用这种统计方法进行研究的论文时是比较困难的。好在国内期刊有专门的文章运用具体实例对SEM进行系统性、普及性的讲解 (王立非、鲍贵, 2003;韩宝成, 2006) 。出现这种现象的原因, 笔者认为是国内的研究向来没有在论文中简介统计手段的传统造成的。

4.2 形式比较

4.2.1 统计指标:严格与宽松的对应

SEM的统计指标众多, 根据许多研究者的观点 (Byrne, 1998, 2001, 2006;Raykov & Marcoulides, 2000;Schumacker & Lomax, 2004;侯杰泰等, 2004;吴红云, 2006) , 判断样本数据与理论模型拟合程度好坏的指标可分成三类:绝对拟合指数、相对拟合指数和简约拟合指数 (见表2) 。

表2 SEM拟合指数基本要求     下载原表

表2 SEM拟合指数基本要求

虽然卡方值及其显著性 (CMIN/DF) 是衡量模型与数据拟合的一个重要标志, 但是由于卡方值容易受样本容量的影响, 所以在使用大样本的研究中, 卡方检验的显著水平往往小于0.05 (p<0.05) 。这样的结果很可能迫使研究者不得不拒绝本来没有问题的理论模型。因此, 目前国内外研究者更多地是参考其他指数来决定接受还是拒绝理论模型。在这些论文中, 不论卡方值及其显著水平是否达到了理想标准都被汇报出来了, 但都不作为唯一标准。事实上, 其他绝对拟合指数才是更重要的参考标准, 其次是相对拟合指数。汇报简约拟合指数的只有两例 (Csizér & D⌀rnyei, 2005;Chen et al., 2005) 。另外, 在使用动态数据进行跟踪研究的实证报告中, 有的研究者在进行模型比较的时候还汇报了模型比较指数ECVI (Matsumura, 2003) 。

从统计指标上看, SEM的达标标准不同, 呈现方式也不同, 表现出一种严格与宽松的对应。在国外的研究中, 三类指数只要接近基本要求 (即与基本要求相差0.03-0.05左右) , 研究者就认为理论模型与样本数据拟合完好 (如Tremblay & Gardner, 1995) 。在解释原因时, 有的研究者认为是样本量过大导致的 (Csizér & D⌀rnyei, 2005) , 有的认为是由于模型过于复杂 (Gardner et al., 1997) 。在国内的研究中, 以上三类指数都要达到基本要求, 研究者才认定理论模型与样本数据拟合完好 (如马广惠、文秋芳, 1999;秦晓晴、文秋芳, 2002;王立非、文秋芳, 2004;修旭东、肖德法, 2006;文秋芳, 2007) 。究其原因, 笔者认为国内的研究者把本来很灵活的统计指标绝对化了。SEM拟合指数的基本要求只是个经验性的参考值, 并非硬性指标。没有哪个指标是最重要的。要想确定模型与数据是否拟合, 主要看绝大多数拟合指数是否接近或者达到基本标准。

此外, 国外的研究者在论文中只汇报SEM的各类指数, 偶尔也有汇报影响效应表 (Wen & Johnson, 1997) 。相比之下, 国内的研究者除了汇报拟合指数, 还通过影响效应表呈现潜变量之间的解释关系 (马广惠、文秋芳, 1999;王立非、文秋芳, 2004;吴红云、刘润清, 2004) 。这能更清晰地表明SEM模型中各个路径之间的关系, 使读者更容易理解模型的解释力。

4.2.2 模型表示:简约与详细的对应

在这些论文中, 无论是测量模型还是结构模型, 在表示方法上都可以分成两类:一类是带有原始观测变量的复杂模型;另一类是不带原始观测变量的简约模型。但是, 国内外研究者在模型表示法上表现出来的简洁与详细的对应十分明显。

在国外的研究报告中, 绝大多数研究者在理论模型中都带有原始观测变量。只有Csizér 和D⌀rnyei (2005) 在正文中使用不带有原始观测变量的简洁模型, 但在附录中提供带有原始观测变量的结构模型。Wen和Johnson (1997) 在正文中没有提供模型, 但在文章的附录中提供不带原始观测变量的结构模型。国内的研究报告理论模型都不带原始观测变量。只有修旭东和肖德法 (2006) 在正文中使用带有原始观测变量的结构模型。

国外研究者这种“不怕麻烦”的详细倾向与国内研究者“言简意赅”的简洁做法形成了鲜明对比。至于原因, 笔者认为这和国内外期刊对文章篇幅的限制有关。国外期刊对文章篇幅大小的限制不那么严格, 只要把问题说清楚, 且篇幅不是极大, 是可以把作者原文的全貌呈现给读者的。所以作者有足够的空间来表达其思想, 自然就可以在一篇文章里同时呈现简洁和繁琐的SEM。而国内期刊对文章篇幅限制严格, 一般要求文章在8000-10000字之内, 有的甚至更少 (如5000字以内) 。在此情况下, 作者不得不压缩篇幅, 把精华部分呈现给读者, 因此在模型呈现上省略或缺少了不带原始观测变量的结构模型。

4.2.3 软件使用:单一与多样的对应

从软件的使用上看, 国内外研究者多使用LISREL, 其次是AMOS, 用EQS的不多 (见表1) 。但是, SEM软件在国内外应用语言学研究中的普及和流行程度不同, 表现出单一与多样的对应。

国 外的研究者不拘泥于某一个软件。事实上, 目前SEM常用的三种软件 (LISREL, AMOS和EQS) 在他们的研究中都有所使用, 表现出多样性。而在国内, 研究者更倾向于使用传统、经典的LISREL (只有一例使用AMOS) , 一元色彩比较明显。出现这种现象的原因可能是经典软件占据了国内研究者的主要视线。因为最初出现的SEM软件就是LISREL, 所以大家习惯上愿意接受和使用它。但笔者在实践中发现, AMOS其实更适合绝大多数没有计算机编程基础的应用语言学研究者。它提供的AMOS Graphics界面, 使得SEM从模型设定到模型修正这五大步骤变得轻松简便。它“所见即所得”的设计理念大大减少了研 究者因不懂计算机程序语言而产生的畏难情绪 (参见文秋芳, 2007) 。因此, 国内的研究者今后可以从这一软件入手, 熟悉SEM的基本操作方法, 从而在实际研究中运用软件进行SEM分析。

5. 结语

综上所述, 国内外应用语言学研究者在使用SEM这一技术时表现出一定的差异性。通过比较, 笔者认为, 国外的研究给国内同行许多启示:尽快在国内应用语言学界普及SEM技术, 为国内学者建立并检验本土化的理论提供统计手段的支持;增加纵向研究的视角, 充分发挥SEM的优势, 从而在研究中去发现更多有价值有意义的内容;扩展SEM技术的应用范围, 使之在学习者因素的研究当中也能应用广泛;在运用SEM进行统计计算时, 应该以理论模型为基础综合多方面因素, 灵活地对待各种拟合指数;在呈现模型、汇报结果的过程中, 应该多考虑读者, 给他们一个便于理解和简洁的模型。此外, 还要结合研究者的个人实际, 选择适当的SEM软件, 更加快捷方便地进行实证研究。

来源:许宏晨.结构方程模型在国内外应用语言学研究中的运用比较[J].外语教学理论与实践,2009(01):84-89.

分享到:

评论 抢沙发

评论前必须登录!

 

会道网,社科学术信息平台

关于我们发布会讯
切换注册

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录
切换登录

注册