谈英语文体的定量分析

2005年第1期总第89期外语研究

ForeignLanguagesResearch2005,№1Serial№89

谈英语文体的定量分析

何淑琴

(南京农业大学外国语学院,江苏南京210095)

摘 要:语言学发展的根本动力是社会需求。文体学常见的研究方法是比较法、分类法。文体学家偶尔也使用统计法,但是统计法在文体学研究中的价值并没有得到充分挖掘。随着自然语言处理系统的发展,统计法在文体学研究中的价值越来越重要。本文简单回顾了文体和文体学的概念,对比了文体的定性和定量分析方法的优缺点,阐述了定量分析在文体学的一些新领域的重要应用。关键词:文体;文体学;比较法;分类法;统计法;定量分析

中图分类号:H087  文献标识码:A  文章编号:1005-7242(2005)01-0031-  11文体的基本概念

在语言学里,style是指集体或者个人在谈话或者写作中运用语言的方式(哈特曼&斯托克:-336),stylistics便是研究style在私

这种随意的称呼,它适合私,表明交际者之间亲密的私人关系;如果,就用DearMs.Blair,显得正式、严肃。再看两个英语词组:theblackcat和thecat,whichisblack。这两个词组的逻辑意义基本相同,都含有“thecatisblack”这层意思,但是两者结构不同,文体不一样,后者因为使用了定语从句显得比较正式。当然,这两个短语在意义上还是有细微的差别的。

文体方面的考虑涉及语言的各个方面和层次。人们在谈话或写作中,在表达相同或相近的意思时,凭借直觉和习惯采用自己认为最恰当的语言形式,即进行文体选择。词、短语、句法结构和文本格式在准确表达交际者的意思以及在取得预期交际效果方面的区别,有时明显,有时不明显,有时则非常细微,但是人们的确在根据具体的语境选择词语、语法结构、甚至文本格式,个人和集体的选择最终形成了个人、集体在特定时期或场合的文体。

文体学就是要研究个体或集体在不同的语境下使用语言的规律,制订文体规范或者描写各类文体特征,从而指导人们“到什么山唱什么歌”,不讲外行话,这里外行话不仅包括话语的内容,还应包括语言的风格,即文体,使言语的形式、内容、风格与交际目的和交际条件保持一致。

对研究对象的考察可以分为定性分析和定量分析。比较法和分类法是文体学最常用的研究方法,它们都是定性分析法。定性分析比较适合面向人的文体研究,如制订文体规范、描写各类文体的特征都可以以定性分析

从研究目标来看,写文体学。范要区分“正确”和“错误”的用法,在中小学英语教课书里有不少英语语法规则,如名词复数构成和动词过去时的变化规则等。只有遵守语法规则,使用正确的语法形式,人们才有可能生成正确的句子。但是,语言是一个符

号系统,了解并掌握符号与对象(符号的语义方面)、符号与符号(符号的句法方面)、符号与使用者(符号的语用方面)的关系是正确使用语言的前提。语法上正确的句子不一定是特定交际场合里最得体的语句。侯维瑞举过一个例子:两个小孩打架,其中一个发出警告,试图阻止对方。

Ifyoudon’tleavemealone,Holmes,Ishallnotbeanswerablefortheconsequences.

这句话完全符合语言规范,但是就小孩打架这一情景来说,所用的词汇和句法结构显得过于正式,很可能会引起哄堂大笑,难以达到说话人的交际目的。文体规范就是要解决语言运用里的优化问题,说明在若干个准确的用法之中哪一种用法最适合特定言语交际目的。因此,从言语交际的角度来看,语句必须既正确,又得体,才能取得最佳的交际效果,语法规则和文体规则同样重要。例如,写一封英文信,开头应该怎样称呼?是称呼Dear

①本文得到南京农业大学人文社科基金支持,课题号SK03016。

・31・

为主,以定量分析为辅。但是,语言学是一个活的学科,必须应对社会经济发展对文体学提出的新要求。例如,随着信息技术的发展,人们迫切需要在修辞校对、信息检索等语言工程中考虑文体因素。这样必须开展面向机器的文体研究,在面向机器的文体研究中,定量分析的意义上升了,在某些时候,统计这种定量分析方法甚至成为最主要的方法。下面我们就简单地回顾一下文体学研究的定量和定性分析方法,探讨定量分析在上述新兴文体学研究领域的应用价值。

2.文体学定性分析方法

实用性把英语语言分为科技文体,公文文体,新闻报道文

体和广告文体(秦秀白1986:177-208)。

比较法是传统的、基本的文体学研究方法。分类法是在比较法的基础上发展起来的。在文体学研究中,两种方法通常是并用的。语言学家们通过对各种文体的基本词汇、基本句式和表达方法的对比,找出各类文体都需

(thecommoncore),构成语言使用中的使用的“共同语”常规,不同文体所表现的不同的语言特点则形成在常规

基础上的变异(deviation)。比较和分类的方法是描写各类文体语言特征和建立文体规范的重要手段,都属于定31文体的定量分析

文体学是运用现代语言学理论和方法研究文体的一门学科,是一门既古老又年轻的学科。文体学的研究始于本世纪初,瑞士语言学家巴利继承和发展了索绪尔的理论,撰写了《文体学概要》和《法语文体学》,从而创建了现代文体学(郭鸿1998:1)风格(literarystyle)广告、新闻报道、文体学研究的基本的方法是比较法(秦秀白1986:4)。许多语言学家都采用比较法研究文体。在六十年代

,也可以,研究者通常按照统,用样本集合代表该类

然后选择一些参数(即语言特征),统计这些语言特征出现的相对频率和绝对频率。参数及其频率可以代表这类文本的文体特性。从方法论角度上看,这种文体分析方法与计算化石的某些化学成分的含量,并据此做出一些描述或者推断性结论(如分类)没有什么区别,是自然科学里普遍采用的多元分析方法。收集的文本集合代表一种文体,统计选定参数的频数和频率,计算各参数的均值和极值,绘制参数的分布图,这些是描写性的文体分析工作,如果把抽样的参数和参数值当作一定文体的标准,在这一背景下,考察其它文体符合或者偏离标准的程度,并据此提出修改的意见,就多少带有规定文体学的色彩了。所以,在文体学的定量研究中,规定文体学与描写文体学是相互依赖、相互渗透的,没有截然分明的界线。

从文体的定量分析的角度看,文体也可以界定为一类文本的总体或者代表性样本的集合(用U表示),文体的定量分析就是要研究U及其子集或者个体在参数X上的值。X在数学上通常表现为多维随机向量(X=x1,x2,...xn,n为自然数,表示X的维度)。选择适当的参

初,美国的社会语言学家拉波夫(Labov)采用比较法对纽约市不同社会阶层的发音特点进行了比较分析。对作家风格的研究也主要采用比较法。人们常说,英国作家王尔德风格俏皮,狄更斯惯用渲染与夸张,斯威夫特擅长辛辣的讽刺。海明威文笔简洁等等。这些观点都是通过大量的比较形成的。

文体学研究的另一种方法是分类法(裴文1998:12)。分类法是在广泛对比的基础上,以统计学、逻辑学、

社会学等理论为指导,根据社会交际目的、环境、方法等的不同,对文体进行分类。侯维瑞对文体分类法进行了研究,他根据交际情景的变化,把英语语言分为口语、书面语、正式语、非正式语、礼貌语等几种变体,也叫语域(register);根据地理区域不同,把英语语言分为英国英语、美国英语、新西兰英语、澳大利亚英语、加拿大和南非英语等变体,也叫地域方言(regionaldialect);根据各种社会因素(如民族、性别、年龄、行业)不同,分为黑人英语、女性英语、行业语、集团语等,也叫社会变体(socialdialect);根据语言的社会功能(题材)和使用领域,分为法

数(即明确x1,x2,...xn)、确定参数的统计方法并且解释统计结果的语言学意义,这是文体定量分析的关键所

在。文体的定量分析既要研究总体或者抽样(U)的各个参数(X)的情况,同时还要分析、比较集合U的各个子集、个体与总体的相互关系以及各个子集、个体之间的相互关系。多维随机变量X的各个分量之间不一定相互独立,也需要认真考察。文体的定量分析是一种科学主义的研究方法。

律英语、科技英语、新闻英语、广告英语和文学英语等不

同的变体,也叫功能变体(侯维瑞1988)。秦秀白也按照・32・

英国文体学家MichaelShort曾把文体分析概括为互为关联的三个步骤,其关系如下(转引自Wright&Hope2000:F13):

Description→Interpretation→Evaluation(mainlylinguistic)

属的问题进行过研究(Crystal2002:66-79)。Cluett以Milic的研究为基础,利用计算机进行了TheNewYorkComputerInventoryofProseStyle的大型研究工作,其

研究目标是:1)发现关于作者个人的句法习惯数据;2)收集相应文本的这些数据;3)将收集到的数据和处理数据的程序提供给科研人员;4)提出散文文体的特性和历史的理论和假设(Mah1991:21)。

我国的语言学家也已注意到定量分析这个文体学研究方法。胡壮麟在《理论文体学》中曾提到了计算文体学,介绍了定量分析在作家鉴别与调查规范方面的应用(2000:137-140),程雨民在《英语语体学》里具体讨论(2004:68-100)。

公文文体、新闻报道文体、法律文体和广告文体等。长期以来,语言学家们通过比较、分类分析的方法对各种英语文体都进行过深入的研究,详细地说明了各类文体的语言特点。但是,由于他们采用的主要是定性分析方法,所以在对文体特征进行描写时大多使用“多”、“少”、“常常”等模糊词语,缺乏准确的数据,无法满足一些新兴的文体学应用领域的需要。如果能够在定性研究的基础上,利用计算机对各类文体进行统计分析,就可以得到大量的文本以及众多参数的客观数据。另外,在进行文体的定量分析时,可以选择能够反映词素(构词)词汇、词法、句法和语义等语言系统各层面特征的形式化统计参数。不同文体的参数值不尽相同,对比各类文体的参数值就能在定量分析的基础上揭示文体之间的差异。

文体学家Crystal和Davy曾深入研究过语言系统的形式和意义,把文体特征按照语言层级划分为五大范畴。这五大范畴是:句子间关系(inter2sentencerelationship),句子类型(sentencetypes),从句类型(clausetypes),词语(groups)和词(words)。句子间关系

三个步骤的观点既适合文体的定性分析,也适合文体的定量分析。对文体进行定量分析时,首先要建立文体的总体或者抽取标本,选择并优化统计参数,然后再设法将各参数的频率数据统计出来,随后对统计结果进行解释,说明各参数及统计结果的语言学意义,最后是对文体进行评估、赏析。

定量分析的应用范围很广,可以是文学作品,也可以是各种实用文体。定量分析首先是在文学领域得到一定的应用。国外早已有人利用统计法对某些作家或者作品的风格进行统计分析了,还出现了stylostatistics(计学)、stylometics(计量修辞学)纳的句子平均长度达到度只达到30Milic还利用计算机对斯威夫特()短语、句子、词性以及句子结尾的词的频率进行了分析,他声称:“anobjectivedescriptionofSwift’sstylewaspossibleifitwasbasedonquantitativemeasuresofspecificlinguisticunits(转andcomparedwiththoseofasetofrelatedwriters.”

引自Mah1991:21)。

统计分析在考察某一作家的写作风格或语言特点方面比较有用,有时还可以提供有可能被忽略的重要信息。例如,有人在统计过法语小说《包法利夫人》的某些语法特征后指出,读者阅读小说时可能会产生一种厌烦、无聊感,这种感觉是由于作者有意地大量使用未完成体动词,而不是由于作者使用了使人无聊的词汇。完成体表示动作的完结,如Itrainedjustbeforewehadlunch.未完成体则表示动作的进行状态,如Itwasrainingaswereadournewspapers.因此,当大量使用未完成体时,读者就

会觉得所有的动作延续时间都加长了,最终使人产生厌烦、无聊之感(Mah1991:20)。

随着计算机语言学的不断发展,借助计算机所进行的文体分析的方法得到了越来越广泛的应用。Milic也是计算文体学(ComputationalStylistics)的先驱,他最早运用计算机对文本的文体进行统计分析。他对文本里某些词汇和句法结构进行过统计分析,发现它们的频率分布是常量。国外早就有专家利用统计法对文本著作权归

范畴包括语义、语用、节律特征以及三者间的关系;句子类型范畴描写句子的形式(完整的句子、不完整的句子如句子片段)、句子的复杂性(如简单句、复合句、复杂句等);从句类型范畴描写句子中各从句之间的作用和关系;短语范畴描写组成从句的各要素之间的作用和关系(名词词组、前置修饰语等等);词汇范畴描写句子中词的形式和语音特征(Crystal&Davy1969)。在Crystal和Davy的方法基础上,DiMarco试图建立文体语法

・33・

(stylisticgrammar),该语法可以方便计算机分析和表示

句子的句法文体特征(Mah1991:19),这在一定程度上为为我们利用统计法对英语实用文体进行定量研究奠定了基础。

我们关注的是运用统计方法对各种英语文体进行定量分析的问题。文体是集体或者个人在谈话或者写作中运用语言的方式,是人们在写或者说时所作的众多语言选择的结果。在特定语言内因素和语言外条件下,人们有选择地使用语言手段。一种语言手段的使用既有必然性又有偶然性。数学上偶然现象(或随机现象)是通过概率、熵等概念来进行描述的。必然现象可以看成是概率为百分之百的随机现象,绝对不可能的现象则可以看成是概率为零的随机现象。因此,我们也可以像统计人口那样,对人们使用的语言的结果(即文本)进行统计,用定量的分析方法研究文体。定量分析的目的是更客观、地揭示文体的语言特征,,,41说文体风格的“常规”时,他们引用了Milic利用统计学方

法统计出来的一些相关的频率的数据(秦秀白1986)。随着计算机技术的发展和新的社会需求,基于统计的定量分析的方法有了更多的应用领域,下面简单介绍一下文体定量分析在信息检索、修辞校对方面的应用。

1)文体与信息检索

互联网上存在着大量的信息。信息的载体可以是文字、声音、图像,其中文字是最重要的信息载体。搜索引擎是人们获取这些信息的主要途径。在搜索引擎的文字输入框里输入关键字,然后搜索引擎给出相关的链接。经验告诉我们,相去甚远。,而按照文JussiKarlgren是较早开判别分析建立了文体分类模型,试验和测试的语料取自布朗语料库,文体类型也与布朗语料库一致,她在分类过程中使用的语言特征有:副词、字符、长词语(大于6个字符)、介词、第二人称代词、therefore、第一人称代词、me、现在分词、I、it、名词、现在时动词、that和which的出现频率、每个词的平均字符数、句子个数、句子的平均词数,等等(Karlgren&Douglass1994)。一旦有了文体的自动分类器,在使用搜索引擎时,用户就可以指定查找文本的文体(比如“科技”文本),这样就可以大大提高信息检索的效率。文本的主题和文体自动分类技术也可以应用于机器翻译系统。

2)文体与修辞校对

由于计算机和像Word这类编辑器的流行,给编辑器增加修辞校对功能便十分重要。除了拼写和语法校对,Word还提供了修辞校对的功能,其中对英语的修辞校对功能最为完善。单击Word的“工具”→“语言”→“设置语言...”,然后选择英语,接着单击“工具”→“选项...”,在“拼写和语法”页面的右下角有一个标题为“写作风格”的下拉框,单击可以看到Word提供了五种英文文体:Causal(非正式)、Standard(标准)、Formal(正式)、Technical(技术)、Custom(自定义)。单击“写作风格”下

,它们是定性的研究方法,它们能够细致入微地描述文本、作家、作品、甚至于整个语言变体的语言特征。与文体的定性分析相比,文体的定量分析有很多不足,但文体定量分析也有不可否认的优点和应用价值:首先,用统计数字说明文体特征,远比用“多”和“少”“、常用”和“不常用”这些模糊概念精确;其次,统计数据比较客观、公正;第三,定量分析方法容易写成程序,即容易在计算机上实现;第四,计算机处理文本的速度很快,可以短时间内处理大量文本。定性分析和定量分析不存在孰优孰劣的问题,关键是根据研究对象的特点、研究目标和应用需要选择最合适的方法。面向人的文体研究一般以比较法和分类法为主,定量分析占辅助性地位;但是在面向机器的文体研究中,由于计算机处理语言必须依赖于一些形式化的特征

(比如特定的词、词缀),所以计算机不可能像人一样分析文体,但计算机可以在大量文本里对指定的语言特征进行查找、计数、汇总,统计是计算机的强项,所以定量分析应该占有主要地位。目前,大多数自然语言处理程序是建立在统计法基础上的。假如我们有一个一百万字的英语语料库,为了说明人称的分布,可以让计算机统计I/me、you、he/him/she/her/it的出现频率,这对计算机来

面的“设置...”按钮,可以在弹出的对话框里看到Word提供的拼写、语法和修辞校对选项。另外,在Linux操作

系统下有一个免费程序Diction(http://ftp.gnu.org/fnu/diction-1.02.tar.gz),专门对英语文本进行修辞校

说是很容易完成的。Leech&Short在其合著的StyleinFiction中对小说的文体风格作了精辟的论述。在讨论小

对。Diction使用了7个文本可读性(readabilitygrades)

・34・

公式(许汉成2004):

Kincaid=11.83syllables/wds+0.393wds/

sentences-15.59

ARI=4.713chars/wds+0.53wds/sentences-21.

43

Coleman2Liau=5.893chars/wds-0.33sentences/(100

家胡壮麟指出“:随着语言学和现代科学(如统计学,计算技术)的发展,我们的研究手段改进了。从事文体学理论的工作者,应该关注和学习这方面的进展。人文科学和自然科学虽有各自的目标和分工,并不排斥两者的互补。……计算文体学的发展标志着文体学与自然科学的结合。尽管计算文体学的进展还不如人意,这正是我们大展宏图、奋力攻关的良机。人的认知是无止境的,摆在文

(胡壮麟2000:体学家面前的新的课题在向我们招手。”141)。语言学发展的根本动力是社会需求。作为语言学

3wds)-15.8

FleschIndex=206.835-84.63syll/wds-1.0153

wds/sent

FogIndex=0.43(wds/sent+1003((wds>=3

syll)/wds))

Lix=wds/sent+1003(wds>=6char)/wdsSMOG2Grading=squarerootof(((wds>=3

syll)/sent)330)+3

的一个学科,文体学也要适应社会经济和科学技术的发展,,这就是文体学所面临的新课题。

:

[1ofLangnage

[Press,2002.

2&D.Davy.InvestigatingEnglish

tyle[M].London:Longman,1969.

[3]Karlgren,Jussi&DouglassCutting.Recognizing

TextGenreswithSimpleMetricsUsingDiscriminantAnalysis[A].Proceedingsofthe15th

International

Conference

on

Computational

Linguistics(COLING-94)[C].Kyoto,1994.

这些公式都是以句子的音节数、字符数、数,,中,,,但是文本的各种特征之间可能是相关的,所以这些指数还是有一定说明力的。

应该说修辞校对涉及文体的定性和定量两个方面。用户需要程序指出哪些是不符合选定的文体特点的词语、语法结构,从而帮助用户修改文本,这是定性分析,校对系统需要相应的电子词典;但是文体规范还涉及语言使用的量的方面:词语长度、句子长度等。制定难度指数是典型的定量分析的方法。

51结论

语言是人类最重要的交际工具。言语交际是在不同场合和条件下进行的,遵守文体规范是成功交际的必要前提。现代文体学扩展了它的研究范围,它既研究文学文体,也研究各种实用文体,语言的各种社会、地理、功能变体都具有同等的应用价值,都是现代文体学的研究对象。文体学研究的主要方法是比较法、分类法。国内外的英语文体学家以比较法和分类法为主,对英语各类文体进行了细致的描写和分析,推动着英语文体学的教学和科研,使之不断向前发展。与此同时,我们也应该看到统计法、定量分析在文体学研究中的价值,特别是定量分析在文体自动分类、修辞校对等新兴文体学应用领域的作用。在传统的定性方法基础上,用定量分析方法研究文体能使研究成果更精确、客观、公正。我国著名语言学

[4]Keith.Mah,ComparativeStylisticsinanIntegrated

MachineTranslationSystem[D/OL].UniversityofWaterloo,Ontario,1991.

[5]Milic,Louis.T.Progressinstylistics:theory,

statistics,computers[J].ComputersandtheHumanities25,1991.

[6]Wright,Laura&JonathanHope.Stylistics:A

PracticalCoursebook(实用文体学教程)[M].北京:外语教学与研究出版社,20001

[7]程雨民.英语语体学(修订版)[M].上海:上海外语

教育出版社,20041

[8]郭鸿.英语文体分析[M].北京:军事谊文出版社,19981[9]哈特曼,R.R.K.&F.C.斯托克1语言与语言学词

典[Z].上海:上海辞书出版社,19811

[10]侯维瑞.VarietiesofEnglish(英语语体)[M].上海:

上海外语教育出版社,19881

[11]胡壮麟.理论文体学[M].北京:外语教学与研究出

版社,20001

[12]裴文.现代英语语体学[M].合肥:安徽大学出版社,

19981

[13]秦秀白.文体学概论[M].长沙:湖南教育出版社,19861[14]许汉成.俄语功能语体定量分析中的几个核心问题

[J].外语学刊,2004,(6)1收稿日期:2004-12-10

),陕西汉中人,讲师。研究作者简介:何淑琴(1965—

方向:英语语言学。

(责任编辑:张 辉)

・35・

2005年第1期总第89期外语研究

ForeignLanguagesResearch2005,№1Serial№89

谈英语文体的定量分析

何淑琴

(南京农业大学外国语学院,江苏南京210095)

摘 要:语言学发展的根本动力是社会需求。文体学常见的研究方法是比较法、分类法。文体学家偶尔也使用统计法,但是统计法在文体学研究中的价值并没有得到充分挖掘。随着自然语言处理系统的发展,统计法在文体学研究中的价值越来越重要。本文简单回顾了文体和文体学的概念,对比了文体的定性和定量分析方法的优缺点,阐述了定量分析在文体学的一些新领域的重要应用。关键词:文体;文体学;比较法;分类法;统计法;定量分析

中图分类号:H087  文献标识码:A  文章编号:1005-7242(2005)01-0031-  11文体的基本概念

在语言学里,style是指集体或者个人在谈话或者写作中运用语言的方式(哈特曼&斯托克:-336),stylistics便是研究style在私

这种随意的称呼,它适合私,表明交际者之间亲密的私人关系;如果,就用DearMs.Blair,显得正式、严肃。再看两个英语词组:theblackcat和thecat,whichisblack。这两个词组的逻辑意义基本相同,都含有“thecatisblack”这层意思,但是两者结构不同,文体不一样,后者因为使用了定语从句显得比较正式。当然,这两个短语在意义上还是有细微的差别的。

文体方面的考虑涉及语言的各个方面和层次。人们在谈话或写作中,在表达相同或相近的意思时,凭借直觉和习惯采用自己认为最恰当的语言形式,即进行文体选择。词、短语、句法结构和文本格式在准确表达交际者的意思以及在取得预期交际效果方面的区别,有时明显,有时不明显,有时则非常细微,但是人们的确在根据具体的语境选择词语、语法结构、甚至文本格式,个人和集体的选择最终形成了个人、集体在特定时期或场合的文体。

文体学就是要研究个体或集体在不同的语境下使用语言的规律,制订文体规范或者描写各类文体特征,从而指导人们“到什么山唱什么歌”,不讲外行话,这里外行话不仅包括话语的内容,还应包括语言的风格,即文体,使言语的形式、内容、风格与交际目的和交际条件保持一致。

对研究对象的考察可以分为定性分析和定量分析。比较法和分类法是文体学最常用的研究方法,它们都是定性分析法。定性分析比较适合面向人的文体研究,如制订文体规范、描写各类文体的特征都可以以定性分析

从研究目标来看,写文体学。范要区分“正确”和“错误”的用法,在中小学英语教课书里有不少英语语法规则,如名词复数构成和动词过去时的变化规则等。只有遵守语法规则,使用正确的语法形式,人们才有可能生成正确的句子。但是,语言是一个符

号系统,了解并掌握符号与对象(符号的语义方面)、符号与符号(符号的句法方面)、符号与使用者(符号的语用方面)的关系是正确使用语言的前提。语法上正确的句子不一定是特定交际场合里最得体的语句。侯维瑞举过一个例子:两个小孩打架,其中一个发出警告,试图阻止对方。

Ifyoudon’tleavemealone,Holmes,Ishallnotbeanswerablefortheconsequences.

这句话完全符合语言规范,但是就小孩打架这一情景来说,所用的词汇和句法结构显得过于正式,很可能会引起哄堂大笑,难以达到说话人的交际目的。文体规范就是要解决语言运用里的优化问题,说明在若干个准确的用法之中哪一种用法最适合特定言语交际目的。因此,从言语交际的角度来看,语句必须既正确,又得体,才能取得最佳的交际效果,语法规则和文体规则同样重要。例如,写一封英文信,开头应该怎样称呼?是称呼Dear

①本文得到南京农业大学人文社科基金支持,课题号SK03016。

・31・

为主,以定量分析为辅。但是,语言学是一个活的学科,必须应对社会经济发展对文体学提出的新要求。例如,随着信息技术的发展,人们迫切需要在修辞校对、信息检索等语言工程中考虑文体因素。这样必须开展面向机器的文体研究,在面向机器的文体研究中,定量分析的意义上升了,在某些时候,统计这种定量分析方法甚至成为最主要的方法。下面我们就简单地回顾一下文体学研究的定量和定性分析方法,探讨定量分析在上述新兴文体学研究领域的应用价值。

2.文体学定性分析方法

实用性把英语语言分为科技文体,公文文体,新闻报道文

体和广告文体(秦秀白1986:177-208)。

比较法是传统的、基本的文体学研究方法。分类法是在比较法的基础上发展起来的。在文体学研究中,两种方法通常是并用的。语言学家们通过对各种文体的基本词汇、基本句式和表达方法的对比,找出各类文体都需

(thecommoncore),构成语言使用中的使用的“共同语”常规,不同文体所表现的不同的语言特点则形成在常规

基础上的变异(deviation)。比较和分类的方法是描写各类文体语言特征和建立文体规范的重要手段,都属于定31文体的定量分析

文体学是运用现代语言学理论和方法研究文体的一门学科,是一门既古老又年轻的学科。文体学的研究始于本世纪初,瑞士语言学家巴利继承和发展了索绪尔的理论,撰写了《文体学概要》和《法语文体学》,从而创建了现代文体学(郭鸿1998:1)风格(literarystyle)广告、新闻报道、文体学研究的基本的方法是比较法(秦秀白1986:4)。许多语言学家都采用比较法研究文体。在六十年代

,也可以,研究者通常按照统,用样本集合代表该类

然后选择一些参数(即语言特征),统计这些语言特征出现的相对频率和绝对频率。参数及其频率可以代表这类文本的文体特性。从方法论角度上看,这种文体分析方法与计算化石的某些化学成分的含量,并据此做出一些描述或者推断性结论(如分类)没有什么区别,是自然科学里普遍采用的多元分析方法。收集的文本集合代表一种文体,统计选定参数的频数和频率,计算各参数的均值和极值,绘制参数的分布图,这些是描写性的文体分析工作,如果把抽样的参数和参数值当作一定文体的标准,在这一背景下,考察其它文体符合或者偏离标准的程度,并据此提出修改的意见,就多少带有规定文体学的色彩了。所以,在文体学的定量研究中,规定文体学与描写文体学是相互依赖、相互渗透的,没有截然分明的界线。

从文体的定量分析的角度看,文体也可以界定为一类文本的总体或者代表性样本的集合(用U表示),文体的定量分析就是要研究U及其子集或者个体在参数X上的值。X在数学上通常表现为多维随机向量(X=x1,x2,...xn,n为自然数,表示X的维度)。选择适当的参

初,美国的社会语言学家拉波夫(Labov)采用比较法对纽约市不同社会阶层的发音特点进行了比较分析。对作家风格的研究也主要采用比较法。人们常说,英国作家王尔德风格俏皮,狄更斯惯用渲染与夸张,斯威夫特擅长辛辣的讽刺。海明威文笔简洁等等。这些观点都是通过大量的比较形成的。

文体学研究的另一种方法是分类法(裴文1998:12)。分类法是在广泛对比的基础上,以统计学、逻辑学、

社会学等理论为指导,根据社会交际目的、环境、方法等的不同,对文体进行分类。侯维瑞对文体分类法进行了研究,他根据交际情景的变化,把英语语言分为口语、书面语、正式语、非正式语、礼貌语等几种变体,也叫语域(register);根据地理区域不同,把英语语言分为英国英语、美国英语、新西兰英语、澳大利亚英语、加拿大和南非英语等变体,也叫地域方言(regionaldialect);根据各种社会因素(如民族、性别、年龄、行业)不同,分为黑人英语、女性英语、行业语、集团语等,也叫社会变体(socialdialect);根据语言的社会功能(题材)和使用领域,分为法

数(即明确x1,x2,...xn)、确定参数的统计方法并且解释统计结果的语言学意义,这是文体定量分析的关键所

在。文体的定量分析既要研究总体或者抽样(U)的各个参数(X)的情况,同时还要分析、比较集合U的各个子集、个体与总体的相互关系以及各个子集、个体之间的相互关系。多维随机变量X的各个分量之间不一定相互独立,也需要认真考察。文体的定量分析是一种科学主义的研究方法。

律英语、科技英语、新闻英语、广告英语和文学英语等不

同的变体,也叫功能变体(侯维瑞1988)。秦秀白也按照・32・

英国文体学家MichaelShort曾把文体分析概括为互为关联的三个步骤,其关系如下(转引自Wright&Hope2000:F13):

Description→Interpretation→Evaluation(mainlylinguistic)

属的问题进行过研究(Crystal2002:66-79)。Cluett以Milic的研究为基础,利用计算机进行了TheNewYorkComputerInventoryofProseStyle的大型研究工作,其

研究目标是:1)发现关于作者个人的句法习惯数据;2)收集相应文本的这些数据;3)将收集到的数据和处理数据的程序提供给科研人员;4)提出散文文体的特性和历史的理论和假设(Mah1991:21)。

我国的语言学家也已注意到定量分析这个文体学研究方法。胡壮麟在《理论文体学》中曾提到了计算文体学,介绍了定量分析在作家鉴别与调查规范方面的应用(2000:137-140),程雨民在《英语语体学》里具体讨论(2004:68-100)。

公文文体、新闻报道文体、法律文体和广告文体等。长期以来,语言学家们通过比较、分类分析的方法对各种英语文体都进行过深入的研究,详细地说明了各类文体的语言特点。但是,由于他们采用的主要是定性分析方法,所以在对文体特征进行描写时大多使用“多”、“少”、“常常”等模糊词语,缺乏准确的数据,无法满足一些新兴的文体学应用领域的需要。如果能够在定性研究的基础上,利用计算机对各类文体进行统计分析,就可以得到大量的文本以及众多参数的客观数据。另外,在进行文体的定量分析时,可以选择能够反映词素(构词)词汇、词法、句法和语义等语言系统各层面特征的形式化统计参数。不同文体的参数值不尽相同,对比各类文体的参数值就能在定量分析的基础上揭示文体之间的差异。

文体学家Crystal和Davy曾深入研究过语言系统的形式和意义,把文体特征按照语言层级划分为五大范畴。这五大范畴是:句子间关系(inter2sentencerelationship),句子类型(sentencetypes),从句类型(clausetypes),词语(groups)和词(words)。句子间关系

三个步骤的观点既适合文体的定性分析,也适合文体的定量分析。对文体进行定量分析时,首先要建立文体的总体或者抽取标本,选择并优化统计参数,然后再设法将各参数的频率数据统计出来,随后对统计结果进行解释,说明各参数及统计结果的语言学意义,最后是对文体进行评估、赏析。

定量分析的应用范围很广,可以是文学作品,也可以是各种实用文体。定量分析首先是在文学领域得到一定的应用。国外早已有人利用统计法对某些作家或者作品的风格进行统计分析了,还出现了stylostatistics(计学)、stylometics(计量修辞学)纳的句子平均长度达到度只达到30Milic还利用计算机对斯威夫特()短语、句子、词性以及句子结尾的词的频率进行了分析,他声称:“anobjectivedescriptionofSwift’sstylewaspossibleifitwasbasedonquantitativemeasuresofspecificlinguisticunits(转andcomparedwiththoseofasetofrelatedwriters.”

引自Mah1991:21)。

统计分析在考察某一作家的写作风格或语言特点方面比较有用,有时还可以提供有可能被忽略的重要信息。例如,有人在统计过法语小说《包法利夫人》的某些语法特征后指出,读者阅读小说时可能会产生一种厌烦、无聊感,这种感觉是由于作者有意地大量使用未完成体动词,而不是由于作者使用了使人无聊的词汇。完成体表示动作的完结,如Itrainedjustbeforewehadlunch.未完成体则表示动作的进行状态,如Itwasrainingaswereadournewspapers.因此,当大量使用未完成体时,读者就

会觉得所有的动作延续时间都加长了,最终使人产生厌烦、无聊之感(Mah1991:20)。

随着计算机语言学的不断发展,借助计算机所进行的文体分析的方法得到了越来越广泛的应用。Milic也是计算文体学(ComputationalStylistics)的先驱,他最早运用计算机对文本的文体进行统计分析。他对文本里某些词汇和句法结构进行过统计分析,发现它们的频率分布是常量。国外早就有专家利用统计法对文本著作权归

范畴包括语义、语用、节律特征以及三者间的关系;句子类型范畴描写句子的形式(完整的句子、不完整的句子如句子片段)、句子的复杂性(如简单句、复合句、复杂句等);从句类型范畴描写句子中各从句之间的作用和关系;短语范畴描写组成从句的各要素之间的作用和关系(名词词组、前置修饰语等等);词汇范畴描写句子中词的形式和语音特征(Crystal&Davy1969)。在Crystal和Davy的方法基础上,DiMarco试图建立文体语法

・33・

(stylisticgrammar),该语法可以方便计算机分析和表示

句子的句法文体特征(Mah1991:19),这在一定程度上为为我们利用统计法对英语实用文体进行定量研究奠定了基础。

我们关注的是运用统计方法对各种英语文体进行定量分析的问题。文体是集体或者个人在谈话或者写作中运用语言的方式,是人们在写或者说时所作的众多语言选择的结果。在特定语言内因素和语言外条件下,人们有选择地使用语言手段。一种语言手段的使用既有必然性又有偶然性。数学上偶然现象(或随机现象)是通过概率、熵等概念来进行描述的。必然现象可以看成是概率为百分之百的随机现象,绝对不可能的现象则可以看成是概率为零的随机现象。因此,我们也可以像统计人口那样,对人们使用的语言的结果(即文本)进行统计,用定量的分析方法研究文体。定量分析的目的是更客观、地揭示文体的语言特征,,,41说文体风格的“常规”时,他们引用了Milic利用统计学方

法统计出来的一些相关的频率的数据(秦秀白1986)。随着计算机技术的发展和新的社会需求,基于统计的定量分析的方法有了更多的应用领域,下面简单介绍一下文体定量分析在信息检索、修辞校对方面的应用。

1)文体与信息检索

互联网上存在着大量的信息。信息的载体可以是文字、声音、图像,其中文字是最重要的信息载体。搜索引擎是人们获取这些信息的主要途径。在搜索引擎的文字输入框里输入关键字,然后搜索引擎给出相关的链接。经验告诉我们,相去甚远。,而按照文JussiKarlgren是较早开判别分析建立了文体分类模型,试验和测试的语料取自布朗语料库,文体类型也与布朗语料库一致,她在分类过程中使用的语言特征有:副词、字符、长词语(大于6个字符)、介词、第二人称代词、therefore、第一人称代词、me、现在分词、I、it、名词、现在时动词、that和which的出现频率、每个词的平均字符数、句子个数、句子的平均词数,等等(Karlgren&Douglass1994)。一旦有了文体的自动分类器,在使用搜索引擎时,用户就可以指定查找文本的文体(比如“科技”文本),这样就可以大大提高信息检索的效率。文本的主题和文体自动分类技术也可以应用于机器翻译系统。

2)文体与修辞校对

由于计算机和像Word这类编辑器的流行,给编辑器增加修辞校对功能便十分重要。除了拼写和语法校对,Word还提供了修辞校对的功能,其中对英语的修辞校对功能最为完善。单击Word的“工具”→“语言”→“设置语言...”,然后选择英语,接着单击“工具”→“选项...”,在“拼写和语法”页面的右下角有一个标题为“写作风格”的下拉框,单击可以看到Word提供了五种英文文体:Causal(非正式)、Standard(标准)、Formal(正式)、Technical(技术)、Custom(自定义)。单击“写作风格”下

,它们是定性的研究方法,它们能够细致入微地描述文本、作家、作品、甚至于整个语言变体的语言特征。与文体的定性分析相比,文体的定量分析有很多不足,但文体定量分析也有不可否认的优点和应用价值:首先,用统计数字说明文体特征,远比用“多”和“少”“、常用”和“不常用”这些模糊概念精确;其次,统计数据比较客观、公正;第三,定量分析方法容易写成程序,即容易在计算机上实现;第四,计算机处理文本的速度很快,可以短时间内处理大量文本。定性分析和定量分析不存在孰优孰劣的问题,关键是根据研究对象的特点、研究目标和应用需要选择最合适的方法。面向人的文体研究一般以比较法和分类法为主,定量分析占辅助性地位;但是在面向机器的文体研究中,由于计算机处理语言必须依赖于一些形式化的特征

(比如特定的词、词缀),所以计算机不可能像人一样分析文体,但计算机可以在大量文本里对指定的语言特征进行查找、计数、汇总,统计是计算机的强项,所以定量分析应该占有主要地位。目前,大多数自然语言处理程序是建立在统计法基础上的。假如我们有一个一百万字的英语语料库,为了说明人称的分布,可以让计算机统计I/me、you、he/him/she/her/it的出现频率,这对计算机来

面的“设置...”按钮,可以在弹出的对话框里看到Word提供的拼写、语法和修辞校对选项。另外,在Linux操作

系统下有一个免费程序Diction(http://ftp.gnu.org/fnu/diction-1.02.tar.gz),专门对英语文本进行修辞校

说是很容易完成的。Leech&Short在其合著的StyleinFiction中对小说的文体风格作了精辟的论述。在讨论小

对。Diction使用了7个文本可读性(readabilitygrades)

・34・

公式(许汉成2004):

Kincaid=11.83syllables/wds+0.393wds/

sentences-15.59

ARI=4.713chars/wds+0.53wds/sentences-21.

43

Coleman2Liau=5.893chars/wds-0.33sentences/(100

家胡壮麟指出“:随着语言学和现代科学(如统计学,计算技术)的发展,我们的研究手段改进了。从事文体学理论的工作者,应该关注和学习这方面的进展。人文科学和自然科学虽有各自的目标和分工,并不排斥两者的互补。……计算文体学的发展标志着文体学与自然科学的结合。尽管计算文体学的进展还不如人意,这正是我们大展宏图、奋力攻关的良机。人的认知是无止境的,摆在文

(胡壮麟2000:体学家面前的新的课题在向我们招手。”141)。语言学发展的根本动力是社会需求。作为语言学

3wds)-15.8

FleschIndex=206.835-84.63syll/wds-1.0153

wds/sent

FogIndex=0.43(wds/sent+1003((wds>=3

syll)/wds))

Lix=wds/sent+1003(wds>=6char)/wdsSMOG2Grading=squarerootof(((wds>=3

syll)/sent)330)+3

的一个学科,文体学也要适应社会经济和科学技术的发展,,这就是文体学所面临的新课题。

:

[1ofLangnage

[Press,2002.

2&D.Davy.InvestigatingEnglish

tyle[M].London:Longman,1969.

[3]Karlgren,Jussi&DouglassCutting.Recognizing

TextGenreswithSimpleMetricsUsingDiscriminantAnalysis[A].Proceedingsofthe15th

International

Conference

on

Computational

Linguistics(COLING-94)[C].Kyoto,1994.

这些公式都是以句子的音节数、字符数、数,,中,,,但是文本的各种特征之间可能是相关的,所以这些指数还是有一定说明力的。

应该说修辞校对涉及文体的定性和定量两个方面。用户需要程序指出哪些是不符合选定的文体特点的词语、语法结构,从而帮助用户修改文本,这是定性分析,校对系统需要相应的电子词典;但是文体规范还涉及语言使用的量的方面:词语长度、句子长度等。制定难度指数是典型的定量分析的方法。

51结论

语言是人类最重要的交际工具。言语交际是在不同场合和条件下进行的,遵守文体规范是成功交际的必要前提。现代文体学扩展了它的研究范围,它既研究文学文体,也研究各种实用文体,语言的各种社会、地理、功能变体都具有同等的应用价值,都是现代文体学的研究对象。文体学研究的主要方法是比较法、分类法。国内外的英语文体学家以比较法和分类法为主,对英语各类文体进行了细致的描写和分析,推动着英语文体学的教学和科研,使之不断向前发展。与此同时,我们也应该看到统计法、定量分析在文体学研究中的价值,特别是定量分析在文体自动分类、修辞校对等新兴文体学应用领域的作用。在传统的定性方法基础上,用定量分析方法研究文体能使研究成果更精确、客观、公正。我国著名语言学

[4]Keith.Mah,ComparativeStylisticsinanIntegrated

MachineTranslationSystem[D/OL].UniversityofWaterloo,Ontario,1991.

[5]Milic,Louis.T.Progressinstylistics:theory,

statistics,computers[J].ComputersandtheHumanities25,1991.

[6]Wright,Laura&JonathanHope.Stylistics:A

PracticalCoursebook(实用文体学教程)[M].北京:外语教学与研究出版社,20001

[7]程雨民.英语语体学(修订版)[M].上海:上海外语

教育出版社,20041

[8]郭鸿.英语文体分析[M].北京:军事谊文出版社,19981[9]哈特曼,R.R.K.&F.C.斯托克1语言与语言学词

典[Z].上海:上海辞书出版社,19811

[10]侯维瑞.VarietiesofEnglish(英语语体)[M].上海:

上海外语教育出版社,19881

[11]胡壮麟.理论文体学[M].北京:外语教学与研究出

版社,20001

[12]裴文.现代英语语体学[M].合肥:安徽大学出版社,

19981

[13]秦秀白.文体学概论[M].长沙:湖南教育出版社,19861[14]许汉成.俄语功能语体定量分析中的几个核心问题

[J].外语学刊,2004,(6)1收稿日期:2004-12-10

),陕西汉中人,讲师。研究作者简介:何淑琴(1965—

方向:英语语言学。

(责任编辑:张 辉)

・35・


相关内容

  • 商务英语文体风格特征分析
  • 摘要:商务英语有自己独特的文体风格,这种风格首先表现在商务英语的用词风格,即用词专业.术语较多.用词准确.措辞礼貌;其次表现为商务英语的句法风格,即用语固定化.表达精练化等;最后表现为准确.简洁.清楚.完整等文体风格. 关键词:商务英语;文体;风格 商务英语是人们在商务活动中所使用的英语,通称为Bu ...

  • 高考英语阅读文体类型及阅读理解答题技巧
  • 高考英语阅读文体类型及阅读理解答题技巧 湖北省荆门市屈家岭管理区五三高中 杨卫红 谌金洲 一.英语阅读文体类型简析 阅读是一种理解.吸收.鉴赏.评价文章的思维过错.完成这个思维过程,则需要经过认知.分析.综合.理解.记忆.感受.判断等程序.文体类别不同,决定着叙述风格的差异.掌握文体风格,识别文章叙 ...

  • 英语毕业论文_致谢_写作的问题分析及对策
  • 2005年11月湖北教育学院学报 Journal of Hubei I nstitute of Educati on Nov . 2005Vol . 22 No . 6 第22卷第6期 英语毕业论文"致谢"写作的问题分析及对策 杨明光 (湖北教育学院外语系, 武汉 430205) ...

  • 近年部分院校硕士论文题目
  • 近年部分院校硕士论文题目 这里收集了近年来部分院校硕士论文的题目,来源于中国期刊网(CNKI).由于保护版权尊重知识产权的要求,没有得到中国期刊网或者论文作者的授权,语言文化翻译网站不能提供全文,只能在法律允许的范围内提供论文的中文题目/英文题目,学位授予单位以及论文提交时间,以便于读者查找.需要浏 ...

  • 商务英语的劝说与修辞分析
  • [摘 要]探讨把商务英语的劝说方法与修辞手段结合起来,以在商务英语中运用新修辞方法达到劝说的目的,并对具有代表性的商务英语进行实用性的劝说与修辞分析. [关键词]商务英语 劝说 修辞 同一 [中图分类号]G[文献标识码]A [文章编号]0450-9889(2013)06C- 0129-04 随着全球 ...

  • 企业内部控制英语论文
  • Research on Stylistic Meaning of English Words Written by: Zhao Xiaojuan Supervised by: Fu Weixian English Department School of Foreign Studies Anhui ...

  • 对高中英语书面表达的训练方法的分析
  • 语数外学习 No.03.2013 YuShuWaiXueXi 2013年第3期 对高中英语书面表达的训练方法的分析 傅银英 (河源市紫金县第二中学,广东 河源517400) 摘要:高中英语是国家高中教学体系的重要组成部分,高中英语教学水平与质量的高低直接影响着高中学生英语学习能力的提升.书面表达作为 ...

  • 英语科技论文的语篇结构和内容分析
  • 企肥学统学报(社会科学版)JournalofHefeiUniversity(SocialSciences) 英语科技论文的语篇结构和内容分析 支兰1,王日珠2 (1.安庆师范学院外语学院,安徽安庆246011:2.安徽大学大学英语教学部,合肥230039) 摘要:写好英语科技论文就必须了解科技论文规 ...

  • 全国高职高专英语写作大赛对促进公共英语教学改革的思考
  • 全国高职高专英语写作大赛对促进公共英语教学改革的思考 关键词:写作大赛高职英语 教学改革 论文摘要:英语写作作为高职教学中的重点和难点,需要师生共同努力进行攻关.值得注意的是,高职生必须养成自觉运用英语写作的习惯,这样才能提高自己的英语运用能力,为以后的学习和工作打下坚实的语言基础. 随着近年来高职 ...