欢迎来到学术参考网
当前位置:教育论文>文教资料

《热爱生命》的语料库检索分析

发布时间:2016-04-15 17:39

  自20世纪80年代以来,语料库语言学获得了蓬勃的发 展。它为语言学研究提供了一套全新的研究思路和方法,被 广泛应用于语言研究的各个层面。伴随着计算机技术和网 络的普及、发展,学者们开始利用各类语料库索引软件作词 汇搭配、翻译以及中介语的描述和分析。Wordsmith Tools作 为一种常用的语料库检索工具,其软件内部主要包含语境 共现检索工具(Concord)、词频列表检索工具(WordList)、关 键词检索工具(Key Word)、分割工具(Splitter)、替换工具 (Text Converter)、浏览工具(Viewer)六种工具。本文主要利 用前三种常用的文本检索工具对文本进行分析。


  1.总体特征的统计分析


  首先,我们对文本进行要进行定量研究,即进行文本的 检索和数据的统计。我们把《热爱生命》的英文文本用 Wordsmith Tools软件的词频列表检索工具进行统计,可以得 到一些相关的统计数字,如字节数(bytes)、形符数(tokens, 指文本一共有多少个词)、类符数(types,指文本一共有多少 个不同的词形)、类符形符比(type/token ratio,指形符与类符 的比率,即用词的变化性)、标准化类符形符比(Standardised Type^Token)、平均词长、句子数等(如图所示)。


  文本属于难度水平较低、句子稍长、篇幅较短的小说。


  2.表达方式的检索分析


  我们主要利用WordSmithTools语料库检索软件中的词 频列表检索工具对小说文本的言语表达进行统计分析。首 先,通过对文本的统计,我们可以得到一个主题词表(如图 所示,只截取了前30位)。然后,根据观察词表中词的频率排 序规律,我们可以分析该小说在人称使用、叙事方式、主题 表达以及否定词使用这四个方面的特色。


  

blob.png

  2.1人称使用


  根据观察主题词表,我们发现了一个异常的现象-- 人物名称并不在主题词表的前30位。按照小说三要素的一 般规律,人物名称出现的频率应该是比较高的。但我们发现 “he”、“his”、“him”这三个词出现的频率非常高,分别排在第2 位、第4位和第12位。而文本中唯一出现的人名“Bill”排在了 第48位,仅出现了20次。这中现象有两种可能的解释:一是只有“Bill”一个人,且人称的使用过分频繁,二是“he”和“Bill” 是两个人,且主角不是“Bill”而是“he”。第二种解释更符合小 说情节设置的一般规律,而阅读小说内容之后我们可以得 到印证。该小说的主人公并没有名字,通篇都用第三人称 “he”来指代主人公,而“Bill”在小说中只是作为配角出现。因 此,我们发现不赋予主人公名字,而用第三人称来指代成为 小说的特色之一。


  2.2叙事方式


  词表中的最高频的动词为“was”,后面依次是“had”、 “were”、“did”等动词过去式,这表明小说以过去时来叙述故 事情节。另外,通过观察词表,我们可以发现类似“before”、 “after”、“then”这样的词出现也比较频繁。这表明小说充分利 用时间先后变化来描写故事。这样的叙事方式不仅使整部 小说的情节紧紧相扣,还为读者迫切了解后续情节的提供 了动力。


  2.3主题表达


  根据小说的标题,我们可以推测小说的主题与生命相 关。通过观察主题词表我们发现“life”、“die”出现的频率也很 高。通过阅读小说内容,我们发现这两个词紧扣住小说的主 题,小说主要以主人公在荒野中跟死亡的抗争来表现生命 的顽强与可贵。在恶劣环境中,主人公与寒冷、饥饿、伤病和 野兽抗争。面对生与死的抉择,他表现了人对生命的珍爱以 及生命的坚铺品质。


  2.4否定词使用


  在主题词表中,我们观察到“not”出现了77次,“no”出现 了35次,即否定词的出现频率非常高。文章没有直接叙述主 人公在前进,而是以“没有停下”作为表达的方式。这样的否 定让读者能感觉到主人公每走出一步都要有巨大的毅力, 和的前进十分艰难。此外,小说中常常出现对负面情况否定 的表达,比如主人公对自己疲惫状态的否定或对被队友抛 弃的残忍事实的否定。主人公以类似这样的心理暗示给自 己一些生的希望,以支撑自己走出困境。


  3.主要情节的检索分析


  我们利用WordSmith Tools软件的语境共现检索工具, 检索出与所有角色共现的句子,以此来发现于主要角色的 细节描写。这对研究人物性格以及把握主要情节非常关键。 接下来,我们将结合Wordsmith Tools语料库软件的统计结 果,对小说中的主要角色进行详细分析。通过上述主题词表 的统计,我们筛选出的主要角色包括:主人公“he”、配角Bill 和狼。


  首先,对主人公“he”进行分析。我们利用语境共现检索 工具’统计出“he”在整个文本共出现409次,并得到其情节表 格(如图所示)。


  blob.png


  我们发现,在与“he”共现的文本中,开头部分多出现类 似痛苦、疲倦、受伤这样的词汇,这表明小说首先被定下了 生死较量的压抑的基调。结合小说内容,我们发现作者直接 把主人公放置在了一个险恶的环境之中,但文本中没有任 何的说明他为何会在这样的荒野之中。另外,在与“he”的共 现的文本中,我们发现很多句子中多次出现恐惧、糟糕、饥 饿等词汇。这表明主人公的生理状态极差。但结合小说内 容,我们发现尽管主人公的状态很糟糕,他还是一直和困难 抗争,顽强地维系生命。例如类似这样的描述:“He fought with his fear again,overcame it,hitched the pack still farther over on his left shoulder,and lurched on down the bottom of the valley was soggy with water,which the thick moss held,spongelike,close to the surface.”在共现文本的后半 段,主人公几乎失去意识,但他也在不断的进行心理暗示。


  然后,我们对文中人名Bill进行检索分析。通过利用语 境共现检索工具统计,我们发现Bill在整个文本中共出现20 次,并得到其情节表格(如图所示)。


 blob.png


  通过以上的统计数据,我们可以根据字节数、形符数和 句子数可以推断出这是一个较短的文本。该文本的类符形 符比为22.29。虽然单纯的形符数和类符数不能反映语篇的 本质特征,但按一定的长度分批计算文本的类符形符比求 平均值就可以得出标准类符形符比。它在一定程度上反映 了语篇的某种本质特征,即用词的变化性。该文本的标准类 符形符比数41.63,由此可以认为此文本的词汇变化量为较 低程度。整个文章的句子有530,句长为15.52,与平均句长 9.25相比,这表明该文本又比一些简易文本的句子要长。另 外,该文本的平均词长为4.19,其中三个字母的的词最多,有 2228个。通过计算,四个字母以内的词数有5387个,占形符 数65.47%。总而言之,通过上述统计分析,我们可以推断该pm itftmon0.4951 HI | HI


  关于Bill的情节并不多,通过观察和总结,我们可以把 Bill的出场可分为三个阶段。第一阶段是在小说开头,主人公 与Bill在荒野中同行然后被Bill抛弃;第二阶段是主人公通过 想象Bill并没有抛弃自己,猜测他在某个地方等待他;第三阶 段是他看到了Bill的尸体。虽然Bill在小说中出场很少,却也 发挥了配角的作用。他的形象鲜明,与主人公形成强烈对 比。例如文本中这样的表述:“Well,Bill had deserted him;but he would not take the gold,nor would he suck Bill’s would have,though,had it been the other way around,he mused as he staggered on.”[2]尽管Bill没有同现出任何贬义的 词语,我们还是可以发现他的自私、贪婪、懦弱。出11充分地反 衬出主人公意志坚强、不畏艰险、淳朴善良的人物特征。


  最后,我们对狼进行分析。通过利用语境共现检索工 具,我们统计出“wolf’在整个文本中共出现20次,并得到其 情节表格(如图所示)。


  blob.png


  的分析,我们发现该小说属于难度水平较低、句子稍长、篇 幅较短的小说。通过对其表达方式的分析,我们发现该小说 中的主人公没有被设定人物名称,小说主要以时间先后作 为叙事方式,且利用生命和死亡这两个词紧扣小说主题,并 利用否定词从侧面表达人物环境的艰险和主人公不屈不挠 的性格。通过对其主要情节分析,我们发现虽然主人公生理 状态极差但是在面对生死抉择时表现出顽强的毅力,配角 Bill出场较少以虚伪自私的形象却反衬出主人公人格的伟 大,病狼在小说的后半段出现,它与主人公的激烈搏斗把小 说推向了高潮,衬托出人类生命的强大。总之,通过利用语 料库检索软件Wordsmith Tools,我们对英文小说<热爱生命》 进行分析。我们主要以列表、统计等量化的方法对小说的总 体特征、表达方式、主要情节等方面进行统计分析,使对其 艺术特征的诠释更加理性。

上一篇:《穷达以时》研究综述

下一篇:从白先勇小说中的风月女子形象探究其性别叙事