是语言学研究的优秀传统。尤其是在20世纪50年代中期,
在语言研究中占主导地位的是重语言材料的经验主义。这种学术氛围无疑促进了对语料的重视。1959年夸克(RQuirk)等人着手进行的“英语用法调查”SurveyofE
glishUsage通过系统的调查建立了第一个现代英语语料库,在此基础上完成的《现代英语语法》(AGrammarofCo
temporaryE
glish)和《英语语法大全》(AComprehe
siveGrammaroftheE
glishLa
guage)对现代英语进行了系统全面的描写,在英语语言学界产生了广泛的影响。但在当时这项浩大的工程是通过手工的方式完成的。
f20世纪六十年代后,语言学研究主流从经验主义转向理性主义,乔姆斯基的语言能力说被广泛接受,转换生成语法学派批评语料库研究方法,认为,1、基于语料库的方法有误。乔姆斯基等认为语言学应当以人脑的语言机制即语言能力为研究对象,语料库收集的只是人们的语言运用,语言运用会因超语言因素的影响而发生变化,它并不能确切的反映语言能力。2、语料的不充分性。他们认为自然语言句子的数量是无限的,语料库的规模即使再大也无法穷尽所有可能的句子,因此“任何自然语料都是偏颇的”。在此后的长达20年的时间里理性主义在欧美一直占有统治地位,语料库研究一度陷入低谷。但在此期间仍有些语言学家凭着非凡的勇气继续不懈地从事语料库研究。最早的计算机语料库布朗语料库(Brow
Corpus),1961年由纳尔逊(FNelso
)和库切拉HKucera建立。布朗语料库容量为100万词,收集了60年代有代表性的美国英语语料,语料选自各种出版物,建库时照顾到了各种文体的平衡,严格按照随机原则抽样,是一个标准语料库。布朗语料库是第一个现代语料库,它对于后来的语料库的发展具有重要的影响。1975年,Ja
Svartvik开始创建伦敦隆德语料库(Lo
do
Lu
dCorpus),这两个语料库堪称现代语料库的开山鼻祖。
20世纪80年代以来,在相对沉寂了近20年之后,语料库研究重新萌发了生机,迅速得到发展。
语料库研究的迅速发展基于以下三个方面的原因:首先,具有语言学基础。在英国语言学研究中,实证主义从弗斯到韩礼德再到辛克莱一直被传承了下来,实证主义的基石是对可观察的对象进行研究,作为人们外部行为的语言运用是可观察的、可靠的依据,而人们内在的语言能力是不可直接观察的,只能通过语用实例进行推断。语料库是在随机采样的基础上收集的有代表性的真实语言材料的集合,是语言运用的样本。如果样本具有代表性,采样具有随机性,且样本的量又足够大,则r