コーパス言語学とは?

 

大まかに説明しますと、『任意の文章を大量に入力して、それらの文の中で

 

a)どんな単語が、

b)どんな状況で、

c)どのくらいの頻度で使われているか、また使われていないのか、

d)なぜその単語が使われたのか、

e)その単語はどのような前後関係(コロケーション)で使われていたか』

ということを主に研究する学問です。

例えばsureについて調べてみると、話し言葉でsureは100万語中500回以上使われているのに対し、書き言葉では250回程度と、その使用頻度は半減します。このことから、単純ではありますが、sureは話し言葉において特によく使われている、ということがわかります。

次に文の前後関係(コロケーション)ですが、sureの使われている部分をいくつか抜き出して見ます。

…not sure.

…make sure (that)…

…for sure,…

a sure thing

…to be sure of ….

(参考:Longman Dictionary of Contemporary English

 

などなど、探そうと思えば際限無く探すことができます。そこからsureが「どの位の頻度で形容詞を修飾するのか」、「sureの後ろにはofやthatがよく使われる」など、様々な意味付けを行っていくわけです。また上の例文から、やはりsureは多くの場合話し言葉で使われているということも分かってきます。そしてこの研究は例文が多ければ多いほどその正確性が増すので、データ量の豊富さが命となります。