リレー連載 実践で学ぶ コーパス活用術7 コーパスを活用した古くて新しい学問領域:フレイジオロジー――理論編
7
井上 亜依
コーパスを活用した
古くて新しい学問領域:
フレイジオロジー
――理論編――
はじめに
今月から2回にわたり、フレイジオロジー(phraseology, 定型表現研究)という学問におけるコーパスの使用について解説します。1回目は、フレイジオロジーの説明から始まり、この分野でどのようにコーパスが活用されているのかという理論的なことを述べます。2回目は、その理論を踏まえ、実際にコーパスを用いたフレイジオロジーの具体的な研究成果を紹介します。
1 なぜフレーズなのか?
これまでの言語理論では、人間は単語と文法規則を覚えて発話・作文をすると考えられてきました。しかし、実際の発話・作文を観察すると、文法規則では説明できない「不規則な現象」が存在します。その不規則な現象というのは、フレーズの場合が多く、人間の言語には多数のフレーズが存在し、そのフレーズを私たちは状況・立場に応じて使い分け、スムーズな言語活動を行っています。言語習得理論でも同様に、コミュニケーション能力には、あらかじめ組み立てられたフレーズを使い、それを文脈に応じて調整することが必要で、文法は従属的なものである、と捉えられています。一例をあげますと、英語学習者の多くは you know what? というフレーズを聞いたことがあるかと思います。しかしながら、you know what? が文脈に応じて多様な機能(会話の皮切り、強調など)を発展させ、その機能に応じた音声的・統語的特徴があることはあまり知られていません。
英語母語話者のようにペラペラ喋ることができるためには、このフレーズを覚えることが重要です。そして、そうすることで「英語らしさ」を身につけることができるのです。その「らしさ」を発見するために、phraseologist(フレイジオロジーの研究者)は、学習者にとって有益なフレーズを見つけ、文脈の中でどのような意味を発展させているのかをコーパスを用いて調べ、その研究成果を論文や辞書の中で発表しています。
2 フレーズとは?
コーパスを用いてフレーズの意味を調べると説明しましたが、まず、何がフレーズなのかを考えましょう。フレーズとは「連語(collocation)、成句(set phrase)、イディオム、決まり文句(formulae)など、単語と単語が結合してできたかたまりとパタン」ですが、ここで研究対象としているフレーズは、「2語以上から成り立つ、繰り返し使用される語連結」と定義し、その語連結は phraseological units(以後、PUs)、「定型表現」と呼びます。フレイジオロジーは様々な側面から研究がなされ、定義、用語も研究者によって呼び方は様々ですが、ここでの定義と用語はもっとも一般的なものです。
3 フレイジオロジー(phraseology)とは?
フレイジオロジーは、その文字が表す通り、フレーズについての研究です。では、そのフレーズとはどのようなものを指すのかというと、第2節で示した通り、連語(collocation)、成句(set phrase)、イディオム、決まり文句(formulae)など、単語と単語が結合してできたかたまりです。実際のフレイジオロジーは、もっと広い意味で捉えられ、個々の動詞がどのような補文構造を取るかなどのパタンもフレイジオロジーに含まれます。このことから、フレイジオロジーの日本語の訳語は「定型表現研究」という言葉が適当であり、その研究が扱うフレーズは「定型表現」となります。[1]
フレイジオロジーという言葉をあまり聞き慣れない方がいらっしゃるかと思いますが、フレイジオロジーは、「古くて新しい学問領域」と言えます。言語学習、とりわけ英語学習者にとって、フレーズが重要であるという考え方は、古くから認識され、それは辞書の中でイディオムという形で扱われ、現在まで発展してきました。[2] 現在の言語学において、イディオムは、kick the bucket(死ぬ), spill the beans(秘密を漏らす)のように、イディオム全体の意味が各構成要素の意味の総和とならないと定義されています。しかし、昔、辞書の中で扱われたイディオムというのは、現在の定義に沿ったイディオムのほかにも、連語、成句、決まり文句を含んだものです。このように、辞書使用者に理解しやすいフレーズ記述の工夫を行うという辞書学の一部分として実践的に研究が行われてきたのと並行して、フレーズそのものを実証的に研究する言語学的立場からのフレイジオロジーも存在してきました。この2つの流れが1つとなり、本格的にフレイジオロジーが研究されるようになったのは、1980年代のコーパスの発達によります。
現在、どのような研究がフレイジオロジーで行われているかは、一言で説明することはできません。言語学的立場、文化的立場、教育学的立場など、どのような側面からフレーズを研究するかは、個々の研究者により異なります。[3]
4 フレイジオロジーでコーパスをどう利用するか?
コーパスを利用した研究は、「コーパス駆動型」(corpus-driven)と「コーパス基盤型」(corpus-based)とに分けられます。コーパス駆動型は、コーパスから得られたデータを分析して、その中から研究対象とする単語もしくはフレーズ等を見つけ出します。それに対し、コーパス基盤型は、あらかじめ研究対象とする単語・フレーズ等を決め、それがどのように使用されているのかをコーパスで調べます。フレイジオロジーの場合、後者のコーパス基盤型の方法が一般的です。
英文を読んだり、聞いたりしていてわからない単語やフレーズは、辞書を引いて解決できます。そして、その英文を理解することができます。しかし、いくら辞書を引いても英文が理解できない場合があるかと思います。その理由の一つとして考えられるのは、フレーズをフレーズとして把握できていないことです。英文読解・聴解で理解を阻んでいるのは、このフレーズの認識不足と考えられます。そして、自分が英文を理解できないのはもしかしてフレーズが使用されているからではないかと予測を立て、そのフレーズをコーパスを用いて検索してみます。
このように調べたいフレーズが決まったら、次にどのようなコーパスを用いたらよいかという疑問がわきあがってくるかと思います。コーパスには、汎用目的コーパスと特殊目的コーパスの2種類があります。
表1は、それぞれの種類における主要な英語コーパスの一覧です。
| (A) 汎用目的コーパス (辞書編纂などの一般目的研究のために用いられる) | |
| コーパス名 | The British National Corpus (BNC) |
|---|---|
| 特徴 | イギリス英語の書き言葉、話し言葉を集めた1億語から成るコーパス。 |
| URL | (1) http://bnc.jkn21.com/index.html (2) http://bncweb.lancs.ac.uk/ (3) http://corpus.byu.edu/bnc/ |
| 利用料 | (1) は有料(小学館コーパスネットワークで利用申し込み可能) / (2) (3) は無料 |
| コーパス名 | WordBanksOnline (WB) |
| 特徴 | 世界最大を誇る約6億5千万語のコーパス The Bank of English(BoE)のうち、公開可能なサブコーパス(約5300万語)として検索サービスに供されているものを指す。 |
| URL | http://wordbanks.jkn21.com/ |
| 利用料 | 有料(小学館コーパスネットワークで利用申し込み可能) |
| コーパス名 | Database of Analyzed Texts of English (DANTE) |
| 特徴 | 4万2千語の見出し語、複数の語から成る2万3千の表現、2万7千のイディオムとフレーズから成る。イギリス英語が中心。 |
| URL | http://webdante.com/index.html |
| 利用料 | 無料 |
| コーパス名 | The Corpus of Contemporary American English (COCA) |
| 特徴 | アメリカ現代英語4億5千万語以上のコーパス。話し言葉、フィクション、大衆誌、新聞、学術誌から成る。1990年から2012年の英語は2千万語。データは随時更新されている。 |
| URL | http://corpus.byu.edu/coca/ |
| 利用料 | 無料 |
(B) 特殊目的コーパス (ある特定の時代や地域の英語、口語英語の特徴、フレーズの使われ方などを調べるために用いられる) |
|
| コーパス名 | The Modern English Collection |
| 特徴 | 1500年以降から現代までのフィクション、ノンフィクション、ドラマ、手紙、新聞、原稿を集めたコーパス。作家やジャンルによる検索が可能。 |
| URL | http://etext.lib.virginia.edu/modeng/ |
| 利用料 | 無料 |
| コーパス名 | The Corpus of Historical American English (COHA) |
| 特徴 | 1810年から2009年までのフィクション、ノンフィクション、雑誌、新聞を集めた総語数4億語以上のアメリカ英語コーパス。 |
| URL | http://corpus.byu.edu/coha/ |
| 利用料 | 無料 |
| コーパス名 | SCREENPLAY 映語犬サク |
| 特徴 | 映画のセリフのトランスクリプトを集めたもの。発話者、使用されているテキスト、映画の中での発話時間も見ることができる。 |
| URL | http://www.screenplay.co.jp/kensaku/kensaku.cgi |
| 利用料 | 無料 |
| コーパス名 | Drew's Script-O-Rama |
| 特徴 | 映画のセリフのトランスクリプトを集めたもの。最新の映画のデータが随時追加されている。 |
| URL | http://www.script-o-rama.com/oldindex.shtml |
| 利用料 | 無料 |
調べたいフレーズ、目的に合ったコーパスが決まったら、実際にフレーズを検索してみますが、気を付けることが1点あります。単語の場合もそうですが、必要な例を逃さないために、オーバーマッチ(overmatch)の検索をお勧めします。オーバーマッチとは、余計と思える例を含めた検索です。
例えば、現代口語英語で使用されている you know what? というフレーズがどのような意味・機能を持つのかを調べる場合、現代口語英語コーパスを用いて、いきなり you know what? という形で検索するのではなく、you know what と入力します。そうすると、you know what が単独で用いられる場合と、you know what happened next など、what の後に語(句)が続く例が観察されます。
|
そのうち、研究対象である you know what が単独で使用される例のみを検証していきます。
そうすると、you know what の文脈に応じた多様な意味がわかるだけでなく、you know what? の ‘?’ を含めた形の検索では出てこなかった用法、例えば you know what が you know のように「間詰め」(hesitation filler)[4] として機能する用法があることがわかります。このような you know what の機能、統語的特徴、音声的特徴をまとめたものが次の表2です。
| 特徴的な共起語句 | 文中での位置 | 音調 | 日本語訳 | |
|---|---|---|---|---|
| 会話の皮切り | 冒頭 | 平板調 | あのですね | |
| 話題転換 | 中頃 | 下降調 | ところで | |
| 強 調 | and, but | 中頃 | 上昇調 | いいですか |
| 間詰め | 中頃 | 平板調 | えーと | |
| 話題転換と強調の混合 | absolutely, but, I agree | 冒頭 | 上昇下降調 下降上昇調 |
ところでいいですか |
| 情報補足 | 中頃 | 下降調 | それから | |
| 代 用 | and, also | 動詞の項、前置詞の目的語 | 平板調 | 例のあれ |
まとめ
今回は、フレイジオロジーの紹介から始まり、コーパスに基づくフレイジオロジーのあり方を紹介しました。次回は、具体的なフレーズを取り上げて、コーパスに基づく実証的フレーズ研究を紹介します。
〈参考文献〉
Burger, H., D. Dobrovol'skij, P. Kühn, N. R. Norrick. 2007. Phraseology: An International Handbook of Contemporary Research. Berlin: Walter de Gruyter.
Inoue, A. 2007. Present-Day Spoken English: A Phraseological Approach. Tokyo: Kaitakusha.
八木克正・井上亜依.2013.『英語定型表現研究――歴史・方法・実践』東京: 開拓社.
〈注〉
