別の言語との類似性を測る「語彙の共通度」とは?

類似性

多言語学習をしていると英語と似ている単語を良く見かけます。違う言語に「どのくらい同じ単語が使われているか」のことを、言語学では「語彙の共通度」と呼んでいます。別の言語にも同じ単語があるのなら、覚えることが少なくて良いですよね。

そこで今回は「語彙の共通度」と「語彙の共通度が高い言語」についてご紹介します。

スポンサーリンク

語彙の共通度とは

語彙の共通度(Lexical Similarity)とは、ある2つの言語の間で語彙がどれほど共通しているのかを示す指数です。

例えば、英語とドイツ語は同じ「ゲルマン語派」に属している姉妹言語ですが、「同じ単語が何個あるのか?」と聞かれても具体的に答えるのは困難です。それを分わかりやすく数値化して比率で表したのが語彙の共通度です。

語彙の共通度は、少数言語研究組織の国際SIL(SIL International)が公開しているウェブサイトおよび出版物のEthnologueや、EZGlotというサイトで閲覧することができます。

EZGlotのデータは以下のページで閲覧できます。

参照 “Most similar languages” EZGlot

ですが注意点もあり、共通度の数値は調査団体によって異なります。

というのも、どの研究団体も単語の意味やスペルなどを基準にしているとはいえ、厳密には調査方法や計算方法が異なるからです。そのため、共通度を比較する場合は、計算方法を統一するために「同じ調査団体の数値」で比較する必要があります。

また、語彙の共通度は絶対的な指数ではありません。

そもそも言語は流動的なので完全な数値化は困難です。地域や世代によって使われる単語は違いますし、方言もあるので百人百様です。

ごがくねこ
ごがくねこ

そのため、語彙の共通度はあくまで1つの目安と捉えた方が良さそうです。

語彙の共通度が高い言語は?

語彙の共通度が高い言語の組み合わせをいくつか見ていきたいと思います。

英語とドイツ語

EthnologueやEZGlotによると、英語とドイツ語は約50~60%の単語が一致しています。

英語とドイツ語に似ている単語が多いのは、どちらも同じゲルマン祖語(Proto-Germanic)から誕生した言語だからです。

ゲルマン祖語は紀元前5世紀頃から話されている言語で、その後、北ゲルマン語群(スウェーデン語、デンマーク語、ノルウェー語など)、西ゲルマン語群(ドイツ語、英語、オランダ語など)、東ゲルマン語群(ゴート語など)に枝分かれしました。
多彩なドイツ語が統一化するまでの歴史を簡単に振り返る
ドイツ語は各地に方言が残り、ドイツ以外の地域でも話されている多種多彩な言語です。一方、歴史を振り返る…

ゲルマン語派(Germanic languages)に属する言語は、北欧諸国で話されているスカンジナビア諸語など色々とありますが、英語とドイツ語は更に同じ言語グループの西ゲルマン語群(West Germanic languages)に属しています。

日常会話で使われている英単語の約80%はゲルマン語に由来するという研究もあり、現在でも語彙や構文に共通点が残っています。

ごがくねこ
ごがくねこ

ただ発音は異なるので、相互理解可能(後述)なのかはまた別の話です。

英語とフランス語

EthnologueやEZGlotによると、英語とフランス語は約25~45%の単語が一致しています。

スペイン語・イタリア語・ポルトガル語などの他のラテン系の言語と比べると、比較的に高い数値類です。これは、現代英語の半分近くの単語が、ラテン語やフランス語に由来しているからです。

英単語の起源になった外国語の割合英単語の起源の割合出典:Wikimedia Commons

上のグラフは「英単語の起源の割合」に関する調査結果です。この調査によれば、英単語の起源の割合は、ラテン語が29%、フランス語(ラテン語由来も含む)が29%、ゲルマン語が26%なのだそうです。

その他にも、1973年に出版された『Shorter Oxford English Dictionary(第三版)』を調べたところ、収録されている約8万語のうち、約29%の単語がフランス語に由来するという研究結果もあります。古英語から引き継がれている本来語(native word, ネイティブワード)は20~30%程度とも言われています。

ごがくねこ
ごがくねこ

英語とフランス語はなぜこれほどまで語彙の共通度が高いのでしょうか。

英語とフランス語の類似性が高いのは、1066年のノルマン・コンクエスト(Norman Conquest)が一因です。イングランドは14世紀頃までの約300年間、アングロ=ノルマン語というフランス語の方言連続体を話すノルマン人の支配下に置かれたため、大量のフランス語由来の単語が英語に流入したからです。

英語の語彙に影響を与えた外国語
外国語を勉強していると、英語と似ている単語をよく見かけます。歴史的に英語は様々な外国語と言語接触を重…

ロマンス諸語

イタリア語、スペイン語、フランス語、ポルトガル語、ルーマニア語などのロマンス諸語も、それぞれ高い共通度があります。

EthnologueやEZGlotの数値を見てみると、例えば、スペイン語とポルトガル語は80~90%、スペイン語とイタリア語は60~80%の共通度があります。この理由は単純で、ロマンス諸語は6~9世紀頃に俗ラテン語(話し言葉のラテン語)から派生した言語なので、1000~1500年前までは同じ言語だったからです。

私はスペイン語圏に数年間住んでいましたが、イタリア語を聞いてもおおよそ7~8割は理解出来ます。日本語でいう方言のような感覚に近いと思います。言語学者によっては、「ロマンス語はラテン語の方言だ」と主張する人もいるくらいです。

ごがくねこ
ごがくねこ

英語とドイツ語の関係もそうですが、共通の祖先を持っている言語は、比較的に高い共通度がありますね。

その他

その他にも、以下の組み合わせの言語は比較的高い共通度があるようです。

  • 英語 ⇔ スコットランド語
  • ドイツ語 ⇔ オランダ語
  • オランダ語 ⇔ アフリカーンス語
  • スペイン語 ⇔ カタルーニャ語
  • ロシア語 ⇔ ウクライナ語

総体的に、言語接触(language contact)の機会が増えるほど、言語が混ざり合う機会も増加するので、より語彙の共通度が高くなると考えられます。

異なる言語が接触すると何が起こるのか?【言語接触とは】
異なる言語が接触すると、語彙が混ざったり、新しい言語が生まれたり、様々なことが起こります。今回は「言…
ヨーロッパの言語に同じ単語が多い3つの理由
ヨーロッパの言語には同じ語源を持っている同根語(cognate)がたくさんあります。今回は「ヨーロッ…

語彙の共通度 ≠ 相互理解可能性

先ほども少し言及しましたが、語彙が共通しているからといって相互に理解出来るとは限りません。また、勉強し易いとも限りません。

言語理解や言語学習のしやすさは、語句の共通性だけではなく、文法や発音など複合的な要因が絡み合っています。

異なる言語でも互いに理解出来る関係性のことを、言語学では相互理解可能性(Mutual Intelligibility)と呼んでいます。相互理解可能性については下の記事でもまとめているので詳細は割愛しますが、相互に理解するのは、語彙以外にも音韻論、形態論、統語などが必要になると言われています。

別の言語でも分かり合える「相互理解可能性」とは?
「違う言語なのにお互いに理解できる関係」のことを、言語学では「相互理解可能性」と言いますが、ヨーロッ…

言語学には言語間距離(Linguistic Distance)という考え方もあります。これは別の言語とどのくらい違いがあるのかを「距離」で表した概念です。語彙の共通度も、言語間の距離を測定する1つの指標になっています。

別の言葉を理解するには語彙だけでな構文や音韻など様々な要素が必要になるので、相互理解可能性においては、語彙の共通度は一つの要因と捉えた方が良さそうです。

ごがくねこ
ごがくねこ

多言語学習においては、勉強のし易さを測る1つの指針にはなると思います。

まとめ

今回は「語彙の共通度」と「語彙の共通度が高い言語」についてご紹介しました。

語彙の共通度は、違う言語にどのくらい同じ単語が使われているかを数値で表した概念です。多くのアプローチでは、単語の意味やスペルを基準にして測定しています。共通の祖先を持っている言語や、英他の言語から影響を受けた言語は、比較的に高い語彙の共通度があるようです。

語彙の共通度は絶対的な指標ではありませんが、複数の言語を勉強をする際には、勉強のし易さを測る一つの手助けになるかもしれません。

タイトルとURLをコピーしました