英単語には母音字がどれだけ使われているのか

アルファベット雑学・コラム

クロスワードなどをしていると、英単語にはどのくらい母音字(a, e, i, o, u)が使われているのか、気になる時があります。Wordle(ワードル)などの英単語当てゲームでは、まず始めに母音が多い単語を入れる方法が有効です。その理由は、英単語で使われるアルファベットは母音の割合が高い、という統計結果があるからです。

英語辞典やGoogleブックスで使われている何万以上の英単語を調べたところ、英単語の約38%は母音字だったそうです。この研究は、膨大な単語を集積したコーパス(言語データベース)を基に、「どのアルファベットが最も使われるのか」を分析したものです。ちなみに、最も使われるアルファベットは、E, A, R, Tです。今回は、母音のデータだけ見てみます。

母音字の割合
母音字英語辞典Googleブックス
E11.16%12.49%
A8.50%8.04%
I7.54%7.64%
O7.16%7.57%
U3.63%2.73%
合計37.99%38.47%

出典:“English Letter Frequency Count” Peter Norvig, “Which letters in the alphabet are used most often?” Lexico

英語辞典とGoogleブックスでよく使われる単語は微妙に異なりますが、ほぼ同じような結果になっています。とくに頻出度が高い母音はEで、アルファベット全体でも1位です。次いで、A, I, Oの順番です。Uがそこまで多くないのは、アルファベットに追加された時期が遅いからです。アルファベットが26文字になったのは16世紀頃でした。

英語辞典の研究は、『Concise Oxford English Dictionary 第11版』で使われている24万以上の英単語、Googleブックスの研究は、アメリカの計算機科学者ピーター・ノーヴィグ(Peter Norvig)氏が行ったもので、Googleブックスで使われている約9万7000単語約3兆5635億文字から算出した結果です。この研究からは「最もよく使われる英単語」も明らかになっています。

すべての母音字の割合を足してみると、約38%(37.99~38.47)の割合で母音字という結果になります。

ピーター・ノーヴィグ(Peter Norvig)氏の同研究によれば、英単語の平均的な文字数4.79文字だったそうです。そのため、平均的には、1つの英単語に1.8個の母音字が含まれる、という計算になります。Wordleなどの5文字の英単語なら平均1.9個です。

 英単語の母音字の数
平均的な英単語 (4.8文字) → 平均1.8個
Wordleの単語 (5文字) → 平均1.9個
スポンサーリンク

Wordleの攻略法によっては、「アルファベットは26文字なので、5つしかない母音をまず入れるのが有効」、というような説明もあります。ただ、その理屈ならどの文字を入れても同じ確率(5/26, 19.23%)で当たります。audioなどの母音が多い単語を先に入れる戦略が有効なのは、単に26分の5が母音だからではなく、英単語で使われる文字の約38%が、5つしかない母音字だからです。そのため、5文字の英単語には、母音字が平均1.9個含まれる計算になるわけです。

今回は、英単語における母音字の割合、平均的な母音字の数についてまとめました。

  • 英単語における母音字の割合は約38%
  • 平均的な英単語(4.8文字)の母音字の数は平均1.8個
  • Wordleの単語(5文字)の母音字の数は平均1.9個

クロスワード、Wordle攻略(最初に母音が多い単語を入れる理由)、英単語学習などの一助になれば幸いです。

タイトルとURLをコピーしました