英単語には母音字がどれだけ使われているのか

アルファベット

クロスワードなどをしていると、英単語にはどのくらい母音字(a, e, i, o, u)が使われているのか気になるときがあります。Wordle(ワードル)などの英単語を当てるゲームでは、まず始めに母音が多い単語を入れるのが攻略法の1つになっています。その理由は、英単語で使われるアルファベットは母音の割合が高い、という統計結果があるからです。

英語辞典やGoogleブックスで使われている何万以上の英単語を調べたところ、英単語の約38%は母音字だったそうです。この研究は、膨大な単語を集積したコーパス(言語データベース)をもとに、「どのアルファベットが最も使われるのか」を分析したものです。ちなみに、最も使われるアルファベットは、E, A, R, Tです。今回は母音のデータだけ見てみます。

英単語における母音字の割合
母音字 英語辞典 Googleブックス
E 11.16% 12.49%
A 8.50% 8.04%
I 7.54% 7.64%
O 7.16% 7.57%
U 3.63% 2.73%
合計 37.99% 38.47%

出典:“English Letter Frequency Count” Peter Norvig, “Which letters in the alphabet are used most often?” Lexico

スポンサーリンク

英語辞典とGoogleブックスでは、よく使われる単語は微妙に異なりますが、ほぼ同じような結果になっています。とくに頻出度が高い母音はEで、アルファベット全体でも1位です。次いで、A, I, Oの順番です。Uがそこまで多くないのは、アルファベットに追加された時期が遅いからです。アルファベットが26文字になったのは16世紀頃でした。

英語辞典の研究は、『Concise Oxford English Dictionary 第11版』で使われている24万以上の英単語、Googleブックスの研究は、アメリカの計算機科学者ピーター・ノーヴィグ(Peter Norvig)氏が行ったもので、Googleブックスで使われている約9万7000単語約3兆5635億文字から算出した結果です。この研究からは「最も使われる英単語」も明らかになっています。

すべての母音字の割合を足してみると、約38%(37.99~38.47)の割合で母音字という結果になります。

ピーター・ノーヴィグ(Peter Norvig)氏の同研究によれば、英単語の平均的な文字数4.79文字だったそうです。そのため、平均的には、1つの英単語に1.8個の母音字が含まれる、という計算になります。Wordleなどの5文字の英単語なら平均1.9個です。

  • 平均的な英単語 (4.8文字)
    ⇒ 母音字は平均1.8個
  • Wordleの単語 (5文字)
    ⇒ 母音字は平均1.9個
スポンサーリンク

Wordleの攻略法によっては、「アルファベットは26文字なので、5つしかない母音をまず入れるのが有効」、というような説明もあります。ただ、その理屈ならどの文字を入れても同じ確率(5/26, 19.23%)で当たります。audioなどの母音が多い単語を先に入れる戦略が有効なのは、単に26分の5が母音だからではなく、英単語で使われる文字の約38%が5つしかない母音字だからです。頻度分析によって、5文字の英単語には母音字が平均1.9個含まれる計算になるからです。

今回は英単語における母音字の割合や、平均的な母音字の数についてまとめました。

  • 英単語における母音字の割合は約38%
  • 平均的な英単語(4.8文字)の母音字の数は平均1.8個
  • Wordleの単語(5文字)の母音字の数は平均1.9個

クロスワード、Wordle攻略(最初に母音が多い単語を入れる理由)、英単語学習などの一助になれば幸いです。

参考 母音字がすべて含まれる英単語
参考 母音字がない子音だけの英単語

タイトルとURLをコピーしました