クロスワードなどをしていると、英単語にはどのくらい母音字(a, e, i, o, u)が使われているのか気になるときがあります。Wordle(ワードル)などの英単語を当てるゲームでは、まず始めに母音が多い単語を入れるのが攻略法の1つになっています。その理由は、英単語で使われるアルファベットは母音の割合が高い、という統計結果があるからです。
英語辞典やGoogleブックスで使われている何万以上の英単語を調べたところ、英単語の約38%は母音字だったそうです。この研究は、膨大な単語を集積したコーパス(言語データベース)をもとに、「どのアルファベットが最も使われるのか」を分析したものです。ちなみに、最も使われるアルファベットは、E, A, R, Tです。今回は母音のデータだけ見てみます。
母音字 | 英語辞典 | Googleブックス |
---|---|---|
E | 11.16% | 12.49% |
A | 8.50% | 8.04% |
I | 7.54% | 7.64% |
O | 7.16% | 7.57% |
U | 3.63% | 2.73% |
合計 | 37.99% | 38.47% |
出典:“English Letter Frequency Count” Peter Norvig, “Which letters in the alphabet are used most often?” Lexico
英語辞典とGoogleブックスでは、よく使われる単語は微妙に異なりますが、ほぼ同じような結果になっています。とくに頻出度が高い母音はEで、アルファベット全体でも1位です。次いで、A, I, Oの順番です。Uがそこまで多くないのは、アルファベットに追加された時期が遅いからです。アルファベットが26文字になったのは16世紀頃でした。
すべての母音字の割合を足してみると、約38%(37.99~38.47)の割合で母音字という結果になります。
ピーター・ノーヴィグ(Peter Norvig)氏の同研究によれば、英単語の平均的な文字数は4.79文字だったそうです。そのため、平均的には、1つの英単語に1.8個の母音字が含まれる、という計算になります。Wordleなどの5文字の英単語なら平均1.9個です。
- 平均的な英単語 (4.8文字)
⇒ 母音字は平均1.8個 - Wordleの単語 (5文字)
⇒ 母音字は平均1.9個
Wordleの攻略法によっては、「アルファベットは26文字なので、5つしかない母音をまず入れるのが有効」、というような説明もあります。ただ、その理屈ならどの文字を入れても同じ確率(5/26, 19.23%)で当たります。audioなどの母音が多い単語を先に入れる戦略が有効なのは、単に26分の5が母音だからではなく、英単語で使われる文字の約38%が5つしかない母音字だからです。頻度分析によって、5文字の英単語には母音字が平均1.9個含まれる計算になるからです。
今回は英単語における母音字の割合や、平均的な母音字の数についてまとめました。
- 英単語における母音字の割合は約38%
- 平均的な英単語(4.8文字)の母音字の数は平均1.8個
- Wordleの単語(5文字)の母音字の数は平均1.9個
クロスワード、Wordle攻略(最初に母音が多い単語を入れる理由)、英単語学習などの一助になれば幸いです。
参考 母音字がすべて含まれる英単語
参考 母音字がない子音だけの英単語