筆者が出版した『極限の英単語』シリーズがどれだけイケイケなのか、順を追って説明しよう。
『究極の英単語』に収録の 12,000 語。なにはともあれ覚えましょう。
"Corpus of Contemporary American English" の 60,000 語のリストに含まれる頻出順位の値。大きいほど遭遇確率が下がる。筆者の経験では RANK 36,000 くらいまで覚えればその後のボキャビルから一生解放される。
"Age-of-acquisition ratings" の 51,715 語のリストに含まれる Perc_known_lem の値。ネイティブがどれくらいの確率で知っているかの値。最大で 1.0 (100%)。
スペルが違ったら別の単語としてカウント。COCA も AoA もこの数え方を採用している。最も確実なので、本稿でもこの数え方を採用する。
この世界最速記録(当時)を出したとき、筆者は COCA60k から手作りした単語リストを暗記していたのだった。COCA60k は強い。ちぃおぼえた。
AoA 51,715 語のうち、実際にコーパスであるところの COCA60k に出現した単語数を調べると、29,636 語となった。俗にネイティブ 3 万語と言うから、それっぽい数字だ。この約 3 万語の RANK についてヒストグラムるとこうなる。
RANK が上がるにつれて件数が減っているのがわかる。つまり、RANK が高い=頻度が低い=難しい単語ほど知っている量が減っていく。そりゃそうだろう。今度は AoA をヒストグラムってみる。
これでわかるように、全部が全部 AoA 1.0 (ネイティブは確実に知ってる)というわけではない。つまり、先ほどの 29,636 語という数字は、「それら全部を確実に知っている完璧な人間」が叩き出せる、理論上の最大値ということになる。では、平均的なネイティブの語彙セットはどれくらいのサイズなのだろう。AoA の確率を用いてモンテカルロ・シミュレーションを10万回やってみる。
左右に若干のブレはあるものの、おおむね正規分布となった。中央値と平均値はともに 27,128 語である。このことから、平均的なネイティブは 27,128 語を知っている、と言い切るにはいろいろと穴があるが、学習者が目指すべきゴールとして、このサイズを設定するくらいには妥当だろう。
さてしかし、この 27,128 語というのは、確率を用いた結果であるので、そのときどきで含まれる単語に若干の差異が生じてしまう。このままだとやりづらいので、先ほどの 29,636 語を、AoA の値でフィルタリングしてみる。閾値を 0.65 以上とすると、該当件数が 27,311 語となり、ほぼ等しい値となった。ここでもう一度ヒストグラムってみよう。
手前の青いグラフがフィルタリングした 27,311 語である。後ろの 29,636 語と比べると、RANK 15,000 あたりから差が出てきているのがわかる。しかし、AoA 0.65 以上という設定は、学習者には難しすぎる気がしなくもない。ネイティブがけっこうな確率で知らないあれそれを、我々が覚える意味はあるのだろうか。もうちょっと簡単にして、AoA 0.80 以上で出し直してみよう。
手前の赤いグラフが AoA 0.80 以上の場合で、24,973 語となった。とりあえずこっちを使ってみよう。
AoA の単語リストから、実際に COCA60k に収録されている単語を絞り込み、AoA が 0.80 以上のものに限定すると、24,973 語となった。これをとりあえずの目標とする。
本稿では読者の諸兄はもちろん SVL 12,000 語を覚えたか覚える予定であると想定しているので、それをヒストグラムに反映してみよう。
手前の青が SVL で、後ろの黒がさっきの 24,973 語である。「SVL だけじゃあ露骨に足りてない」のが、わかりやすく伝わってくる。
この圧倒的語彙不足をどう埋めていくか。既存の教材ではせいぜい 3,000 語しか集まらない。まだまだ 10,000 語ほど足りない。辞書暗記?ご冗談を。そのための『極限の英単語』です。
左から順に、赤1巻、緑2巻、青3巻、紫4巻である。
ぐちゃぐちゃしているので、ダブっているところは積み上げて一本化してみよう。
SVL 12,000 語に『極限の英単語』の 12,000 語を足したのが上の図。RANK 36,000 までを網羅している。ちなみにここまでやると語彙力診断が楽勝になる。
RANK 36,000 より右がスッカスカっていうかノーガード戦法なのは筆者も気になった。そこでもう1冊出版してみた。その名も『終極の英単語』。
ヒストグラムるとこう。右のオレンジに注目。
見てわかる通り、『終極の英単語』は RANK 36,000 を超える単語を幅広くカバーしている。収録語数は約 2,000 語で、AoA 0.70 以上に限定している。これで右端のだいたい半分はカバーできたことになる。
SVL 12,000 語+極限の英単語 12,000 語+終極の英単語 2,000 語=26,000 語となる。後ろの黒いグラフ、ターゲットサイズは 24,973 語だから、実は 1,000 語ほどオーバーしていることになる。20,000 語から 30,000 語にかけて、紫のグラフが黒を上回っているのは、それだけ「AoA には含まれないが、COCA60k には含まれる単語」があるということだ。
(2019年3月31日追記)チラホラと目にする単語が終極0巻までに収まっていないことが稀にあったので、『終極の英単語 Vol.4 35000語レベル』まで出してみた。RANK 36,000-60000 を『極限の英単語』と同じ形式で網羅している。それぞれ2,000語を収録。0巻との重複なし。上のグラフで言うと、紫のバーが右端までぎっしり積み上がる感じ。
いやそれでも、と気になる読者もいるに違いない。RANK が上がるにつれ必要な単語数が下がるのであれば、学習もそのようにやるべきで、網羅するより足りないくらいでよいのでは、という考え方だ。
こんなこともあろうかと、極限の英単語の収録語から、AoA 0.80 以上の単語だけを抜き出した縮約版も用意してある。こちらは上下巻で約 6,200 語を収録している。
さっそくカバー範囲を見てみよう。
これに SVL と『終極の英単語』を足して積み上げてみよう。
めがっさきれいに仕上がった。この場合の語数は、SVL 12,000 語+極限の英単語(縮約版) 6,200 語+終極の英単語 2,000 語=20,200 語になる。背景の黒いグラフとの差分の面積が、足りない約 5,000 語になるが、とりあえずは戦える水準に達しているだろう。「アナザー12,000語もやってられっか!!」という諸兄には、こちらの縮約版コースをオススメしたい。