WordleのJavaScriptをよく読むと、12,972語が全部使われているのではなく、2,315語しか使われてないことに気付いた。で、頻度順統計を計算し直したので、流行ってますね、ともうちょっと考えてみた、と同じことを2,315語に対してやってみた。
まず、アルファベット毎の出現頻度。eがトップ。
e | 1233 |
a | 979 |
r | 899 |
o | 754 |
t | 729 |
l | 719 |
i | 671 |
s | 669 |
n | 575 |
c | 477 |
u | 467 |
y | 425 |
d | 393 |
h | 389 |
p | 367 |
m | 316 |
g | 311 |
b | 281 |
f | 230 |
k | 210 |
w | 195 |
v | 153 |
z | 40 |
x | 37 |
q | 29 |
j | 27 |
上位のe, a, r, o, tを1回だけ使う単語は無い。ポジションを無視するとLATER(1033)がトップスコア。
ポジション別の頻度順は以下。
1文字目 | 2文字目 | 3文字目 | 4文字目 | 5文字目 | |||||
---|---|---|---|---|---|---|---|---|---|
s | 366 | a | 304 | a | 307 | e | 318 | e | 424 |
c | 198 | o | 279 | i | 266 | n | 182 | y | 364 |
b | 173 | r | 267 | o | 244 | s | 171 | t | 253 |
t | 149 | e | 242 | e | 177 | a | 163 | r | 212 |
p | 142 | i | 202 | u | 165 | l | 162 | l | 156 |
a | 141 | l | 201 | r | 163 | i | 158 | h | 139 |
f | 136 | u | 186 | n | 139 | c | 152 | n | 130 |
g | 115 | h | 144 | l | 112 | r | 152 | d | 118 |
d | 111 | n | 87 | t | 111 | t | 139 | k | 113 |
m | 107 | t | 77 | s | 80 | o | 132 | a | 64 |
r | 105 | p | 61 | d | 75 | u | 82 | o | 58 |
l | 88 | w | 44 | g | 67 | g | 76 | p | 56 |
w | 83 | c | 40 | m | 61 | d | 69 | m | 42 |
e | 72 | m | 38 | p | 58 | m | 68 | g | 41 |
h | 69 | y | 23 | b | 57 | k | 55 | s | 36 |
v | 43 | d | 20 | c | 56 | p | 50 | c | 31 |
o | 41 | b | 16 | v | 49 | v | 46 | f | 26 |
n | 37 | s | 16 | y | 29 | f | 35 | w | 17 |
i | 34 | v | 15 | w | 26 | h | 28 | b | 11 |
u | 33 | x | 14 | f | 25 | w | 25 | i | 11 |
q | 23 | g | 12 | k | 12 | b | 24 | x | 8 |
j | 20 | k | 10 | x | 12 | z | 20 | z | 4 |
k | 20 | f | 8 | z | 11 | x | 3 | u | 1 |
y | 6 | q | 5 | h | 9 | y | 3 | j | 0 |
z | 3 | j | 2 | j | 3 | j | 2 | q | 0 |
x | 0 | z | 2 | q | 1 | q | 0 | v | 0 |
さて、これで2,315語を全て位置ごとの頻度順でスコアリングすると、
- slate, 1437
- sauce, 1411
- slice, 1409
- shale, 1403
- saute, 1398
- share, 1393
- sooty, 1392
- shine, 1382
- suite, 1381
- crane, 1378
最も効率が良いのはSLATEとなった。SLATEが全部外れた場合、次はCRONY(1255)、それでも全部外れるとHUMID(592)。