Nach den Teilen (mit der entsprechenden Liste der Anfangs- und Endbuchstaben) eins, zwei und drei heute Teil vier der Wikipedia-Listen: Die ersten vier Anfangsbuchstaben der Wikipedia-Seitentitel nach Frequenz sortiert und die letzten vier.

Zunächst die Top 50 der Anfangsbuchstaben:

List — 21668
Fran — 9929
Joha — 9629
Schl — 7554
Karl — 6532
Hans — 6412
Chri — 6171
Frie — 5940
Geor — 5904
The_ — 5756
Mari — 5490
John — 5321
Hein — 5287
Mich — 5278
Jose — 5196
Schw — 5154
Bahn — 5067
Andr — 4881
Will — 4839
Die_ — 4680
Alex — 4589
Pete — 4581
Land — 4497
Deut — 4478
Kant — 4428
Inte — 4317
Bund — 4174
Carl — 4162
Paul — 4113
Burg — 4023
Robe — 3848
Der_ — 3620
Char — 3600
Wilh — 3515
Thom — 3253
Mart — 3194
Herm — 3103
Rich — 3082
Groß — 2999
Anto — 2981
Ober — 2960
Wolf — 2868
Bern — 2867
Scha — 2835
Walt — 2818
Jean — 2747
Erns — 2635
St._ — 2605
Flug — 2572
Otto — 2560

Und danach die Liste der Endbuchstaben:

tion — 11669
ung) — 11092
berg — 10939
mann — 10753
burg — 7487
land — 6991
chen — 6969
ngen — 6020
bach — 5862
dorf — 5461
rung — 5370
tein — 4940
ster — 4876
haft — 4823
cher — 4727
isch — 4614
nger — 4218
ller — 4214
tung — 4201
heim — 4114
and) — 3742
usen — 3448
ler) — 3446
Chr. — 3428
ling — 3362
ker) — 3084
ment — 2917
nder — 2916
lung — 2790
elle — 2779
wski — 2768
reis — 2762
feld — 2700
ien) — 2657
smus — 2653
bahn — 2482
ille — 2480
cker — 2414
rger — 2384
stem — 2352
ität — 2218
sion — 2214
tter — 2156
asse — 2155
auer — 2119
ssen — 2113
gung — 2113
eich — 2109
idae — 2088
tsch — 2073

Bei den Anfangsbuchstaben zeigt sich auf den ersten Blick deutlich, was bereits vermutet wurde: Namen stellen einen großen Teil der Einträge in Wikipedia. Auf Platz eins — mit Abstand — steht allerdings mit List wahrscheinlich kein Name. Auffällig auch: Schon auf Platz zehn steht The (der Unterstrich bezeichnet ein Leerzeichen) — noch vor dem ersten deutschen Artikel Die auf Platz 20 (Der auf Platz 32, Das auf 75). Auch wenn man bedenkt, dass es sich im Englischen um einen Einheitsartikel handelt, hätte ich doch nicht vermutet, dass so viele Seiten mit (vermutlich) englischen Titeln so weit oben auftauchen.

Bei den Endbuchstaben hat sich tion (vermutlich das Fremdsuffix) über ion und on ganz nach oben gearbeitet und ung steht sogar noch mit folgender Klammer an Platz zwei (die Zeichenkette war Platz eins der Liste mit drei Buchstaben). Anschließend sind auch hier bereits potentiell eigenständige Wörter auszumachen: berg, mann, burg, land, bach, dorf usw.; einige deuten auch hier auf Namen — geographische Namen — hin. Chr. auf Platz 24 eher auf Einträge zu bestimmten zeitlichen Daten.

Fazit: So langsam lassen sich Einheiten erkennen. Könnte man zumindest versuchen. Die Serie wird fortgesetzt.

Zum Ausklang aber noch ein paar hapax legomena der Anfangsbuchstaben:

K5(E
Ålid
L_50
GGBe
NAK-
Enef
Stic
A-Ki
Secl
T’ae

… und der Endbuchstaben:

36,6
áil)
UVET
Vieu
MoCo
dłub
FSLN
Ağrı
‚Eua
mit…

Es gäbe so viel, was man wissen könnte …