Eine Vorlesung vor der physikalisch-mathematischen Sektion, 23. Januar 1913

Unsere Untersuchung betrifft eine Folge von 20.000 russischen Buchstaben ohne ь und ъ 352 im Roman Eugen Onegin von Puschkin, die das ganze erste und sechzehn Paragraphen des zweiten Kapitels füllen.

Diese Folge liefert uns 20.000 verbundene Proben, von denen jede entweder einen Vokal oder einen Konsonant ergibt.

Dementsprechend nehmen wir die Existenz einer unbekannten Wahrscheinlichkeit p an, daß der betrachtete Buchstabe ein Vokal ist. Wir bestimmen den ungefähren Wert von p durch Beobachtung, indem wir die vorhandenen Vokale und Konsonanten zählen. Außer p werden wir, ebenfalls durch Beobachtung, die ungefähren Werte von zwei Zahlen p1 und p0 und vier Zahlen p1,1, p1,0, p0,1, p0,0 finden. Sie stellen die folgenden Wahrscheinlichkeiten dar: p1 – ein Vokal folgt einem anderen Vokal, p0 – ein Vokal folgt einem Konsonanten, p1,1 – ein Vokal folgt zwei Vokalen, p1,0 – ein Vokal folgt einem Konsonanten, dem ein Vokal vorhergeht, p0,1 – ein Vokal folgt einem Vokal, dem ein Konsonant vorhergeht, und schließlich p0,0 – ein Vokal folgt auf zwei Konsonanten.

Diese Indexierung folgt der, die ich in meinem Artikel Über einen Fall von Proben, die in komplexer Kette verbunden sind 353 eingeführt habe. In bezug auf [Seite 188↓]meinen anderen Artikel, Untersuchung eines bemerkenswerten Falls abhängiger Proben 354 , ist jedoch p0 = p2. Die entsprechenden Wahrscheinlichkeiten für Konsonanten bezeichnen wir mit q und einer Indexierung desselben Musters.

Suchen wir den Wert von p, finden wir 200 ungefähre Werte, aus denen wir das arithmetische Mittel bestimmen. Und zwar zerlegen wir die vollständige Folge von 20.000 Buchstaben in 200 einzelne Folgen, jede 100 Buchstaben, und zählen, wieviele Vokale in jedem Hundert enthalten sind. Wir erhalten 200 Zahlen, die durch 100 geteilt schließlich 200 ungefähre Werte von p ergeben.

Wenn wir die Anzahl der Vokale bestimmen, möchten wir die Möglichkeit bewahren, andere Verbindungen von 100 Buchstaben zu bilden: Wir schreiben jedes Hundert in aufsteigender Folge in ein Rechteck von zehn Zeilen und zehn Spalten:

Wir zählen nun, wieviele Vokale es in jeder einzelnen Spalte gibt und verbinden die Zahlen in Paaren:

die 1. und 6., 2. und 7., 3. und 8., 4. und 9., 5. und 10.

Für jedes Hundert Buchstaben erhalten wir so fünf Zahlen, die wir durch folgende Symbole bezeichnen


[Seite 189↓]

(1,6),(2,7),(3,8),(4,9),(5,10);

und folgende Summe

(1,6) + (2,7) + (3,8) + (4,9) + (5,10)

ist gleich der Anzahl von Vokalen in diesem Hundert.

Wenn wir 500 Buchstaben verbinden, können wir fünf neue Gruppen von je 100 Buchstaben bilden. Die erste aus der ersten und sechsten Spalte, die zweite aus der zweiten und der siebten, usw.

Die Anzahl von Vokalen in diesen neuen Hundertergruppen ergibt sich offensichtlich aus folgenden Summen

die aus den entsprechenden fünf Summanden bestehen.

Die Ergebnisse unserer Zählungen sind in 40 kleinen Tabellen zusammengestellt, von denen jede folgendes enthält: in der ersten Zeile 5 Zahlen (1,6) und ihre Summe – in der zweiten Zeile 5 Zahlen (2,7) und ihre Summe, usw. In der letzten Zeile befindet sich die Anzahl von Vokalen im ersten Hundert, zweiten Hundert, usw. und schließlich die Anzahl von Vokalen in allen 5 Hunderten, um Platz zu sparen verringert um 200.


[Seite 190↓]


[Seite 191↓]

Wir beschäftigen uns zunächst mit der Zahlengruppe

die sich in der letzten Zeile unserer 40 kleinen Tabellen findet und die Anzahl von Vokalen in aufeinanderfolgenden Hunderten des Textes zeigt, zum Beispiel in:

usw. 355

Indem wir zählen, wie oft jede der Zahlen in dieser Gruppe auftritt, legen wir eine neue Tabelle an

In der ersten Zeile finden sich alle Zahlen, die in der Gruppe vorkommen, und in der zweiten darunter, wie oft sie vorhanden sind.

Mit Hilfe dieser Tabelle ist das arithmetische Mittel leicht zu finden


[Seite 192↓]

und daraus folgt, daß

Jetzt berechnen wir die Summe der Quadrate ihrer Abweichnung von 43,2; sie ist gleich

1022,8,

geteilt durch 200 erhalten wir

5,114,

und diese Zahl kann als ungefähre Größe der mathematischen Erwartung des Quadrates der Abweichung jeder unserer 200 Zahlen von ihrer gemeinsamen mathematischen Erwartung gelten, die 43,2 beträgt. Schließlich stellt die Zahl

die ungefähre Größe der mathematischen Erwartung des Fehlerquadrates bei der Bestimmung von 100 p durch die Gleichung

dar.

Eine solche Folgerung ist mit der üblichen Voraussetzung der Methode der kleinsten Quadrate verbunden, nämlich daß wir es mit unabhängigen Größen zu tun haben. Diese Annahme ist in diesem Fall ist nicht weniger begründet als [Seite 193↓]in vielen anderen, weil die Verbindung zwischen den Zahlen aufgrund der Art, in der sie gefunden wurden, ziemlich schwach ist.

Man kann auch eine gewisse Übereinstimmung unserer Ergebnisse mit dem bekannten Gesetz der Fehlerhäufigkeit bemerken, das mit den Namen Gauß und Laplace verbunden ist; zum Beispiel beträgt die Größe, die als wahrscheinlicher Fehler bezeichnet wird, in unserem Fall ungefähr

und dementsprechend liegen zwischen

43,2 - 1,5 = 41,7 und 43,2 + 1,5 = 44,7

103 Zahlen, daß heißt ungefähr die Hälfte [der Gesamtheit]: 31 Mal die Zahl 42, 43 Mal die Zahl 43 und 29 Mal die Zahl 44.

Der Unabhängigkeit der Größen entspricht die Tatsache, daß wir, verbinden wir sie zu zweien, zu vieren oder zu fünft und berechnen wir für diese 100, 50 und 40 Kombinationen die Summen der Quadrate ihrer Abweichungen von

86,4,172,8und 216,

die Zahlen

827,6975,2,1004,

erhalten, die sich nicht sehr von der früher gefundenen Zahl

1022,8.

unterscheiden.


[Seite 194↓]

Gehen wir nun von Proben von Hunderten über zu einzelnen, stellen wir fest, daß sich die Zahl

stark von

0,432 x 0,568 = 0,245376

unterscheidet: Der Dispersionskoeffizient (wir weichen hier leicht vom üblichen Wortgebrauch ab, demzufolge wir die Wurzel aus der von uns als Dispersionskoeffizient bezeichneten Zahl gezogen haben sollten) beträgt

d. h. etwa , was sich gut durch die Verbundenheit unserer Proben erklärt.

Zur Klärung dieser Verbundenheit, wenn auch keiner vollständigen, kann uns die Berechnung der zuvor erwähnten Wahrscheinlichkeiten p1 and p0 dienen.

Indem wir den ganzen Text von 20.000 Buchstaben untersuchen, zählen wir die Häufigkeit der Folge

Vokal, Vokal;

und erhalten die Zahl 1104, die nach ihrer Teilung durch die Gesamtmenge der Vokale im Text die folgende Näherungsgröße für p1 ergibt:


[Seite 195↓]

In derselben Weise hätten wir einen Näherungswert für q0 herausfinden können, indem wir die Häufigkeit der Folge

Konsonant, Konsonant

zählen und sie durch 11362 teilen, es gilt dann p0 = 1 - q0. Wir können aber die ermüdende direkte Berechnung auch durch folgendes ersetzen. Ziehen wir 1104 von 8638 ab, ergibt sich die Anzahl der Konsonanten

7534,

denen ein Vokal folgt, und, da alle Konsonanten außer dem ersten entweder einem Vokal oder einem Konsonant folgen müssen, wird die Häufigkeit der Folge

Konsonant, Konsonant

durch die Differenz

11361 - 7534 = 3827

bestimmt.

Also erhalten wir unmittelbar folgende Näherungsgröße für p0

Wir sehen, daß sich die Wahrscheinlichkeit eines Buchstaben, ein Vokal zu sein, abhängig davon, welcher Buchstabe – Vokal oder Konsonant – vor ihm steht, wesentlich verändert. Die Differenz p1 - p0, die wir mit dem Buchstaben δ bezeichnen, ist gleich


[Seite 196↓]

0,128 - 0,663 = - 0,535.

Wenn wir nun annehmen, daß die Folge von 20.000 Buchstaben eine einfache Kette bildet, dann kann für

δ = - 0,535

entsprechend der Untersuchung eines bemerkenswerten Falls abhängiger Proben die Zahl

als theoretischer Dispersionskoeffizient gelten.

Natürlich stimmt diese Zahl nicht völlig mit der vorher gefundenen

0,208

überein, aber sie ist ihr näher als der Einheit, was dem Fall von unabhängigen Proben entspricht.

Betrachten wir die Folge als komplexe Kette und wenden die Ergebnisse der Untersuchung Über einen Fall von Proben, die in komplexer Kette verbunden sind an, können wir den theoretischen Dispersionskoeffizienten noch besser mit dem experimentellen in Deckung bringen.

Dazu zählen wir die Häufigkeit der Kombinationen

Vokal, Vokal, Vokal

und


[Seite 197↓]

Konsonant, Konsonant, Konsonant

in unserer Folge. Meiner Zählung zufolge beträgt die Anzahl der ersten Kombination 115, die der zweiten – 505. Wenn wir diese Zahlen durch die früher gefundenen

1104 und 3827

teilen, erhalten wir die Näherungsgleichungen

Mit dem Ziel, die Ergebnisse des zuvor genannten Artikels auf unseren Fall anzuwenden, nehmen wir an, daß

und aus diesen Zahlen ergibt sich

Dann wenden wir uns dem Ausdruck des Dispersionskoeffizienten zu


[Seite 198↓]

der den Bedingungen des Artikels entspricht und dort abgeleitet wurde. Wenn wir hier die von uns gefundenen Werte

p, q, δ, ε, η

einsetzen und das Ergebnis berechnen, erhalten wir

0,195

als Dispersionskoeffizient, der so weit mit der Zahl

0,208,

die allgemeinen Regeln folgend und unabhängig von unseren besonderen Voraussetzungen gefunden wurde, übereinstimmt, daß man kaum nähere Entsprechung fordern kann.

Natürlich können wir nicht behaupten, daß unser Beispiel alle theoretischen Voraussetzungen voll erfüllt, aber auf der anderen Seite können wir kaum bezweifeln, daß die von uns festgestellte Übereinstimmung der Zahlen kein purer Zufall ist, sondern mit einer gewissen Entsprechung der theoretischen Annahmen und den Bedingungen des Beispiels zusammenhängt.

Nun wenden wir uns der anderen Anordnung der 20.000 Buchstaben in Hunderte zu, die wir vorgenommen haben. Wir stellen eine Tabelle der Wiederholungen der einzelnen Zahlen auf, ähnlich der vorigen.


[Seite 199↓]

Der arithmetische Durchschnitt dieser neuen 200 Zahlen ist gleich dem vorigen

43,19.

Aber die Summe der Quadrate ihrer Abweichungen von 43,2 ist wesentlich höher als vorher. Sie ist nämlich gleich

5788,8.

Hier ist es notwendig, auf die Voraussetzung der Unabhängigkeit der Größen zu achten, die normalerweise mit der Methode der kleinsten Quadrate verbunden wird (vgl. Kapitel 7 meines Buches Wahrscheinlichkeitsrechnung 356 ). Erinnern wir uns, wozu diese Voraussetzung notwendig ist. Sie ist notwendig, um das Gewicht des Endergebnisses zu bestimmen, das durch Gleichung (21) ausgedrückt wird, und auch, um die mathematische Erwartung W zu berechnen, die den Näherungswert k ergibt (vgl. mein Buch). Aber diese Bedingung wird sich als überflüssig erweisen, wenn wir erstens die Frage des Gleichungsgewichtes (21) auslassen und zweitens ξ im Ausdruck W durch die Zahl a ersetzen, von der [Seite 200↓]wir annehmen werden, daß sie gleich a0 ist, indem wir die Differenz a - a0 vernachlässigen. Dann bilden die Gleichungen

und

die Basis unserer Folgerungen. Sie benötigen keine Unabhängigkeit der Größen

x‘, x‘‘, ..., x(n).

Auf der Basis solcher Gleichungen und des Gesetzes der Großen Zahlen schlagen wir vor, daß

und

Nur das Theorem über das Gewicht des Endergebnisses, das durch die bekannte Gleichung (22) ausgedrückt wird, wird vernachlässigt: das Gewicht des Ergebnisses ist gleich der Summe der Gewichte aller Teile.

Im gegebenen Fall stellt jede unserer 200 Zahlen die Summe fast unabhängiger Größen dar; aber die Summen selbst sind in Fünfergruppen verbunden, so daß nur 40 von ihnen als unabhängig betrachtet werden können. Wir haben 40 Gruppen zu je 500 Buchstaben; in keinem Hundert befinden sich benachbarte Buchstaben des Textes. Das ist der Grund für die bemerkte Unabhängigkeit der Teile. Auf der anderen Seite sind in jeder Gruppe die [Seite 201↓]Buchstaben des ersten Hunderts denen des zweiten Hunderts, die des zweiten Hunderts sowohl denen des ersten als auch des dritten, usw. benachbart. Aus diesem Grund sind, wie oben erwähnt, unsere Zahlen in Fünfergruppen verbunden.

Unter diesen Bedingungen und gemäß den gegebenen Erklärungen kann die Zahl

als Näherungsgröße der mathematischen Erwartung des Quadrats der Abweichung unserer neuen 200 Zahlen

49, 42, 38, 42, 44, ....

von ihrer mathematischen Erwartung betrachtet werden, die ungefähr

43,2

beträgt.

Gehen wir nun von Hunderten von Buchstaben (Proben) zu den einzelnen Buchstaben über, stellen wir fest, daß sich die Zahl

0,28944

nicht wesentlich von

0,432 x 0,568 = 0,245376

unterscheidet: der Dispersionskoeffizient beträgt


[Seite 202↓]

Wenden wir uns nun dem Endergebnis

43,19,

zu, dann kann die mathematische Erwartung seines Fehlerquadrates aufgrund der Verbundenheit der Zahlen

49, 42, 38, 42, 44, ...;

nicht mehr durch

ausgedrückt werden. Sie kann im Gegenteil, entsprechend den Ergebnissen der anfänglichen Anordnung der Buchstaben in Hunderten, natürlich näherungsweise, durch die Zahl

ausgedrückt werden.

Die erwähnte Verbundenheit der Zahlen zeigt sich bei der Zusammenfassung ihrer Summen zu zweit, zu viert und insbesondere zu fünft. Berechnen wir für diese 100, 50 und 40 Kombinationen die Summen der Quadrate ihrer Abweichungen von


[Seite 203↓]

86,4,172,8and216,

erhalten wir statt

5788,8

die Zahlen

deren letzte fast sechs Mal kleiner ist als die Zahl 5788,8.

(In:Bulletin de l’Académie Impériale des Sciences de St.-Pétersbourg. Bd. 7, Nr. 13, 1913. S. 153-162. Übers. v. Alexander Y. Nitussov, Ludmila Voropai & David Link.)


Fußnoten und Endnoten

352 Diese Buchstaben, das Härte- und das Weichheitszeichen, werden im Russischen nicht ausgesprochen, sondern beeinflussen die Aussprache des vorhergehenden Buchstaben.

353 Markov, Andrej A.: Sur un cas d’épreuves liées en chaîne multiple. In: Bulletin de l’Académie Impériale des Sciences de St.-Pétersbourg. Nr. 2, 1911. S. 171-186. Auf Russisch.

354 Markov, Andrej A.: Recherches sur un cas remarquable d’épreuves dépendantes. In: Bulletin de l’Académie Impériale des Sciences de St.-Pétersbourg. Ser. 3, Bd. 1, Nr. 16, 1907. S. 61-80. Auf Russisch. Leicht abweichende französische Version in: Acta mathematica. Bd. 33, 1910. S. 87-104.

355 Dies ist der Beginn von Puschkins Text.

356 Markov, Andrej A.: Wahrscheinlichkeitsrechnung. Petersburg, 1900. Weitere Auflagen 1908, 1913 und 1924. Auf Russisch. Deutsche Übersetzung v. H. Liebmann. Leipzig & Berlin: Teubner, 1912. Kapitel 7 hier S. 201-246. Die benutzte Formel findet sich auf S. 209.



© Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.
XDiML DTD Version 4.0Zertifizierter Dokumentenserver
der Humboldt-Universität zu Berlin
HTML-Version erstellt am:
15.04.2005