Das Benfordsche Gesetz: Lernt man zu betrügen oder Betrug aufzudecken?

Die Autorin des Originaltextes ist Christiane Rousseau.

Vom Englischen ins Deutsche übersetzt von Katrin Wörler-Veh (Universität Würzburg)

Es erweist sich als sehr riskant, zu viele Zahlen in irgendwelchen Finanzaufstellungen zu ändern, wenn man sich nicht ein bisschen mit Mathematik auskennt. In der Tat folgen Zahlen, die in Finanzaufstellungen erscheinen, sehr häufig irgendeiner seltsamen mathematischen Regel, die auch Benfordsches Gesetz oder Gesetz der ersten signifikanten Ziffer genannt wird. Wenn man vergisst, diese Regel zu befolgen, dann bestehen die Zahlen einige statistische Tests nicht und werden höchstwahrscheinlich mit äußerster Sorgfalt überprüft. Das Benfordsche Gesetz besagt, dass die Zahlen mit der 1 als erster signifikanter Ziffer in zufälligen Zahlenansammlungen mit einer Häufigkeit von rund 30% erscheinen sollten, wohingegen die Zahlen mit der 9 als erster signifikanten Ziffer nur in 4,5% der Fälle auftreten. Dieses Gesetz wurde auch in vielen anderen Zahlenmengen beobachten, z. B. den Quadratzahlen oder den Fibonacci-Zahlen.

Warum?

Mittlerweile gibt es hierfür zufriedenstellende Erklärungen, die im Folgenden dargestellt werden.

Das Benfordsche Gesetz betrifft die Verteilung der ersten signifikanten Ziffern von Zahlen. Die erste signifikante Ziffer einer positiven Zahl ist die von Null verschiedene Ziffer einer Dezimalzahl, die am weite 237,5 und 5 die von 0.00563. Alternativ – und für die nachfolgenden Darstellungen hilfreich – kann dieses Phänomen auch definiert werden, indem eine reelle positive Zahl x als Produkt einer Zahl m \in [ 1 , 9 ) mit einer Potenz von 10 geschrieben wird:

    \[x = m 10^n , n \in \mathbb{Z}.\]

Dann ist die erste signifikante Ziffer von x der ganzzahlige Teil von m, der als \lfloor m \rfloor geschrieben werden kann. Die Zahl m wird Mantisse von x genannt. Wir behaupten nun, dass die relative Häufigkeit B(i) der ersten signifikanten Ziffer i näherungsweise durch \log_{10} (1 + \frac{1}{i}) beschrieben wird, wenn man Zahlen zufällig sammelt. Man erhält folgende Häufigkeitsverteilung:

Rendered by QuickLaTeX.com

Tabelle 1: Häufigkeiten des Benfordschen Gesetzes

Abbildung 1: Häufigkeiten B(i) des Benfordschen Gesetzes.

Der folgende Abschnitt enthält einige kurze historische Anmerkungen. Das Phänomen wurde als erstes vom Astronomen Simon Newcombe (1835-1909) entdeckt, der bemerkte, dass die ersten Seiten von Logarithmentafeln , die niedrigen ersten signifikanten Ziffern entsprechen, viel abgenutzter aussahen als die darauffolgenden Seiten. Seine Entdeckung wurde jedoch vergessen und erst um 1938 von Frank Benford (1883-1948) wiederentdeckt. Benford sammelte Zehntausende von Zahlen aus vielerlei Quellen, die seinem Gesetz folgten. Die moderne Datenbank von Simon Plouffe, die 215 Millionen mathematische Kostanten beinhaltet, folgt ebenfalls dem Benfordschen Gesetz.

Auch viele Zahlenmengen, die nicht zufällig zusammengesetzt sind, folgen dem Benfordschen Gesetz, so beispielsweise Bevölkerungszahlen und Flächen von Ländern, die Länge von Flüssen usw. Vielleicht möchte man mich an diesem Punkt stoppen und anfangen zu zweifeln … In welchen Einheiten werden diese Längen oder Flächen angegeben? Werden die Längen in Meilen oder Kilometer angegeben? Dies alles ist nicht von Bedeutung … Wenn die Längen von Flüssen in Kilometern angegeben werden, folgen sie dem Benfordschen Gesetz genauso, wie wenn sie in Meilen angegeben werden! Ein Wechsel der Einheit korrespondiert mit dem Wechsel des Maßstabs. Wir werden sehen, dass das Benfordsche Gesetz unter Skalenwechseln invariant gültig bleibt. Es ist außerdem das einzige Wahrscheinlichkeitsgesetzt, das skaleninvariant ist.

Abbildung 2: Einige Datensätze, die näherungsweise dem Benfordschen Gesetz folgen: Flächen von Ländern in Quadratkilometern, Flächen von Ländern in Quadratmeilen und Bevölkerungszahlen von Ländern

Wie in der Einleitung bereits erwähnt, folgen die Fibonacci-Zahlen dem Benfordschen Gesetz. In gewisser Weise ist das Benfordsche Gesetz jedoch subjektiv, da es von der Basis 10 (unseres Stellenwertsystems) abhängt, in der wir unsere Zahlen schreiben. In irgendeiner Basis b mit b \neq 10 sind die von Null verschiedenen Ziffern Elemente der Menge \{ 1; ... ; b-1\}, und das Benfordsche Gesetz bezüglich einer Basis b besagt, dass sich die Häufigkeit B_b (i) der ersten signifikanten Ziffer i stets aus \log_b (1+\frac{1}{i}) ergibt. Sehr schön! Die Fibonacci-Zahlen folgen dem Benfordschen Gesetz also in jeder beliebigen Basis b. Das Benfordsche Gesetz ist somit invariant unter einem Basenwechsel. Und es ist das einzige nicht-triviale Wahrscheinlichkeitsgesetz mit dieser Eigenschaft.

Im Folgenden werden einige Erklärungen gegeben, die es erfordern, dass man sich an Einiges aus der Wahrscheinlichkeitsrechnung erinnert. Bevor man ernsthaftere Mathematik zu lesen beginnt, kann man es jedoch zunächst selbst probieren.

1. Invarianz unter Skalenwechsel

Betrachten wir einen einfachen Skalenwechsel, den man durch Multiplizieren aller Zahlen einer Zahlenmenge mit dem Faktor 2 erhält. Zahlen mit der ersten signifikanten Ziffer 1 werden dadurch zu Zahlen, deren erste signifikante Ziffer entweder 2 oder 3 ist. Man kann leicht nachweisen, dass Folgendes gilt:B(1) = B(2) + B(3). Tatsächlich ist


Rendered by QuickLaTeX.com

Gleichermaßen kann man nachweisen, dass ergibt B(2) = B(4)+B(5), etc.
Aber wie wird es gehandhabt, wenn man von Meilen zu Kilometern wechselt, d. h. die Zahlen der Menge mit dem Faktor 1,6 multipliziert? Das Benfordsche Gesetz ist, wie bereits erwähnt, zu restriktiv, so dass wir es verallgemeinern müssen. Was bedeutet es, dass die erste signifikante Ziffer einer Zahl gleich i ist? Dies besagt, dass die Mantisse m im Intervall [i, i + 1) liegt. Das Benfordsche Gesetz ist also eine Wahrscheinlichkeitsverteilung bzgl. der Mantisse. Das verallgemeinerte Benfordsche Gesetz (welches wir unter Sprachmissbrauch weiterhin Benforsches Gesetz nennen) ist auf der Mantisse durch eine Dichtefunktion auf dem Intervall [1, 10) gegeben. Für eine zufällig ausgewählte Zahl lässt sich ihre Mantisse berechnen. Dadurch ergibt sich eine Zufallsvariable M, deren Werte im Intervall [1, 10) liegen. Man sagt, sie folgt dem Benfordschen Gesetz, wenn ihre Dichtefunktion gegeben ist durch

    \[f(x) = \left\{ \begin{array}{ll} \frac{1}{x \log 10}, & x \in [1 , 10 ), \\ 0, & \mbox{otherwise.} \end{array}\right.\]

Sei P(a \leqslant M < b)  die Wahrscheinlichkeit für den Fall a \leqslant M < b, so erhalten wir folgende Formel:

    \[P( a \leqslant M < b ) = \int_a^b f(x) d x.\]

Es handelt sich also wirklich um eine Verallgemeinerung des Benfordschen Gesetzes, da gilt:


Rendered by QuickLaTeX.com

Was bedeutet es, wenn eine Zufallsvariable X aus [1,10) unter einem Skalenwechsel invariant ist? Es bedeutet, dass für eine positive reelle Zahl c und eine Zufallsvariable Y = cX die Matisse M der Zufallsvariablen Y dieselbe Dichtefunktion besitzt wie X. Man kann leicht zeigen, dass dies gilt, wenn X dem Benfordschen Gesetz folgt, aber man muss abhängig von c einige Fälle unterscheiden. Wir werden hier exemplarisch einen Fall behandeln. Die Zahl c lässt sich schreiben als c = m 10^r mit der Mantisse m \in [1, 10) von c. Da die Mantisse von cX dieselbe ist wie die von mX, genügt es den Fall c \in [1, 10) zu betrachten.
Mit welchem Hilfsmittel lässt sich dies zeigen? Eventuell kann man sich (aufgrund der zurückliegenden Wahrscheinlichkeitsrechnung) daran erinnern, dass sich für eine stetige Zufallsvariable die (kumulative) Verteilungsfunktion manchmal als hilfreicher erweist als die Dichtefunktion. Die Verteilungsfunktion einer Zufallsvariable M ist definiert als

    \[F(x) = P(M \leqslant x).\]

Wenn Xdem Benfordschen Gesetz folgt, dann wird seine Verteilungsfunktion beschrieben durch

(1)   \begin{eqnarray*} F(x) = \left\{ \begin{array}{ll} 0, & x < 1, \\ \log_{10} x, & x \in [1 , 10), \\ 1, & x \geqslant 10. \end{array}\right. \end{eqnarray*}

Wir müssen also zeigen, dass die Verteilungsfunktion von M durch Formel (1) genau dann gegeben ist, wenn X dem Benfordschen Gesetz folgt und M die Mantisse von cX für c \in [1, 10) ist.

Dafür müssen wir die Wahrscheinlichkeit P(M \leqslant z) für z \in [1, 10] berechnen. M ist die Mantisse von cX, deren Werte innerhalb [c, 10c) liegen. So ergibt sich M = cX für cX < 10 und cX / 10 für cX \geqslant 10.
Im ersten Fall ist z < c. Die einzige Möglichkeit dafür, dass die Mantisse von cX im Intervall [1, c) liegt, ist cX \in [10, 10c]. Dann ist die Mantisse von cX gleich cX / 10.
Daher gilt, wie erwartet,


Rendered by QuickLaTeX.com

Die anderen Fälle werden analog berechnet.
Die Umkehrung ist spannender …

2. Das Benfordsche Gesetz ist das einzige Wahrscheinlichkeitsgesetz bzgl. der Mantisse, welches invariant unter einem Skalenwechsel ist

Dies scheint eine beeindruckende Aussage zu sein! Jedoch wird man sehen, dass der Beweis dafür nicht komplizierter ist als der vorige. Es sei X eine Zufallsvariable, die die Mantisse repräsentiert und Werte aus dem Intervall [1, 10) besitzt. Wir betrachten ihre Verteilungsfunktion F(x) unter der Annahme, dass X bei einem Skalenwechsel invariant ist. Wir müssen also Folgendes berechnen:

    \[F(x) = P(X \leqslant x) = P(1 \leqslant X \leqslant x).\]

Daher muss F(0) = 0 und F(10) = 1 gelten.
Die größte Schwierigkeit des Beweises besteht in der Deutung der Tatsache, dass X bei einem Skalenwechsel invariant ist. Da 1 \leqslant X \leqslant x und c \leqslant cX \leqslant cx die gleichen Zufallsereignisse sind, ergibt sich

(2)   \begin{eqnarray*} P(1 \leqslant X \leqslant x) = P(c \leqslant cX \leqslant cx) = F(x). \end{eqnarray*}

Betrachten wir wie vorhin den Fall einer beliebigen Zahl c \in [1, 10) mit cx < 10 (wobei c abhängig von x ist). Dann ist der Wert cX für c \leqslant cX \leqslant cx gleich der Mantisse. Da X bei einem Skalenwechsel nach Voraussetzung invariant ist, folgt die Mantisse von cX derselben Verteilungsfunktion wie X. Also gilt

    \[P(c \leqslant cX \leqslant cx) = F(cx) - F(c).\]

Kombiniert mit Formel (2) erkennt man, dass F(x) unter der Vorraussetzung, dass c \in [1, 10) nicht zu groß ist, Folgendes erfüllt:

(3)   \begin{eqnarray*} F(x) = F(cx) - F(c),~~~ F(1) = 0,~~ F(10) = 1. \end{eqnarray*}

Wir müssen also F anhand der funktionalen Gleichung (3) bestimmen. Wie funktioniert das?
Sei hierfür c = 1 + \varepsilon, so ergibt sich

    \[F(x) = F(x(1 + \varepsilon)) - F(1 + \varepsilon)\]

was man wegen F(1) = 0 auch schreiben kann als

    \[\frac{F(x(1 + \varepsilon)) - F(x)}{x \varepsilon} = \frac{F(1 + \varepsilon) - F(1)}{x \varepsilon},\]

Betrachten wir den Grenzwert für \varepsilon \longrightarrow 0. Auf jeder Seite der Gleichung muss man einen Quotienten erkennen, dessen Grenzwert eine Ableitung ist: Auf der linken Seite haben wir \frac{F(x + x \varepsilon) - F(x)}{x \varepsilon} was im Grenzfall zu F'(x) wird, und auf der rechten \frac{F(1 + \varepsilon) - F(1)}{\varepsilon}, was gegen F'(1) geht. Daher erhält man die Differentialgleichung,

    \[F'(x) = \frac{F'(1)}{x},\]

die die Trennung der Variablen erlaubt und deren Lösung durch F(x) = F'(1) \ln x + C beschrieben wird. Wegen F(1) = 0 ergibt sich C = 0 und aus F(10) = 1 folgt F'(1) = \frac{1}{\ln 10}. Schließlich erhalten wir F(x) = \frac{\ln x}{\ln 10} = \log_{10} x und sind fertig!

3. Warum folgen Zahlen verschiedenster Quellen dem Benfordschen Gesetz?

Theodore Hill gab darauf im Jahr 1995 eine Antwort, die im Folgenden kurz erläutert wird. Selbstverständlich folgen nicht alle Zahlenmengen dem Benfordschen Gesetz. Wenn man beispielsweise die Körpergröße von Menschen in Metern betrachtet, dann erscheinen – bis auf ein paar Ausnahmen – als erste signifikante Ziffer nur die 1 und 2, und wenn man die Größe in Fuß umrechnet (ein Fuß beträgt ca. 30 cm), ändert sich das Verteilungsgesetz der ersten signifikanten Ziffer. Also verhält sich diese Menge von Zahlen bei einem Skalenwechsel nicht invariant. Angenommen aber, wir betrachten eine große Menge von Zahlen aus beliebigen Quellen und ändern die Skala, dann haben verschiedene Teilmengen jeweils ihre (eigene) Skala. Da die Zahlenmenge groß ist und die Zahlen von aus beliebigen Quellen stammen, so sind vermutlich alle verschiedenen Skalen vorhanden. Werden nun alle Zahlen der Menge mit einer positiven Konstanten multipliziert, so erzeugt dies (lediglich) eine Permutation der Skalen, die in der neuen Menge enthalten sind. Insgesamt kann man also davon ausgehen, dass die Zahlenmenge sich so verhält, als würde ihr keine spezielle Skala zugrundeliegen. Sie folgt daher dem Benfordschen Gesetz.

Diese Erklärung besitzt Gültigkeit für Zahlenmengen, die sich aus allen möglichen Quellen zusammensetzen. Jedoch gibt sie keine Antwort darauf, warum Länderflächen, Bevölkerungszahlen von Ländern oder Längen von Flüssen dem Benfordschen Gesetz folgen. Für diese Fälle werden hier neueste Erklärungen (2008!) von Gauvrit, Delahaye und Fewster angeführt; Sie gelten auch für große Zahlenmengen beliebiger Herkunft.

4. Zahlenmengen, die sich über mehrer Zehnerpotenzen erstrecken, folgen wahrscheinlich dem Benfordschen Gesetz!

Wir arbeiten im Dezimalsystem, also mit Basis 10, und konnten feststellen, dass sich positive Zahlen x darin als x = m 10^n mit m \in [1, 10) und n \in \mathbb{Z} schreiben lassen. Wir könnten n als Zehnerpotenz auffassen und behaupten, dass verschiedene Zehnerpotenzen existieren, wenn für unsere Menge von Zahlen verschiedene Werte von n vorhanden sind. (Beachte, dass diese Eigenschaft bei einem Skalenwechsel invariant ist!) Um die Erklärung zu vereinfachen, nehmen wir an, dass die betrachteten Zahlen x im Intervall [1, 10^6) liegen. Dann lässt sich die Menge der Zahlen mit signifikanter Ziffer 1 beschreiben als:

    \[S_1 = [1, 2) \cup [10,20) \cup [100,200) \cup [1000, 2000) \cup [10^4 , 2 \times 10^4 ) \cup [10^5 , 2 \times 10^5),\]

Für die anderen Ziffern i ergeben sich änliche Mengen S_i.
Es ist nun von Vorteil, auf den Zehnerlogarithmus dieser Zahlen x überzugehen: y = \log_{10} x. Dann ergibt sich (wegen x=m10^n) y = \log_{10} m + n. Wir zeigen nun, dass die Zufallsvariable Z = \log_{10} M im Intervall [1, 1) einfach gleichverteilt ist, wenn die Zufallsvariable M im Intervall [1, 10) dem Benfordschen Gesetz folgt. Es genügt zu zeigen, dass die Verteilungsfunktion von Z der Verteilungsfunktion einer gleichverteilten Zufallsvariablen auf [1, 1) entspricht, nämlich

    \[F(z) = \left\{ \begin{array}{ll} 0, & z < 0, \\ z, & z \in [0 , 1), \\ 1, & z \geqslant 1. \end{array}\right.\]

Tatsächlich erhält man, wenn z \in [0, 1),

    \[P(Z \leqslant z) = P(0 \leqslant \log_{10} M \leqslant z) = P(1 \leqslant M \leqslant 10^z) = \log_{10} 10^z = z.\]

Wenn X zur Menge S_1 gehört, dann gehört Y zur Menge T_1 = \log_{10} S_1:


Rendered by QuickLaTeX.com

Ähnliches gilt für die anderen Ziffern.

Angenommen, eine beliebige Zahl aus unserer Menge zu nehmen, ist eine Zufallsvariable X, deren Werte innerhalb [1, 10^6) liegen. Dann liegen die Werte von Y = \log_{10} X im Intervall [0 , 6). Erinnern wir uns, dass die Wahrscheinlichkeit, dass irgendeine Zufallsvariable zu irgendeiner Menge gehört, gleich ist zur Fläche unter dem Graphen der Dichtefunktion einer Menge. Wenn die Dichtefunktion f von Y über [0 , 6) gleichverteilt wäre wie in Abbildung 3 (a), dann wären wir fertig. Viel häufiger verhält es sich aber anders, wie in Abbildung 3 (b) zu sehen ist. Daher ist es so wichtig, dass sich die ursprüngliche Zahlenmenge über mehrere Zehnerpotenzen erstreckt.
Die verschiedenen Teilbereiche, die einer vorgegebenen ersten signifikanten Ziffer i entsprechen, überspannen verschiedene Abschnitte, deren Längensumme von der Größenordnung \log_{10} (1 + \frac{1}{i}) bzgl. der gesammten Breite ist.
Selbst wenn also die Höhe von f(x) vom einen zum nächsten Abschnitt nicht gleich bleibt, so kann man dennoch hoffen, dass die durchschnittliche Höhe für die verschiedenen Ziffern von der gleichen Zehnerpotenz ist. Ist dies der Fall, so folgen die Werte dem Benfordschen Gesetz.

(a) Dichtefunktion f gleichverteilt
(b) Dichtefunktion f nicht gleichverteilt
Abbildung 3: Die Flächen, die den Häufigkeiten der ersten signifikanten Ziffern 1, 2, 3, und 4 für zwei verschiedene Dichtefunktionen von Y entsprechen. Die Werte der entsprechenden sind in Abbildung 4 graphisch dargestellt.

(a) Dichtefunktion von f
(b) Bereiche unter der Kurve für die signifikante Ziffer 1 und für die gleichverteilte Funktion
Abbildung 4: Die Flächen, die den Häufigkeiten der ersten signifikanten Ziffern 1, 2, 3 und 4 für die Dichtefunktion von Abbildung 3 (b) entsprechen. Auf der rechten Seite kann man sehen, dass diese Werte denjenigen ziemlich nahe kommen, die durch das Benfordsche Gesetz erreicht werden im Fall einer gleichverteilten Dichtefunktion für Y.

5. Wie kann man überprüfen, dass eine Zahlenmenge dem Benfordschen Gesetz folgt?

Wenn man einen Statistikkurs besucht hat, dann kennt man wahrscheinlich auch den \chi^2-Test als Anpassungstest. Mit dieser Methode kann man überprüfen, ob Daten auf irgendeine Weise stochastisch verteilt sind. Angenommen, man möchte den Test mit einer Menge von n Zahlen durchführen. Dann muss man hierfür nur eine Tabelle aufstellen, in der n_i für die Anzahl der Zahlen der Menge steht, die die erste signifikante Ziffer i besitzen.
Selbstverständlich gilt n = n_1 + ... + n_9. Ferner sei N_i die Anzahl derjenigen Zahlen, die i als erste signifikante Ziffer haben sollten, wenn die genannte Zahlenmenge dem Benfordschen Gesetz folgt, nämlich N_i = nB(i).


Rendered by QuickLaTeX.com

Tabelle 2: Tabelle für den \chi^2-Anpassungstest.

Man berechnet dann

    \[\chi^2 = \sum \limits_{i=1}^9 {\frac{(n_i - N_i)^2}{N_i}},\]

und schlägt in einer Tabelle zur Chi-Quadrat-Verteilung die Zeile nach, in der die Werte für 8 Freiheitsgrade eingetragen sind. Wenn man den Test mit einem Signifikanzniveau von 5% durchführt, dann nimmt man an, dass sich die Daten nach dem Benfordschen Gesetz verteilt sind, wenn \chi^2 < 15.51 ist; andernfalls weist man die Annahne zurück. Es handelt sich dabei um ein schnelles Rezept, aber wenn man solch einen Test mit Lernenden durchführt, sollte man sich einige Zeit nehmen, um sie mit den Einzelheiten des Tests und ihrer Bedeutung vertraut zu machen.

6. Invarianz des Benfordschen Gesetzes beim Wechsel der Basis

Diesen Fall kann man in einer ähnlichen Weise behandeln wie die Invarianz beim Skalenwechsel. Allerdings ist er etwas kniffliger, da man die Argumentation nicht auf die Mantisse beschränken kann. Wenn x = m 10^n ist, dann muss der Teil 10^n tatsächlich auf die neue Basis überführt werden. In der Tat besteht die größte Schwierigkeit darin, in mathematischen Begriffen zu beschreiben, was es für eine Zufallsvariable bedeutet, unter Basiswechsel invariant zu sein. Wir überspringen jedoch die Details.

7. Fazit

Das Benfordsche Gesetz ist faszinierend: Es widersetzt sich der Intuition, man kann selbst damit Tests durchführen und es auch für Unterrichtsaktivitäten eingesetzen. Früher wurde es als Kuriosum behandelt, aber heute zählt es zu den Standardmitteln, um Betrug aufzuedecken. Sicherlich lernen immer mehr Steuerhinterzieher daraus. Aber man sollte vorsichtig sein: Die erste signifikante Ziffer ist nicht das einzige, wovor man sich in Acht nehmen sollte. Das verallgemeinterte Benfordsche Gesetz erlaubt es, auch Regeln für die zweite signifikante Ziffer, die dritte etc. ableiten. Man kann versuchen, es selbst herauszufinden: man muss nur überlegen, in welchen Intervallen bzw. deren Vereinigung die Mantisse von Zahlen erscheinen/sein soll, so dass die zweite signifikante Ziffer i ist.

This entry was posted in Vignettes @de. Bookmark the permalink.

Leave a Reply

Your email address will not be published. Required fields are marked *