A Lei de Benford: aprendendo a fazer ou a detectar fraudes?

A autora original é Christiane Rousseau. A tradução para o Português é de Humberto José Bortolossi.
É muito arriscado ficar alterando números demais em relatórios financeiros se você não conhece matemática. De fato, a maioria dos números que aparecem em declarações financeiras seguem uma regra matemática estranha, denominada de Lei de Benford ou Lei do Primeiro Dígito Significativo. Se alguém se esquecer de seguir essa regra, então os números alterados não irão passar em alguns testes estatísticos e provavelmente eles cairão em uma malha fina. A Lei de Benford afirma que se você coletar números de forma aleatória e calcular as frequências de seus primeiros dígitos significativos, então os números com primeiro digito significativo igual a 1 aparecerão cerca de 30% das vezes, enquanto que os números com primeiro dígito significativo igual a 9 aparecerão somente 4.5% das vezes. Esta regra é observada em muitos outros conjuntos de números, como potências de 2 e os números de Fibonacci.

Por quê?

Existem explicações satisfatórias e iremos compartilhá-las com você.

A Lei de Benford trata da distribuição dos primeiros dígitos significativos de números. O primeiro dígito significativo de um número positivo é o dígito não nulo mais à esquerda em sua representação decimal. Por exemplo, o primeiro dígito significativo de \pi% é 3, o de 2371{,}5 é 2 e o de 0{,}00563 é 5. Uma outra maneira de defini-lo (e que será útil para nossa discussão matemática mais adiante) é escrever cada número real positivo x como um número m \in [1 , 9) vezes uma potência de 10:

    \[x = m 10^n ~ , ~~ n \in \mathbb{Z}.\]

Nesse contexto, o primeiro dígito significativo de x é a parte inteira de m, que será denotada por \lfloor m \rfloor. O número m é denominado mantissa de x. Afirmamos que se você coletar números de forma aleatória e calcular a frequência B(i) do primeiro dígito significativo i, então o valor de B(i) será dado aproximadamente por \log_{10} (1 + \frac{1}{i}). Isto nos dá a seguinte tabela de frequências:


Rendered by QuickLaTeX.com

Tabela 1: Frequências da Lei de Benford.

Figura 1: As frequências B(i) da Lei de Benford.

Antes de continuarmos, vamos fazer um breve comentário histórico. O fenômeno foi observado pela primeira vez pelo astrônomo Simon Newcombe (1835-1909), que notou que as primeiras páginas das tabelas de logaritmos correspondentes aos primeiros dígitos significativos pareciam menos numerosas se comparadas com as páginas seguintes. A descoberta de Newcombe foi esquecida e a lei foi redescoberta por Frank Benford (1883-1948) por volta de 1938. Frank Benford coletou dezenas de milhares de números de origens diversas, todos seguindo sua lei. O moderno banco de dados de Simon Plouffe que contém 215 milhões de constantes matemáticas também seguem a Lei de Benford.

Muitos conjuntos de números que não são aleatórios também seguem a Lei de Benford. Este é o caso de populações de países, de suas áreas, de comprimento dos rios, etc. Talvez você esteja ficando cético e queira que eu pare… Em quais unidades estes comprimentos e áreas foram coletados? Os comprimentos estão em milhas ou quilômetros? Isto não importa… Se os comprimentos dos rios em quilômetros seguirem a Lei de Benford, então os comprimentos em milhas também seguirão a Lei de Benford! Uma mudança de unidade corresponde a uma mudança de escala. Como veremos, a Lei de Benford é invariante por mudanças de escala. Mais ainda, ela é a única lei de probabilidade que é invariante por mudanças de escala.

Figura 2: Dados que seguem aproximadamente a Lei de Benford:: áreas de países em quilômetros quadrados, áreas de países em milhas quadradas e populações de países.

Na introdução desse texto eu havia mencionado que os números de Fibonacci seguem a Lei de Benford. Mas, de um certo modo, a Lei de Benford é subjetiva, uma vez que ela depende da base 10 na qual representamos nossos números. Em alguma base b com b \neq 10, os dígitos não nulos são os elemento do conjunto \{ 1, ... , b-1\}, e a Lei de Benford na base b diz que a frequência do primeiro dígito significativo i é B_b (i) = \log_b (1+\frac{1}{i}). Bem, os números de Fibonacci seguem a Lei de Benford em qualquer base b! A Lei de Benford é invariante por mudanças de bases. E é a única lei de probabilidade não trivial que é invariante por mudanças de bases.

Bem, chegou a hora das explicações. Você terá que lembrar alguns conceitos do seu curso de probabilidade. Mas talvez você prefira comprovar a Lei de Benford por si mesmo antes de começar a ler alguma matemática mais séria.

1. Invariância por mudanças de escala

Vamos considerar uma mudança de escala simples obtida multiplicando-se todos os números de um conjunto por 2. Se considerarmos os números com primeiro dígito significativo igual a 1, então eles são mudados para números com primeiro dígito significativo ou igual a 2 ou igual a 3. É fácil verificar que B(1) = B(2) + B(3). De fato,


Rendered by QuickLaTeX.com

Analogamente, vale que B(2) = B(4)+B(5), etc. Mas como faríamos, por exemplo, no caso uma conversão de milhas para quilômetros, isto é, no caso de multiplicarmos os números por 1{,}6? Do modo que está enunciada, a Lei de Benford é muito restritiva e precisamos generalizá-la. Qual é a definição do primeiro dígito significativo de um número m ser igual a i? Resposta: a mantissa de m deve pertencer ao intervalo [i, i + 1). Assim, a Lei de Benford é uma distribuição de probabilidade parcial da mantissa. A Lei de Benford Generalizada (a qual, por abuso de linguagem, continuaremos chamando de Lei de Benford) é descrita em termos uma função densidade no intervalo [1, 10). Quando escolhemos aleatoriamente um número, podemos calcular sua mantissa. Isto nos dá uma variável aleatória M que valores em [1, 10). Dizemos que ela segue a Lei de Benford se sua função densidade é dada por

    \[f(x) = \left\{ \begin{array}{ll} \frac{1}{x \log 10}, & x \in [1 , 10 ), \\ 0, & \mbox{caso contr\'ario.} \end{array}\right.\]

Se P(a \leqslant M < b) representa a probabilidade que a \leqslant M < b, então isto significa dizer que

    \[P( a \leqslant M < b ) = \int_a^b  f(x) d x.\]

Isso é realmente uma generalização da Lei de Benford, pois


Rendered by QuickLaTeX.com

O que significa dizer que uma variável aleatória X em [1, 10) é invariante por mudanças de escala? Reposta: significa dizer que se c é um número real positivo e se consideramos a variável aleatória Y = cX, então a mantissa M da variável aleatória Y tem a mesma função densidade que X. Não é difícil mostrar que este é o caso quando X segue a Lei de Benford, mas existem vários casos a considerar dependendo do valor de c. Veremos um caso aqui e deixaremos os demais casos para você. Podemos escrever c = m 10^r, com m \in [1, 10) a mantissa de c. Uma vez que a mantissa de cX é a mesma de mX, é suficiente considerar o caso em que c \in [1, 10). Qual é a ferramenta que mostrará isto? Você deve lembrar do seu curso de probabilidade que a função de distribuição (acumulada) é algumas vezes mais útil do que a função densidade para uma variável aleatória contínua. A função de distribuição (acumulada) de uma variável aleatória M é definida por

    \[F(x) = P(M \leqslant x).\]

Se X segue a Lei de Benford, então sua função de distribuição é dada por

(1)   \begin{eqnarray*} F(x) = \left\{ \begin{array}{ll} 0, & x < 1, \\ \log_{10} x, & x \in [1 , 10), \\ 1, & x \geqslant 10. \end{array}\right. \end{eqnarray*}

Agora devemos mostrar que se X segue a Lei de Benford e M é a mantissa de cX para c \in [1, 10), então a função de distribuição de M é dada por (1).

Para esse propósito, precisamos calcular P(M \leqslant z) para z \in [1, 10]. Note que M é a mantissa de cX a qual toma valores em [c, 10c). Assim, M = cX quando cX < 10 e cX / 10 quando cX \geqslant 10. O primeiro caso ocorre quando z < c. Para a mantissa de cX estar em [1, c), a única possibilidade é que cX \in [10, 10c]. Então, a mantissa de cX é igual a cX / 10. Portanto,


Rendered by QuickLaTeX.com

como esperado. Os outros casos são justificados de maneira análoga.

A recíproca é mais excitante…

2. A Lei de Benford é a única lei de probabilidade sobre a mantissa que é invariante por mudanças de escala

Esse é um enunciado impressionante! Ainda assim, você verá que sua prova não é muito mais complicada do que o argumento dado anteriormente. Seja X um variável aleatória representando a mantissa e tomando valores em [1, 10). Vamos considerar sua função de distribuição F(x), sob a hipótese que X ser invariante por mudanças de escala. Assim, precisamos calcular

    \[F(x) = P(X \leqslant x) = P(1 \leqslant X \leqslant x).\]

A função F deve satisfazer as condições F(0) = 0 e F(10) = 1. A dificuldade principal da prova está em interpretar o significado de dizer que X é invariante por mudanças de escala. Uma vez que 1 \leqslant X \leqslant x e c \leqslant cX \leqslant cx são os mesmos eventos, temos que

(2)   \begin{eqnarray*} P(1 \leqslant X \leqslant x) = P(c \leqslant cX \leqslant cx) = F(x). \end{eqnarray*}

Como antes, vamos considerar o caso em que c \in [1, 10) de modo que cx < 10 (c depende de x). Assim, para c \leqslant cX \leqslant cx, temos que cX é igual a sua mantissa. Uma vez que X é invariante por mudanças de escala, então a mantissa de cX tem a mesma função de distribuição que X. Portanto,

    \[P(c \leqslant cX \leqslant cx) = F(cx) - F(c).\]

Combinando esse resultado com (2), vemos que F(x) satisfaz

(3)   \begin{eqnarray*} F(x) = F(cx) - F(c),~~~ F(1) = 0,~~ F(10) = 1. \end{eqnarray*}

desde que c \in [1, 10) não seja muito grande. Devemos agora encontrar F que satisfaz a equação funcional (3). Vamos ver como fazer isso. Se fizermos c = 1 + \varepsilon, então

    \[F(x) = F(x(1 + \varepsilon)) - F(1 + \varepsilon)\]

ou, ainda,

    \[\frac{F(x(1 + \varepsilon)) - F(x)}{x \varepsilon} = \frac{F(1 + \varepsilon) - F(1)}{x \varepsilon},\]

uma vez que F(1) = 0. Vamos tomar o limite fazendo \varepsilon \longrightarrow 0. Devemos reconhecer em cada lado um quociente cujo limite é uma derivada. No lado esquerdo, o quociente \frac{F(x + x \varepsilon) - F(x)}{x \varepsilon} tem limite igual a F'(x) e, no lado direito, o quociente \frac{F(1 + \varepsilon) - F(1)}{\varepsilon} tende a F'(1). Assim, F deve satisfazer a equação diferencial de variáveis separáveis:

    \[F'(x) = \frac{F'(1)}{x},\]

cuja solução é F(x) = F'(1) \ln x + C. Uma vez que F(1) = 0, devemos ter C = 0, e uma vez que F(10) = 1, então F'(1) = \frac{1}{\ln 10}. Portanto, F(x) = \frac{\ln x}{\ln 10} = \log_{10} x, como queríamos!

3. Por que números coletados de todas as origens seguem a Lei de Benford?

Uma resposta foi dada por Theodore Hill em 1995. Iremos agora discutir brevemente a sua ideia. Naturalmente, nem todo conjunto de números segue a Lei de Benford. Por exemplo, se você considerar a altura de humanos em metros então, com poucas exceções, somente os primeiros dígitos significativos 1 e 2 irão ocorrer, e se você converter a altura em pés (um pé é aproximadamente igual a 30 cm), você mudará a lei de distribuição do primeiro dígito significativo. Assim, esse conjunto de números não é invariante por mudanças de escala. Mas, suponha que consideremos um conjunto grande de números vindo de todas as origens e que queiramos mudar a escala. Existem diferentes subconjuntos com sua própria escala particular. Uma vez que o conjunto é grande e os números vêm de todas as origens, quase todas as escalas diferentes estarão presentes. Se multiplicarmos todos os números do conjunto por uma constante positiva, isso induzirá uma permutação das escalas presentes no novo conjunto. Assim, como um todo, podemos esperar que o conjunto de números se comporte como se ele não tivesse uma escala especial. Portanto, ele seguirá a Lei de Benford.

Essa explicação é boa para conjuntos coletados de todas as origens. Mas ela não explica o porquê de áreas de países, populações de países ou comprimentos de rios seguirem a Lei de Benford. Vamos discutir explicações muito recentes (2008!) para esse caso dadas por Gauvrit, Delahaye e Fewster. Essas explicações também são válidas para conjuntos grandes de números coletados de todas as origens.

4. Conjuntos de números abrangendo várias ordens de magnitude são suscetíveis de seguirem a Lei de Benford!

Estamos trabalhando na base 10 e já vimos que números positivos x podem ser escritos na forma x = m 10^n, com m \in [1, 10) e n \in  \mathbb{Z}. Aqui n é a ordem de magnitude. Diremos que existem várias ordens de magnitude se existem vários valores de n para nosso conjunto de números. (Note que tal propriedade é invariante por mudanças de escala!) Para simplificar a explicação, suponha que os números estejam no intervalo [1, 10^6). Então, os números com primeiro dígito significativo 1 são aqueles que pertencem ao conjunto

    \[S_1 = [1, 2) \cup [10,20) \cup [100,200) \cup [1000, 2000) \cup [10^4 , 2 \times 10^4 ) \cup [10^5 , 2 \times 10^5),\]

com conjuntos análogos S_i para os outros dígitos i. É conveniente usarmos o logaritmo na base 10 destes números: y = \log_{10} x. Assim, y = \log_{10} m + n. Vamos mostrar que se uma variável aleatória M em [1, 10) segue a Lei de Benford, então a variável aleatória Z = \log_{10} M é simplesmente uniforme em [0, 10). Para isso, é suficiente mostrarmos que a função de distribuição de Z é aquela da variável aleatória uniforme em [0, 1), a saber,

    \[F(z) = \left\{ \begin{array}{ll} 0, & z < 0, \\ z, & z \in [0 , 1), \\ 1, & z \geqslant 1. \end{array}\right.\]

De fato, quando z \in [0, 1),

    \[P(Z \leqslant z) = P(0 \leqslant \log_{10} M \leqslant z) = P(1 \leqslant M \leqslant 10^z) = \log_{10} 10^z = z.\]

Se X pertence ao conjunto S_1, então y pertence ao conjunto T_1 = \log_{10} S_1:


Rendered by QuickLaTeX.com

com conjuntos análogos T_i para os outros dígitos i. Suponha que escolher um número aleatório em nosso conjunto seja uma variável aleatória X que toma valores em [1, 10^6). Então Y = \log_{10} X toma valores em [0, 6). Lembre-se que a probabilidade de alguma variável aleatória pertencer a algum conjunto é igual a área sob o gráfico da função densidade restrita a esse conjunto. Se a função densidade f de Y em [0, 6) fosse uniforme como na Figura 3 (a), nada haveria para ser feito. Contudo, nem sempre esse será o caso, como mostra a Figura 3 (b). Mas aqui está a importância do conjunto original de número abranger várias escalas de magnitude. As seções diferentes correspondentes a um dado primeiro dígito significativo i espalham-se horizontalmente sobre vários segmentos cuja soma dos comprimentos é da ordem de \log_{10} (1 + \frac{1}{i}) do comprimento total. Assim, mesmo que a altura de f(x) não seja a mesma de um segmento para outro, podemos esperar que a altura média seja da mesma ordem de magnitude para os dígitos diferentes. Quando isso ocorre, então os dados seguem a Lei de Benford.


(a) função densidade f uniforme
(b) função densidade f não uniforme
Figura 3: As áreas correspondentes às frequências dos primeiros dígitos significativos 1, 2, 3 e 4
para duas funções de densidade diferentes de Y. Os valores das áreas correspondentes estão indicados na Figura 4.


(a) função de densidade de f
(b) áreas sobre a curva para dígitos significativos de f e para a função uniforme
Figure 4: As áreas correspondentes às frequências dos primeiros dígitos significativos 1, 2, 3 e 4 para a função densidade da Figure 3(b).
No lado direito vemos que estes valores estão muito próximos daqueles obtidos pela Lei de Benford no caso de uma função de densidade uniforme para Y.

5. Como testar se um conjunto de números segue a Lei de Benford?

Se você fez um curso de estatística, então você provavelmente estudou o teste \chi^2. Este teste permite verificar se algum conjunto de dados segue alguma distribuição de probabilidade. Suponha que você queira fazer o teste com um conjunto de n números. Você precisa apenas construir uma tabela, na qual n_i representa o número de números em seu conjunto que possuem primeiro dígito significativo igual a i. Naturalmente, n = n_1 + ... + n_9. Na Tabela 2, N_i representa o número de números que teriam primeiro dígito significativo igual a i se seu conjunto seguisse a Lei de Benford, a saber, N_i = nB(i).


Rendered by QuickLaTeX.com

Tabela 2: A tabela para o teste \chi^2.

Feito isto, basta então calcular

    \[\chi^2 = \sum \limits_{i=1}^9 {\frac{(n_i - N_i)^2}{N_i}},\]

e verificar na tabela \chi^2 pela linha correspondente a 8 graus de liberdade. Caso você queira fazer um teste com 5% de erro, então você aceitará que o seu conjunto de dados satisfaz a Lei de Benford se \chi^2 < 15.51 e rejeitará esse fato caso contrário. Esta é uma receita rápida, mas caso você faça tais testes junto com seus estudantes, então gaste algum tempo para que eles se familiarizem com os detalhes do teste e o seu significado.

6. Invariância da Lei de Benford por mudanças de base

Isto pode ser modelado de maneira análoga ao que foi feito para a invariância por mudanças de escala. Contudo, a situação é mais delicada, uma vez que não podemos nos limitar a trabalhar apenas com a mantissa. De fato, se x = m 10^n, então a parte 10^n também precisa ser convertida para a nova base. E, certamente, a dificuldade principal é expressar em termos matemáticos o que significa uma variável aleatória ser independente por mudanças de base. Não faremos isso aqui.

7. Conclusão

A Lei de Benford é fascinante: ela desafia nossa intuição e é algo que você pode testar por si mesmo como adaptá-la em uma atividade em sala de aula. Pode parecer uma mera curiosidade, mas ela é agora usada como uma ferramenta para e detectar fraudes. Naturalmente, mais e mais sonegadores de impostos aprendem sobre ela. Mas, preste atenção: o primeiro dígito significativo não é a única coisa com a qual se é preciso preocupar. A Lei de Benford Generalizada permite obter uma lei para o segundo dígito significativo, para o terceiro dígito significativo, etc. Você pode tentar descobri-la sozinho: pense em quais uniões de intervalos a mantissa de um número deveria estar para que o seu segundo dígito significativo seja i.

This entry was posted in Vignettes @pt-br. Bookmark the permalink.

One Response to A Lei de Benford: aprendendo a fazer ou a detectar fraudes?

  1. Rafael says:

    Há um equívoco no que diz respeito à origem da observação do fenômeno objeto deste texto. Este afirma que “O fenômeno foi observado pela primeira vez pelo astrônomo Simon Newcombe (1835-1909), que notou que as primeiras páginas das tabelas de logaritmos correspondentes aos primeiros dígitos significativos pareciam menos numerosas se comparadas com as páginas seguintes.”

    Na realidade, o que ocorreu foi coisa diversa. Simon Newcombe percebeu que as tabelas de logaritmos apresentavam páginas mais desgastadas e sujas justamente nos primeiros números, por serem mais manuseadas nesta porção. Isto mostrou que o número 1 era o mais consultado, ao passo que o número 9 era o menos consultado pelas pessoas. Ora, sendo assim, era de se supor que os números menores estatisticamente apareciam mais vezes que os maiores por ocasião de fenômenos observados por quem utilizava a tabela, o que acabou sendo matematicamente confirmado incontáveis vezes.

Leave a Reply

Your email address will not be published. Required fields are marked *