A Lei de Bayes

the_thinker

A Lei de Bayes (ou Teorema de Bayes, ou Regra de Bayes) é um teorema fundamental em Probabilidade e Estatística. Segundo o matemático britânico Sir Harold Jeffreys (1891-1989), a Lei de Bayes “está para a Teoria de Probabilidades assim como o Teorema de Pitágoras está para a Geometria”!

Esta lei matemática permite calcular a probabilidade de um dado acontecimento ocorrer tendo em consideração informação que o condiciona. Por exemplo, sabendo que a prevalência da doença de Alzheimer aumenta com a idade, tal possibilita o uso do Teorema de Bayes para melhor estimar se um dado paciente tem ou não a doença consoante a sua idade. O teorema está na base da inferência bayesiana, que é uma ferramenta estatística crucial em análise de dados de variados géneros. É aplicado em muitas áreas, desde a Medicina, à Engenharia, passando por Economia, Desporto, Lei, entre outros.   

Thomas Bayes (1701-1761) foi um padre e matemático inglês que formulou um caso particular do teorema que hoje tem o seu nome. O trabalho de Bayes só foi publicado após a sua morte, tendo sido editado pelo matemático galês Richard Price (1723-1791). Não é claro o quanto terá Price contribuído para o resultado final. Alguns anos mais tarde, o matemático francês Pierre-Simon Laplace (1749-1827) reproduziu e desenvolveu os resultados de Bayes.

(Antes de prosseguir, talvez lhe seja útil recordar algumas noções básicas sobre probabilidades no artigo onde mostro como calcular a probabilidade de ganhar o euro milhões.)

Tal como acontece com muitos outros resultados importantes da Matemática, também este tem uma formulação bastante simples e concisa, não obstante as suas vastas consequências práticas e filosóficas. Seja P(A|B) a probabilidade condicional de um acontecimento A ocorrer dada a ocorrência passada de um outro acontecimento B. Segundo o Teorema de Bayes, temos que:

P(A|B) = \frac{P(B|A)\times P(A)}{P(B)}

onde P(B|A) é a probabilidade de B acontecer dada a ocorrência de A e P(A) e P(B) são as probabilidades de A e B acontecerem de forma independente, isto é, sem estarem condicionados pela ocorrência de outros acontecimentos.

Analisemos um exemplo simples para clarificarmos estas noções. Imagine que tenho quatro moedas em cada mão:  na esquerda tenho uma moeda de 1€ e três moedas de 2€, enquanto que na mão direita tenho duas moedas de 1€ e duas moedas de 2€. Todas as moedas têm uma igual probabilidade de me caírem das mãos. Deixo cair uma moeda de 2€. Qual a probabilidade desta moeda ter-me caído da mão esquerda?

A lógica diz-nos de imediato que a probabilidade da moeda me ter caído da mão esquerda deve ser superior a 50%, visto termos uma maior fracção de moedas de 2€ nesta mão (3/4) em comparação com a mão direita (2/4).

Usando a notação do teorema: A refere-se ao acontecimento de me cair uma moeda da mão esquerda; enquanto que B corresponde à queda de uma moeda de 2€. P(A) é 50%, pois, como disse, a probabilidade de cair uma moeda da mão esquerda é igual à probabilidade dela cair da mão direita. P(B) é a probabilidade de cair uma moeda de 2€, independentemente da mão. Como explicado no artigo supracitadoP(B) calcula-se da seguinte forma:

P(B)=0.5\times 0.75 + 0.5\times 0.5=0.625

O primeiro termo refere-se à possibilidade da moeda de 2€ ter caído da mão esquerda (50% de possibilidade de ser a mão esquerda), na qual 75% das moedas eram de 2€; o segundo termo corresponde à mão direita (50%), onde 50% das moedas eram de 2€.

Finalmente, falta-nos P(B|A) que é a probabilidade de cair uma moeda de 2€ sabendo que a moeda caiu da mão esquerda, ou seja, P(B|A) corresponde à fracção de moedas na mão esquerda (0.75). Aplicando o Teorema de Bayes:

P(A|B) = \frac{P(B|A)\times P(A)}{P(B)}=\frac{0.75\times 0.5}{0.625}=0.6

Este resultado pode ser confirmado, por exemplo, repetindo muitas vezes a “experiência” e medindo a frequência com que de facto a moeda caiu da mão esquerda ou da mão direita. Como expliquei no artigo sobre a Estatística das Sondagens, a Lei dos Grandes Números garante que a frequência com que um dado evento acontece tende para a probabilidade “teórica” do mesmo acontecer, à medida que aumentamos o número experiências.

Ainda se lembra do artigo em que lhe falei do Problema de Monty Hall? Convido-o a recordar o problema, pois o mesmo pode ser resolvido usando este teorema! De forma muito sumária: (i) você está num concurso no qual pode escolher uma de três malas fechadas, sendo que só uma delas contém um prémio; (ii) você escolhe uma das malas; (iii) o apresentador do concurso, que sabe onde se encontra o prémio, mostra-lhe que o prémio não está numa das outras duas malas e pergunta-lhe se depois de saber isso, você quer mudar de mala. A resposta contra-intuitiva é sim, é vantajoso mudar, porque a partir do momento em que uma mala é aberta, a outra que ficou fechada, e que você não escolheu no início, passou a ter 2/3 de probabilidade de conter o prémio! Quer tentar provar este resultado usando o Teorema de Bayes?

Se tentou é possível que tenha tropeçado na correcta definição dos acontecimentos A e B. É comum a maioria das pessoas terem dificuldade neste aspecto, portanto não se sinta desmotivado, caso não tenha conseguido chegar à solução.

O acontecimento A corresponde à escolha inicial da mala, na qual tem 1/3 de probabilidade de acertar naquela que tem o prémio (P(A)=1/3). Por sua vez, o acontecimento B refere-se à abertura de uma das outras malas que não contém o prémio. Se as malas estiverem numeradas de 1 a 3, e se você escolheu a mala 1, no acontecimento B temos a probabilidade do apresentador abrir a mala 2 ou a mala 3. O acontecimento B trata-se então da abertura específica de uma das outras malas (digamos a número 2). Existem três cenários possíveis: se o prémio estiver na mala 1, o apresentador irá abrir a mala 2 com 50% de probabilidade; se o prémio estiver na mala 2, a probabilidade do apresentador a abrir é nula; se o prémio estiver na mala 3, tal implica que o apresentador terá que abrir a mala 2. Isto traduz-se na seguinte expressão:

P(B)=\frac{1}{3}\times\frac{1}{2}+\frac{1}{3}\times 0+\frac{1}{3}\times 1=\frac{1}{2}

Cada cenário tem 1/3 de probabilidade de ocorrer, e cada um está associado a uma probabilidade diferente da mala 2 ser aberta pelo apresentador.

Finalmente, P(A|B) é a probabilidade do prémio estar na mala que se escolheu inicialmente, atendendo a que não estava numa das outras malas, enquanto que P(B|A) é a probabilidade do apresentador escolher uma das duas malas atendendo que o prémio está na mala escolhida por você (50%). Portanto:

P(A|B) = \frac{P(B|A)\times P(A)}{P(B)}=\frac{0.5\times 1/3}{0.5}=\frac{1}{3}

Por sua vez, podemos também calcular a probabilidade do prémio estar na outra mala. Por serem acontecimentos complementares, deduz-se de imediato que esta probabilidade tem que ser 2/3 (isto é, a soma desta probabilidade com P(A|B) tem que ser igual a 1). Este resultado também pode ser obtido usando o Teorema de Bayes:

Seja C o acontecimento em que o prémio está na outra mala. Como deverá ser claro, de forma independente, no início, P(C)=P(A)=1/3. A probabilidade P(B) continua a ser a mesma. P(C|B) é a probabilidade que queremos encontrar, isto é, a probabilidade do prémio estar na “outra mala” (não escolhida), após a abertura de uma das malas pelo apresentador. Por sua vez, P(B|C) é a probabilidade de se abrir uma das “outras” malas atendendo que o prémio está numa delas. Como referido em cima, neste caso o apresentador só tem uma opção, portanto P(B|C)=1.

P(C|B) = \frac{P(B|C)\times P(C)}{P(B)}=\frac{1\times 1/3}{0.5}=\frac{2}{3}

Como P(C|B) é maior que P(A|B) isto implica que é mais provável acertar-se na mala com o prémio caso alteremos a nossa escolha quando o apresentador nos dá essa opção.

Um outro exemplo da aplicação do teorema pode ser feito para resolver a Falácia do Procurador. Neste caso, a Lei de Bayes permite corrigir a probabilidade de, por exemplo, um dado exame médico dar um resultado positivo, dada a sua dependência com a população no qual é usado (isto é, a probabilidade desta população ter de facto a condição médica em causa). Deixo-lhe o desafio de analisar o problema presente nesse artigo e resolvê-lo usando este teorema.

 

Os exemplos são na verdade inúmeros: à medida que o tempo passa, o futuro possível transforma-se num passado determinado, o que implica que as probabilidades presentes sobre eventos futuros vão-se alterando em função do que de facto vai acontecendo. Assim, a Lei de Bayes estabelece a base matemática para calcular as correcções probabilísticas que ocorrem a todo o momento.

 

stats

“O nosso especialista em estatística virá mais tarde para lhe explicar o porquê de não ter nada com que se preocupar.”

 

Marinho Lopes

Anúncios

5 thoughts on “A Lei de Bayes

  1. Pingback: Índice de Artigos | Sophia of Nature

  2. Olá, Marinho

    Ótimo tema e abordagem! As probabilidades regem nossa realidade (como bem reitera a mecânica quântica) e estão sempre presentes nas notícias, artigos, previsões climáticas, exames médicos e uma miríade de acontecimentos que nos cercam.

    Caminhando para o cerne de minha dúvida, gostaria de ressaltar o trecho do texto em que tu defines os eventos A e B. Nesta parte, tu afirmas:

    “(…) o acontecimento B refere-se à abertura de uma das outras malas que não contém o prémio. A dificuldade na definição deste acontecimento deve-se ao facto dele estar intrinsecamente dependente do acontecimento A”

    De onde compreendo que o evento B é dependente do evento A.
    Em posse das probabilidades, é possível concluir que P(A|B).P(B) = P(B|A).P(A) = P(A∩B) = P(A).P(B) = 1/6. Segue da definição de independência de dois eventos na teoria de probabilidades que A e B são independentes, isto é, a ocorrência de um não afeta a probabilidade do outro ocorrer.

    O que está ocorrendo aqui?

    Cumprimentos,

    • Olá Luc,

      Obrigado pelo seu comentário.
      Antes de mais devo fazer a ressalva de que é possível que ainda venha a rever melhor a forma como me expresso em algumas partes da resolução do Problema de Monty Hall, pois receio estar a induzir em erro em alguma parte.

      Isto que escreve: P(A∩B) = P(A).P(B) só é verdade se A e B forem independentes, o que, como digo, não são.

      Talvez se fizer o paralelismo com o exemplo das moedas se torne mais fácil de perceber. Nesse caso, para calcular P(B) tivemos que considerar a queda da moeda de 2€ de ambas as mãos. No caso do problema de Monty Hall, para calcular P(B) também temos que ter em consideração os vários cenários possíveis.

      Isto responde à sua dúvida?

      Cumprimentos,
      Marinho

  3. Reconheço que a forma como os valores das probabilidades em B são distribuídas dependem do evento A ou da escolha inicial. No entanto, insisto: no caso de apenas dois eventos aleatórios E e F, quando P(E∩F) = P(E).P(F), estes são ditos independentes. Sendo mais específico, poderia ir à definição dos eventos. Sendo M(i) o evento “o prêmio está na mala i (=1,2,3)”; então, dado que a mala 1 foi escolhida:
    P(B) = P(M1).P(B | M1) + P(M2).P(B | M2) + P(M3).P(B | M3) = 1/3 x 1/2 + 1/3 x 0 + 1/3 x 1 = 1/2
    Daí:
    P(M1 | B) = P(B | M1).P(M1) / P(B) = 1/3 x 1/2 / 1/2 = 1/3
    No entanto, é possível verificar que P(M1).P(B | M1) = P(M1∩B) = P(M1).P(B).
    Desse modo, M1 é dito independente em relação ao evento B. Isto é, o fato de M1 ocorrer (o prêmio está na mala 1) não altera a probabilidade de que a mala 2 seja escolhida. Por outro lado, também leva a conclusão de que o evento B ocorrer não altera a probabilidade de M1. De fato, isso o ponto central do Problema de Monty Hall: a probabilidade de que o prêmio esteja em sua opção é o mesmo antes e depois da revelação do apresentador, enquanto que a probabilidade de estar na outra mala se altera para 2/3, certo? Este último (P(M3 | B)), sim, se mostra categoricamente dependente. Da mesma forma, P(B | M3) também é dependente e compõe o evento B, tornando o dependente com respeito ao evento M3. Desse modo, o evento B poderia ser dito independente em relação ao evento M1, mas dependente em relação ao evento M3.

    • Olá Luc,

      O seu raciocínio parece-me perfeitamente correcto. Muito obrigado pela correcção.

      Vou eliminar a frase: “A dificuldade na definição deste acontecimento deve-se ao facto dele estar intrinsecamente dependente do acontecimento A.”

      Assim já não cometo nenhuma infracção, espero.

      Cumprimentos,
      Marinho

Deixe uma Resposta

Preencha os seus detalhes abaixo ou clique num ícone para iniciar sessão:

Logótipo da WordPress.com

Está a comentar usando a sua conta WordPress.com Terminar Sessão / Alterar )

Imagem do Twitter

Está a comentar usando a sua conta Twitter Terminar Sessão / Alterar )

Facebook photo

Está a comentar usando a sua conta Facebook Terminar Sessão / Alterar )

Google+ photo

Está a comentar usando a sua conta Google+ Terminar Sessão / Alterar )

Connecting to %s