Quando a lógica parece enganar – Parte II

Escher-Big

 

Na primeira parte discuti e resolvi o Problema de Monty Hall e dois outros problemas semelhantes, o Problema dos Três Prisioneiros e o Paradoxo da Caixa de Bertrand. No final deixei-vos dois problemas, os quais passo a analisar.

 

O Problema dos Pontos, também conhecido como o problema do jogo incompleto, foi resolvido por Fermat, ainda que tenha sido estabelecido muito antes por Luca Pacioli (o matemático amigo de Leonardo da Vinci, que referi no artigo sobre o número de ouro, 1445-1517). Blaise Pascal (1623-1662) também o tentou resolver, falhou e por isso pediu a ajuda a Pierre de Fermat (1601-1665). Apesar de ser um problema que tenha ludibriado alguns matemáticos, é bastante simples, como vão ver.

Imaginem que duas pessoas estão a jogar um jogo que consiste em lançar um dado, um aposta que sai número par, o outro aposta que sai número ímpar (50% de hipóteses para cada um). O jogo é composto por várias “rodadas” (rounds), quem ganhar três primeiro, fica com o prémio. Contudo, os jogadores têm que interromper o jogo quando um deles ainda só ganhou 2 rounds e o outro ganhou 1. Qual a forma justa de dividir o prémio?

Pascal e outros pensaram erradamente que se deveria dividir 2 para 1, ou seja, o prémio seria dividido em três partes, em que o que ia à frente no jogo levaria dois terços do prémio, enquanto que o outro ficaria com um terço. A justificação para esta divisão consistia em ter em conta o que cada um já tinha ganho. Coincidia também com o raciocínio de pensar que só havia três cenários no futuro: (1) o que ia à frente (jogador A) ganhava o jogo e por isso ganhava o prémio; (2) o jogador que só tinha ainda ganho um jogo (jogador B) ganhava dois jogos consecutivos e por isso ganhava o prémio; (3) o jogador B ganhava o próximo jogo, mas não ganhava o último, pelo que o jogador A ficava com o prémio. Assim, como dois dos três cenários beneficiavam o jogador A, este deveria levar 2/3 do prémio, ficando 1/3 para o jogador B.

O raciocínio de cima está errado porque falta considerar um cenário: o jogador A ganhar dois jogos seguidos. Naturalmente, poderão pensar: “mas esse cenário não importa, porque se ganha o primeiro jogo, já não tem que jogar o seguinte”. De facto assim é, no entanto isso não invalida que o cenário exista.

No entanto, a melhor forma de pensar é usar o mesmo raciocínio que se usou para resolver o Problema de Monty Hall na parte I:

A probabilidade de o jogador B ganhar o prémio é igual à probabilidade de ganhar os dois jogos seguintes, isto é, (½) x (½) = ¼. Consequentemente, a probabilidade do jogador A ganhar o prémio é a restante: ¾ (que corresponde à soma da probabilidade de ganhar o primeiro jogo, ½, mais a probabilidade de perder o primeiro e ganhar o segundo, (½) x (½) = ¼, ou seja, ½+¼=¾).

Esta resolução de Fermat foi absolutamente revolucionária para a Matemática (e para a Ciência em geral): Fermat partiu da hipótese de que o futuro nada tem de diferente em relação ao presente ou ao passado. Se em probabilidades estamos habituados a contar casos possíveis, não importa se estes são do passado ou do futuro: as leis devem ser as mesmas! (Até porque um determinado futuro acabará por ser passado…) O futuro deixava então de ser do domínio de “Deus”, para poder ser algo previsível, estando diferentes futuros associados a diferentes probabilidades (ainda que só um acabasse por se verificar, podendo mesmo ser aquele de menor probabilidade). Esta revolução na forma de pensar esteve na base do estabelecimento da Teoria de Probabilidades por Christian Huygens em 1657.

 

Pierre-de-Fermat-imagem-6

 Pierre de Fermat foi um dos mais importantes matemáticos do século XVII. Isaac Newton, que é conhecido pela invenção do Cálculo (além de tudo o resto), escreveu que o seu método era baseado no método de Fermat para obter tangentes. Fermat interessava-se principalmente por Teoria de Números, na qual propôs o conhecido “Último Teorema de Fermat” (o “Santo Graal” da Matemática), que só foi resolvido em 1995 por Andrew Wiles. Estão a ver o Teorema de Pitágoras? Imaginem que em vez dos quadrados nos catetos e hipotenusa, colocam um número ‘n’. Fermat escreveu a proposição que afirma que não existe nenhum conjunto de números inteiros (para todas as variáveis envolvidas) que satisfaça a equação para ‘n’ maior que 2. O teorema foi escrito nas margens de um livro de Matemática que Fermat estudou, ao qual acrescentou que não tinha espaço naquelas margens para escrever a demonstração. Resta saber se efectivamente Fermat conseguiu mesmo fazer a demonstração, ou se se tratou apenas de uma conjectura de génio. (Note-se que a demonstração de Wiles é extremamente elaborada e conecta várias áreas avançadas da Matemática que só surgiram no século XX, pelo que se Fermat conseguiu mesmo fazer a demonstração, provavelmente fê-la de forma diferente.)

 

 

O outro problema que tinha proposto na parte I era o seguinte:

Imaginem que lançam uma moeda ao ar: pode sair cara (X) ou coroa (Y). Se lançarem a moeda repetidamente ao ar obtêm um sequência: X Y Y X Y X Y X X X Y …, por exemplo. A questão é: se contarem o número de vezes que sai o padrão XYY (cara, seguido de coroa e depois outra coroa) e compararem com o número de vezes que sai o padrão XYX (cara, coroa, cara), qual deles é maior? Sai um número de vezes igual?

A resposta usual e que está errada é que sai o mesmo número de vezes. Se a sequência de cara ou coroa fosse dividida em grupos de três, efectivamente cada tipo de padrão tinha a mesma probabilidade de ocorrer: uma dada face da moeda tem ½ de probabilidade de ocorrer, pelo que uma dada sequência de três tem ½ x ½ x ½ = 1/8 de probabilidade de ocorrer, independentemente de qual seja a sequência. Há, porém, uma diferença crucial no problema de cima: a sequência não é dividida em grupos de 3! Isto significa que podem existir sobreposições de padrões. Por exemplo, a sequência XYXYX (que só tem 5 faces) contém dois padrões XYX. O mesmo tipo de sobreposição já não é possível no padrão XYY: para terem dois padrões destes têm que ter pelo menos 6 faces! Isto implica que o padrão XYX, que se auto-sobrepõe, aparece em média mais vezes numa sequência. Se não estão convencidos, podem fazer a experiência: lancem uma moeda ao ar umas 100 vezes, e registem de cada vez se saiu cara ou coroa. Depois contem os números de padrões XYX e XYY. (Se aumentarem o número de lançamentos, a diferença deverá tornar-se mais clara.)

 

O último problema que vos quero deixar está relacionado com a “Falácia do Procurador”. Imaginem que para uma doença existe um teste que serve para verificar se uma qualquer pessoa tem a doença. O resultado do teste é verdadeiro em 99% das vezes. A questão é então: se testarmos uma pessoa escolhida aleatoriamente e o resultado der positivo (a pessoa tem a doença), qual a probabilidade de o resultado estar errado?

A questão parece quase idiota, porque parece que o enunciado responde à questão, isto é, a probabilidade é 1%.  Mas não! Na verdade, sem vos dar mais informações, não podem responder à questão. Precisam de saber quão provável é que uma pessoa escolhida aleatoriamente tem efectivamente a doença!

Suponhamos que a doença tem uma incidência de 1 pessoa em cada 10 mil. Neste caso, é extremamente improvável encontrar uma pessoa com a doença; a probabilidade é de 1 em 10 mil, obviamente, ou seja, 0.01%. É na verdade mais provável que o teste dê errado do que encontrar alguém com a doença… Como pesar as duas hipóteses? Convém começar por definir correctamente a própria questão: qual a probabilidade de o teste dar positivo e a pessoa ter a doença? Não podemos multiplicar as probabilidades, como faríamos com acontecimentos independentes (ver como calcular probabilidades), porque existe uma correlação clara entre as duas situações.

Sem perda de generalidade, consideremos que testamos uma população de 1 milhão de pessoas. Destas, em média, temos 100 pessoas com a doença (1 milhão x 1/10.000). Fazendo o teste a todas as pessoas, sabemos que em 99% das vezes o teste irá acertar, ou seja, das 999.900 que não têm a doença, o teste irá afirmar que 99% não têm a doença, ou seja, 989901, e irá dizer que as restantes 9999 têm a doença (ainda que não a tenham). Além destes, testam-se também as 100 pessoas que efectivamente são doentes, e como o teste acerta em 99% das vezes, irá estipular que 99 pessoas têm a doença, e um dos doentes será incorrectamente diagnosticado como saudável.

Assim, usando a definição de probabilidade (ver o artigo sobre como calcular a probabilidade de ganhar o € milhões), o número de casos favoráveis à hipótese de que o teste disse que o sujeito tinha a doença e o sujeito tinha mesmo, é 99. O número de casos possíveis inclui todas as vezes que o teste deu positivo, apesar de o sujeito não ter a doença, ou seja, 99+9999=10098. Portanto, como a probabilidade é definida pelo número de casos favoráveis a dividir pelo número de casos possíveis, temos 99/10098=0.0098.

Isto significa que numa doença com incidência de 1 em cada 10 mil sujeitos, um teste que acerte em 99% dos diagnósticos irá acertar ao afirmar que uma pessoa tem a doença em apenas 0.0098 das casos (ou seja, menos de 1%)! Notar que se vos for diagnosticada uma doença rara, devem ter em consideração outros factores, tais como: têm outros sintomas da doença? Se sim, isso irá alterar por completo a probabilidade de vocês terem mesmo a doença… (Nota: em vez de considerarem 1 milhão de pessoas, podem usar um número N de pessoas no cálculo, e irão verificar que o resultado não depende de N, daí ter escrito “sem perda de generalidade”.)

Na falácia do procurador tem-se algo semelhante: quando o procurador acusa um indivíduo com base numa probabilidade que despreza, por exemplo, a probabilidade de o indivíduo ser inocente, incorre num erro de lógica sem se aperceber. Por exemplo, uma pessoa poderia ser acusada de fraude por ter ganho o euro milhões, visto que a probabilidade de ganhar é muito reduzida (consulte aqui essa probabilidade). Este argumento é claramente falacioso, porque tendo em conta que tanta gente joga, é natural encontrar pessoas que tenham ganho. De modo similar, um especialista poderá afirmar que um teste forense tem X de probabilidade de errar, o que faz com que a prova apresentada pareça definitiva (se X for reduzido, como é natural que seja). No entanto, se for a única prova, a probabilidade de o acusado ser culpado é diferente de a probabilidade de o teste estar certo, tal como no caso do teste da doença explicado em cima.

(Estes dois últimos problemas foram expostos pelo matemático Peter Donnelly num TED Talk, o qual recomendo verem, no qual ele dá o exemplo de uma mulher que foi injustamente acusada de assassinar os filhos exactamente por causa da falácia do procurador.)

 

animals-logic-think-thinker-thinking-cats-shrn176l.jpg

Tradução: “Todos os gatos têm quatro patas. Eu tenho quatro patas, logo sou um gato.” Esta falácia ilustra o facto de as implicações não funcionarem necessariamente em ambos os sentidos.

 

 

Marinho Lopes

Anúncios

One thought on “Quando a lógica parece enganar – Parte II

  1. Pingback: Índice de Artigos | Sophia of Nature

Deixe uma Resposta

Preencha os seus detalhes abaixo ou clique num ícone para iniciar sessão:

Logótipo da WordPress.com

Está a comentar usando a sua conta WordPress.com Terminar Sessão / Alterar )

Imagem do Twitter

Está a comentar usando a sua conta Twitter Terminar Sessão / Alterar )

Facebook photo

Está a comentar usando a sua conta Facebook Terminar Sessão / Alterar )

Google+ photo

Está a comentar usando a sua conta Google+ Terminar Sessão / Alterar )

Connecting to %s