Pesquisar este blog

domingo, 13 de março de 2011

Coincidências nem tão incríveis e verdadeiras

Tem circulado um e-mail pela internet mencionando a “incrível coincidência” - citada até na coluna do Ancelmo Góis, no jornal O Globo - de que, se você somar os dois últimos dígitos do ano que você nasceu com a idade que você irá fazer esse ano, a soma para todas as pessoas será 111. Que coincidência, não?

Vocês já pararam para pensar que, se todos os que já estavam vivos em 1988 fizessem a mesma conta naquele ano, encontrariam o valor 88? E que, se fizessem em 1999, encontrariam o valor 99? Prosseguindo para o futuro, todos encontrarão o valor 112 em 2012, 113 em 2013, e assim por diante. Ou seja, todo ano acontece tal “coincidência”, mas só ressaltaram esse ano por que a soma dá 111, que é um número considerado curioso.

O tal e-mail também menciona que 2011 é um ano chamado “money bag”, onde o mês de julho, que é o ápice do verão e mês de férias nos países do hemisfério norte, terá 5 sextas feiras, 5 sábados e 5 domingos, e que isso só acontece a cada 823 anos! Incrível, não? É fácil ver que isso não é verdade.

O calendário de um ano depende apenas de dois parâmetros: o dia da semana em que ele se inicia (segunda-feira, terça-feira, quarta-feira, etc.) e se o ano é bissexto ou não. Todos os anos que coincidam em relação a esses dois pontos terão calendários absolutamente iguais.

O ano de 2011 iniciou-se em um sábado, e não é um ano bissexto. Ou seja, se você abrir o calendário do Windows Explorer e fixar o mês em Janeiro, basta ir variando o ano até encontrar um outro ano cujo dia 1º de janeiro caia em um sábado, e verificar se o ano não é divisível por 4, o que o fará ser também um ano não bissexto. Você terá encontrado um ano com calendário idêntico ao de 2011.

Fazendo isso, é fácil ver que os anos de 2022, 2033, 2039, 2050 -  apenas para citar os primeiros que encontrei - possuem o calendário exatamente igual ao de 2011.

Pense bem antes de repassar e citar o conteúdo de tais e-mails. Faça uma análise mínima se o fato relatado é realmente inédito e, principalmente, verdadeiro. Especialmente vocês, da área de Estatística...

Provas de concursos: quando chutar

Imagine a cena: você está diante de uma prova objetiva do tipo “falso ou verdadeiro” onde uma resposta errada anula uma resposta certa. Na dúvida, é melhor chutar ou deixar em branco?  

Outro dia, eu estava conversando com um amigo meu psicólogo quando surgiu esta questão. Segui o discurso que já fiz algumas vezes para meus alunos da UERJ: a princípio, se você não tem a MÍNIMA idéia da solução da questão, tanto faz.

Para dar um exemplo, suponha que você não sabe 10 questões. Se você deixar todas em branco, vai ficar com nota zero nessas questões. Se chutar tudo, EM MÉDIA, você vai acertar cinco e errar cinco e, como uma questão certa anula uma errada, também vai ficar com zero. Essa é a lógica da regra: não premiar o chute.

Mas então qual a diferença prática entre deixar em branco ou chutar? Neste exemplo das 10 questões, o que ocorre é que, no primeiro caso, você tem CERTEZA que vai tirar zero. No segundo caso, você vai tirar zero EM MÉDIA (é o tão conhecido “valor esperado” em estatística), mas você pode ter a “sorte” de tirar +2, +4, +6, +8, ou até +10, ou o “azar” de tirar -2, -4, -6, -8, ou até -10. Em ambos os casos, quanto maior o lucro ou o prejuízo, menor a probabilidade.

Assim, você deverá proceder de acordo com o risco que queira correr. Se, por exemplo, seu objetivo é apenas não zerar a prova para não ser eliminado, então, se você souber algumas questões COM CERTEZA, assinale apenas essas e deixe as outras em branco. Você atingirá o seu objetivo sem correr riscos.  Entretanto, suponha agora que você não tem a mínima idéia de NENHUMA questão (por exemplo, você está fazendo uma prova de Russo...). Neste caso, você TEM que arriscar, senão vai ficar com zero e será eliminado.

Foi nesta segunda situação que esse amigo me desafiou com uma pergunta da qual não tinha me tocado ainda: “Tudo bem, mas QUANTAS questões eu chuto?”. Ao pensar no assunto, vi que a resposta não era tão trivial...

Comecei a enumerar as diversas possibilidades de quantidade de questões que poderiam ser assinaladas, considerando que as outras questões da prova seriam deixadas em branco. Calculei as notas possíveis em cada caso, e suas respectivas probabilidades. A tabela abaixo resume o resultado quando se chuta até 4 questões (deixo para meus alunos a tarefa de chegar a esses números, utilizando a distribuição binomial).

Nº de questões chutadas
Acertos
Erros
Nota
Probabilidade (em %)
Eliminado na prova?
0
0
0
0
100%
SIM
1
0
1
-1
50%
SIM
1
0
1
50%
NÃO
2
0
2
-2
25%
SIM
1
1
0
50%
SIM
2
0
+2
25%
NÃO
3
0
3
-3
12,5%
SIM
1
2
-1
37,5%
SIM
2
1
+1
37,5%
NÃO
3
0
+3
12,5%
NÃO
4
0
4
-4
6,25%
SIM
1
3
-2
25,0%
SIM
2
2
0
37,5%
SIM
3
1
+2
25,0%
NÃO
4
0
+4
6,25%
NÃO

Somando as probabilidades das opções de ser "eliminado" ou "não eliminado" em cada caso, chegamos aos resultados mostrados na tabela abaixo. Estendi os valores até N=10, embora não tenha detalhados todos esses cálculos acima.

Número de questões chutadas (N)
Probabilidade de ser eliminado
Probabilidade de NÃO ser eliminado
0
100%
0%
1
50%
50%
2
75%
25%
3
50%
50%
4
68,8%
31,2%
5
50%
50%
6
65,6%
34,4%
7
50%
50%
8
63,7%
36,3%
9
50%
50%
10
62,3%
37,7%

Veja que interessante: a chance de não ser eliminado chutando QUALQUER número impar de questões é sempre de 50%. Entretanto, ao escolher um número par de questões, suas chances são sempre menores do que 50%. Por que essa desvantagem para N par?

O que acontece é que, com N impar, você só tem duas possibilidades: tirar uma nota menor do que zero e ser eliminado, ou tirar uma nota maior do que zero e não ser eliminado. Cada uma dessas situações tem 50% de chances de ocorrer. Já com N par, há uma terceira opção: você tirar zero e  também ser eliminado. Essa última opção desbalanceia as chances a favor da eliminação. Isso me lembrou o caso da roleta, em que a chance de tirar um número vermelho ou preto NÃO é 50%, pois há um número neutro – o zero –  que tem cor verde.

O que acontece quando o número de questões chutadas cresce, para N par? A probabilidade de tirar uma nota igual a zero vai diminuindo, pois o zero só ocorre se você acertar exatamente metade das questões, e essa probabilidade diminui com o aumento de N. Por isso, a chance de não ser eliminado vai crescendo assintoticamente chegando, no limite quando N for infinito, a..... 50%! Apenas a título de ilustração, a probabilidade de não ser eliminado é de 48,7% para N=100 e de 49,6% para N=1000.

Portanto, a conclusão é: se o seu objetivo é apenas não tirar zero, e você não tem a mínima idéia de NENHUMA questão, então chute um número ímpar de questões, nunca um número par! Neste caso, suas chances de não ser eliminado serão de 50% (desculpem, mas não dá pra ser melhor do que isso sem estudar...). E outro ponto importante: chute o máximo número de questões que puder. Ou seja, se a quantidade de questões da prova for ímpar, chute todas e, se for par, chute todas menos uma.  Neste caso, suas chances de não eliminação continuarão as mesmas (50%), mas você estará, de brinde, concorrendo a tirar notas bem maiores do que zero, embora com probabilidades cada vez menores. Tudo bem que você também estará correndo o risco de tirar notas bem negativas, mas na situação considerada se você tirar -15, -7, -3 ou 0 estará eliminado do mesmo jeito, não?

Mas atenção: essa lógica de chutar o máximo de questões só vale para esse exemplo em que você não tem nada a perder, pois não sabe nenhuma questão e apenas não quer ser eliminado. Em situações mais comuns, onde existe um subconjunto de questões que você sabe, lembre-se que, ao aumentar o número de questões chutadas, estará colocando em risco esses pontos certos...

Agora, o melhor mesmo, óbvio, é você estudar para a prova, e não precisar chutar nenhuma questão, não é?


Qual é a probabilidade?

“Por que, em um grupo de pessoas tão pequeno, há mais de uma pessoa fazendo aniversário no mesmo dia?”

“Se a probabilidade de um avião cair é tão pequena, por que  de vez em quando sai uma notícia de um acidente aéreo de maiores proporções?”

“Por que raramente encontro o meu vizinho do andar de baixo na minha rua e fui me deparar com ele em outro continente?”

“Por que eu jogo na Mega-Sena há tantos anos, com várias combinações, e o ganhador do último prêmio foi um cara que apostou pela primeira vez com um único cartãozinho?”

Com certeza, já nos deparamos com algumas dessas perguntas e a resposta muitas  vezes é atribuída ao acaso, à sorte, ao zodíaco, ao fato de estarmos em um dia bom ou ruim ou a um sonho recente que tivemos.

As civilizações antigas muitas vezes atribuíam a ocorrência de eventos raros ao “desejo dos deuses”. Entretanto, estamos no século XXI e a Teoria da Probabilidade há algum tempo fornece elementos para estimarmos a possibilidade da ocorrência de eventos, a partir de algumas hipóteses básicas.  Assim, o principal objetivo do blog “Qual é a probabilidade?” é esclarecer melhor algumas dessas questões e tentar mostrar por que, muitas vezes, a realidade vai de encontro a nossa percepção intuitiva quanto à probabilidade de ocorrência dos fatos.

Você pode enviar perguntas e sugestões para o endereço andreldiniz@globo.com. As questões de interesse mais geral procurarei discutir nesse blog.