Pesquisar este blog

quinta-feira, 29 de dezembro de 2011

O Sonho de Virar Milionário


Vai até o dia 31 de dezembro o prazo para apostar no último sorteio do ano da Mega-Sena, conhecido como a “Mega Sena da Virada”. Este concurso tem duas particularidades em relação aos demais: 1) o prêmio é muito maior, porque atrai um grande número de jogadores e é composto por arrecadações realizadas ao longo de todo o ano; 2) a regra do sorteio praticamente garante que haverá pelo menos um ganhador pois, caso ninguém acerte os seis números, o prêmio é rateado entre os acertadores da Quina e, na hipótese muito pouco provável de ninguém acertar a Quina, o prêmio é destinado aos ganhadores da Quadra.

Motivado por perguntas feitas por um aluno meu e por um leitor do blog, discuto neste post as chances de você ganhar o prêmio considerando também a possibilidade de ninguém acertar os 6 números e você fazer a Quina, e também a questão de como tentar diminuir as chances de dividir o prêmio.

Não há fórmula milagrosa para aumentar a probabilidade de ser premiado, como já vimos em posts anteriores.1 Um estudante de nível fundamental tem a mesma chance de ganhar que um doutor em Probabilidade e Estatística, desde que joguem um igual número de apostas. Isto ocorre porque qualquer combinação de 6 números possui a mesma probabilidade de ser sorteada, seja a trivial “1,2,3,4,5,6” ou, por exemplo, a combinação “2-13-21-34-45-56”. A chance de cada aposta simples de 6 números ser sorteada é de 1 em 50.063.860, ou aproximadamente 0,0000020%.

Com a regra da Mega-Sena da Virada, o cálculo das chances de você, com uma aposta simples, ganhar o prêmio destinado à Sena é diferente, pois há três eventos (utilizando o jargão estatístico) mutuamente excludentes2 em que isso pode ocorrer:

A) Você acertar a Sena
B) Você acertar a Quina e ninguém acertar a Sena
C) Você acertar a Quadra e ninguém acertar a Quina ou a Sena.

Já sabemos que a probabilidade de ocorrência do evento A é de 0,0000020%. A do evento C será ignorada nos cálculos deste post por ser absolutamente desprezível, principalmente pelo grande número de apostas realizadas neste último sorteio do ano. Nos sorteios da Mega-Sena da Virada de 2009/2010 e 2010/2011, onde passaram a vigorar as regras atuais3, houve 1561 e 734 ganhadores da Quina, respectivamente.

A chance de ninguém acertar a Sena, necessária para se obter a probabilidade do evento B, seria calculada, idealmente, da seguinte forma: de posse das apostas realizadas por todos os jogadores para este concurso, verificaria-se quantas combinações de 6 números não foram escolhidas por NENHUM jogador. Chamando este número de M, a probabilidade de ninguém acertar a Sena seria de M/N, onde N é o número total de combinações (50.063.860). 

O grande problema é que a relação de todas as combinações apostadas não é disponibilizada para o público e, mesmo que fosse, levaria algum tempo para se tabular todas as informações e identificar o valor de M. Utilizarei mais uma vez, portanto, a técnica de simulação estocástica, desta vez para estimar quantas combinações não são escolhidas por nenhum jogador em um concurso da Mega Sena. Irei supor que serão realizadas um total de P apostas simples, independentes entre si, e os números em cada aposta seriam escolhidos de forma totalmente aleatória. É claro que, na prática, a distribuição de apostas não segue necessariamente este padrão, já que:

·      em um conjunto de apostas realizadas por um mesmo jogador (ou em um bolão), cada uma delas não é escolhida de forma independente, pois, por exemplo, não haverá apostas iguais nesse conjunto;

·      há combinações mais suscetíveis de serem escolhidas.

Porém, diante da impossibilidade de se realizar um cálculo exato, a metodologia proposta permite, ao menos, obter uma estimativa razoável.

Tomando como base os totais arrecadados nos sorteios de 2009 e 2010 (R$435 milhões e R$472 milhões, respectivamente4) divididos pelo valor da aposta simples (R$2,00), estimo que o total de combinações apostadas (P) seja de aproximadamente 225 milhões5. Note que este valor é mais de 4 vezes maior do que o número de combinações possíveis, o que não garante que todas elas serão escolhidas por alguém, devido à possibilidade de haver combinações repetidas.

A simulação resultou, em média, em um percentual em torno de 0,25% para o número de combinações não escolhidas. Portanto, a probabilidade de você ratear o prêmio na situação B será igual a6:

     Probabilidade de ninguém fazer a sena  »  0,25%
                                   ´         
     Probabilidade de você fazer exatamente a Quina7      »  0,00065%
                                   =
            Probabilidade do evento B = 0,0000016%

A probabilidade de você ratear o prêmio destinado à Sena na Mega-Sena da Virada com uma aposta simples é a soma das probabilidades dos eventos A e B (destacadas em negrito), que assume um valor de aproximadamente 0,0000036%. Apesar de suas chances de ganhar aumentarem em 80% em relação a um concurso normal da Mega-Sena, é importante lembrar que, em caso de premiação fazendo a Quina, você provavelmente irá dividir o prêmio com um grande número de pessoas.

Seria interessante, portanto, tentar diminuir as chances de dividir o prêmio com outras pessoas, ao escolher combinações mais improváveis de serem apostadas. Neste caso, porém, a Psicologia entra em cena para identificar o padrão adotado pelas pessoas ao realizar os jogos. É comum, por exemplo, que se escolham números associados a datas comemorativas ou números dispersos de forma homogênea ao longo do volante de aposta (como por exemplo, um número em cada uma das 6 dezenas, de 1 a 10, 20 a 29,...,51 a 60).

Fuja deste padrão e pense em alguma combinação que quase ninguém apostaria, como por exemplo 1, 4, 6, 8, 9, 11. Não se preocupe se este jogo parecer improvável, pois, como já sabemos, TODAS as combinações têm a mesma chance de ser sorteada. Mais uma dica: a aposta em números seguidos, como 1,2,3,4,5,6, deve ser evitada. Apesar de esta combinação parecer improvável para a grande maioria das pessoas, é mais fácil de ser escolhida por alguém, porque obedece a certo padrão.

_________________________________________________________________________________

1) Posts “A Mega em Cena”, de 03/05/2011 e “Números em Sequência”, de 08/05/2011”

2) Na teoria das probabilidades, dois eventos são mutuamente excludentes quando não podem ocorrer simultaneamente.

3) A Mega-Sena da Virada foi criada em 2008, porém apenas a partir de 2009 passou a vigorar a regra de que o prêmio da Sena não seria acumulado para o sorteio seguinte, mas sim repassado aos ganhadores da Quina e Quadra.

4) Informações sobre arrecadação e resultados dos sorteios podem ser obtidas no endereço http://www1.caixa.gov.br/loterias/loterias/megasena/como_jogar.asp.

5) É importante lembrar que o preço das apostas múltiplas (por exemplo, de 7 números) é diretamente proporcional ao número de combinações contidas na mesma. Portanto, para este cálculo, não faz diferença como o total de apostas está distribuído entre apostas simples e múltiplas.

6) A rigor, deve-se realizar o produto entre a “Probabilidade de ninguem fazer a sena” e a “Probabilidade de você fazer exatamente a Quina, dado que você não fez a Sena”. No entanto, a probabilidade condicionada no segundo fator é praticamente igual à probabilidade de você fazer exatamente a Quina.

7) Para uma aposta simples, o número de sorteios favoráveis para você fazer a Quina é C65 ´ C541, que é a composição das combinações de 5 números dentre os 6 que você escolheu e de 1 número dentre os 54 que você NÃO escolheu. A probabilidade de fazer a Quina será então a razão entre esta quantidade e o número total de combinações (C606).

terça-feira, 29 de novembro de 2011

Probabilidades Ocultas

Fim de ano é tempo de Amigo Oculto. Em família, com os amigos e no trabalho, é quase impossível escapar da tradicional troca de lembranças natalinas. O cálculo das probabilidades está presente desde a etapa de sorteio dos papéis1, passando pelo momento de entrega dos presentes (quantas vezes alguém que já recebeu presente foi sorteado, fechando o ciclo e obrigando uma pessoa a reiniciar o processo?) até chegar ao resultado final da brincadeira, onde em geral se verifica a coincidência de duas pessoas – não raro, marido e mulher ou mãe e filha – terem trocado presentes entre si, arrancando os tradicionais gritos de “marmelada”.

Neste post analiso a probabilidade de ocorrência de alguns destes fatos (denominados de eventos, no jargão estatístico) e mostro que, ao contrário do que parece, a probabilidade de haver troca direta de presentes entre duas pessoas não é tão rara como pode parecer a princípio.

Apesar de exigir, em geral, um grande esforço de análise combinatória, o cálculo da probabilidade de ocorrência de qualquer desses eventos parte de um conceito bastante simples, expresso na seguinte razão2:

                                            número de combinações (sorteios) que levam à ocorrência do evento
Probabilidade                    _________________________________________________________
de um evento    =                         
                                             número total de combinações (sorteios) que podem ocorrer


Supondo que será realizado um amigo oculto entre N pessoas, o número total de sorteios que podem ser realizados é N!, já que a 1ª pessoa pode tirar qualquer um dentre os N papéis, a 2ª pessoa qualquer um dentre os N-1 papéis restantes, e assim por diante, chegando-se ao produto N*(N-1)*...*2.*1 = N!

Chance de pelo menos uma pessoa se tirar, invalidando o sorteio

Depois de retirados os N papéis, deseja-se saber a probabilidade de o sorteio se tornar inválido, ou seja, de pelo menos uma pessoa ter se tirado. Para tal, deve-se calcular o número de combinações em que isso ocorre, o que é algo bastante complexo, pois envolve as situações em que exatamente uma pessoa se tira, exatamente duas pessoas se tiram, etc., até o caso limite em que todas as N pessoas se tiram. Cada uma dessas possibilidades leva a uma expressão diferente de cálculo.3 Computando-se todas elas, as probabilidades de ocorrer um sorteio inválido em função do número N de pessoas participando do Amigo Oculto são mostradas na tabela abaixo.

Número de pessoas no Amigo Oculto (N)
3
4
5
6
7
8
9
10 em diante
Chance do sorteio
ser inválido (%)
66,667
62,500
63,333
63,194
63,214
63,211
63,212
63,2121...

É importante ressaltar que, quanto mais pessoas houver na brincadeira, menor é a probabilidade de você se tirar, mas cresce o número de possíveis combinações de pessoas se tirando. Isto resulta no curioso resultado de que a probabilidade de ocorrer um sorteio inválido praticamente não varia com o número de pessoas participando do amigo oculto. Para valores de N maiores do que 10, essa probabilidade tende assintoticamente para um valor bastante elevado, em torno de 63,2121%, e esse é o motivo pelo qual muitas vezes são necessários diversos sorteios até se obter uma combinação válida.

Chance de o ciclo se fechar durante a entrega dos presentes

Escolhida a pessoa que irá iniciar o amigo oculto, a entrega de presentes evolui com a próxima pessoa sendo a que recebeu o presente anterior. Uma questão interessante é saber qual a probabilidade do ciclo se “fechar”, ou seja, de a primeira pessoa ser presenteada antes do término da entrega de todos os presentes, o que obrigaria à escolha de uma nova pessoa para reiniciar o processo. O número de combinações em que o ciclo não se fecha corresponde a (N-1)!, pois, para que isso ocorra, a segunda pessoa teria que tirar uma das (N-1) pessoas ainda não presenteadas, a terceira pessoa teria que tirar uma das (N-2) pessoas ainda não presenteadas, e assim sucessivamente. Portanto, a probabilidade de o ciclo não se fechar corresponde à razão entre (N-1)! e o número total de sorteios válidos, uma vez que a entrega de presentes só é feita depois de conseguido um sorteio válido.

Esta razão, que também foi calculada por mim através de simulação, se torna cada vez maior quando aumenta o número de pessoas no amigo oculto, como mostra o gráfico abaixo. Isto explica porque muitas vezes é necessário reiniciar o processo de entrega dos presentes a partir de uma pessoa que ainda não foi presenteada.


 
Chance de haver troca direta de presentes entre duas pessoas

A probabilidade de você tirar cada um dos participantes no Amigo Oculto é a mesma, e vale 1/(N-1), já que, em um sorteio válido, você não pode se tirar. Em um amigo oculto com 11 pessoas, por exemplo, você tem 0,1 (ou 10% ) de possibilidade de tirar cada uma delas.

O que irei calcular agora é a chance de haver troca direta de presentes entre duas pessoas, ou seja, em um par de pessoas, uma tirar a outra. Considero três possibilidades:

A) Você trocar presente com determinada pessoa. Neste caso, deseja-se calcular a probabilidade de uma troca específica entre você e uma pessoa desejada.
B) Você trocar presente com alguma pessoa. Neste caso, consideram-se as trocas entre você e qualquer uma das N-1 pessoas restantes;
C) Alguém trocar presente com alguma outra pessoa. Neste caso, considera-se a possibilidade de haver troca de presentes entre quaisquer dos N.(N-1)/2 pares de pessoas que podem ser formados.

A variação das probabilidades dos três casos em função do número de pessoas no amigo oculto é mostrada a seguir:

 
Como era de se esperar, no caso A, a chance de você trocar presente com uma determinada pessoa desejada (seu marido ou mulher, por exemplo), diminui bastante à medida que cresce o número de participantes, chegando a insignificantes 0,11% para um grupo de 30 pessoas. A chance de você trocar presente com alguma pessoa (caso B) também diminui para grupos maiores, embora esta probabilidade não seja tão remota para um Amigo Oculto com até 30 pessoas. O que talvez cause surpresa é a probabilidade de haver alguma troca entre quaisquer pares de participantes, que é muito próxima de 40%, mesmo quando o número de pessoas é grande. Apesar da chance de determinada coincidência diminuir com o aumento de N, a quantidade de coincidências que podem ocorrer aumenta drasticamente quando há muitos participantes, fazendo com que o resultado final leve a uma probabilidade alta de haver alguma coincidência.

Todas as probabilidades calculadas neste post consideram um sorteio idôneo, onde os papéis são distribuídos aos participantes de forma totalmente aleatória. Não estão previstos nos cálculos, evidentemente, manipulações por parte da organização do sorteio, trocas de papéis entre participantes mais próximos, ou eventuais “marmeladas” que de fato podem vir a ocorrer neste tipo de brincadeira...
_________________________________________________________________________________

1) Considero a forma tradicional de sorteio, onde se recortam N papéis com os nomes de cada participante, e cada pessoa retira um papel.

2) Note que esse é exatamente o mesmo conceito que leva à obtenção da probabilidade de 1/6 de sair a face “1” em um lançamento de um dado, já que há 1 combinação favorável (a face de número 1) dentre as 6 combinações possíveis de serem sorteadas (as seis faces do dado).

3) O número de combinações para cada valor de N pessoas se tirando pode ser obtida de forma recursiva, com base no número de combinações obtidas para menos de N pessoas se tirando. Posso enviar o detalhamento dos cálculos para os interessados.



sexta-feira, 30 de setembro de 2011

Fila Pra Tudo


Um dos maiores transtornos experimentados pelo público que foi aos três primeiros dias do Rock In Rio foi o excesso de filas. Havia filas enormes para pegar o ônibus, entrar na Cidade do Rock, comprar comida e, principalmente, se divertir na montanha russa, tirolesa ou na roda gigante. Em um dos stands no Bob´s, a espera para comprar um lanche chegava a quase duas horas e havia filas separadas para os cinco caixas existentes. Fiquei imaginando o porquê de não adotarem o sistema de fila única, dispondo os caixas lado a lado. Este procedimento, difundido no país por volta da década de 1990, é hoje comum em muitos estabelecimentos, como agências bancárias, bilheterias de casas de espetáculos, guichês do metrô e até em alguns supermercados.

Este post mostra que o sistema de fila única seria a maneira mais justa e conveniente de atender às pessoas que quisessem comprar seu lanche no Bob´s do Rock In Rio. Superadas eventuais dificuldades práticas para a sua implementação, principalmente em relação à disposição da fila e dos atendentes, são inegáveis os ganhos da fila única em relação à utilização de uma fila separada para cada caixa. Evita que atendentes fiquem ociosos1, preserva a justiça na ordem de atendimento (que segue rigorosamente a ordem de chegada de clientes, observando-se o sistema como um todo) e diminui a incerteza no tempo em que uma pessoa ficará na fila até ser atendida.

A questão mais importante no estudo de um sistema de filas é a representação adequada tanto do tempo até a entrada de um novo cliente na fila (que fará com que ela aumente) como do tempo até a saída de um cliente que esteja sendo atendido (que fará com que a fila diminua). No primeiro caso, a dificuldade está em identificar o padrão segundo o qual as pessoas chegam para serem atendidas e no segundo caso a dificuldade é em prever a duração de cada atendimento.

A Estatística tem papel fundamental na modelagem desses dois tempos, que, por serem incertos, são denominados variáveis aleatórias. Apesar de ser impossível prever o tempo de chegada de um cliente ou a duração de um atendimento, pode-se construir uma espécie de histograma para cada uma dessas variáveis, mostrando a gama de valores que elas podem assumir e suas respectivas frequências de ocorrência. Com base nestas informações, pode-se simular numericamente a evolução da fila ao longo do tempo (utilizando o Excel ou algum software de estatística) e traçar histogramas de frequências para o número de pessoas na fila e para o tempo de espera até o atendimento, os quais permitem avaliar o desempenho do sistema2.

Para exemplificar esse tipo de análise, simulei o que poderia ocorrer a uma pessoa que entrasse na fila para comprar um lanche no Bob’s do Rock In Rio em determinado momento quando havia 5 caixas, cada um com uma fila de aproximadamente 40 pessoas. O tempo médio de atendimento por cliente era de cerca de 3 minutos, valor estimado com base nas 2 horas de espera na fila, em média3.

Considerei dois tipos de configuração para este sistema: o atendimento em filas separadas, como estava ocorrendo na prática, e um atendimento hipotético em fila única, que seria outra alternativa de prestar o serviço ao público. Neste segundo caso, ao invés da última pessoa que chegou estar na 40ª posição da fila de um dos caixas, ela seria a 200ª pessoa em uma fila única para os 5 caixas. Como se percebe, o número de pessoas por caixa é o mesmo em ambas as configurações.

Ressalto que, como o processo é aleatório, não é possível calcular quanto tempo a pessoa ficará na fila, mas apenas obter uma relação dos possíveis valores de tempo de espera e suas respectivas probabilidades. Veja a diferença entre os resultados dos sistemas de filas separadas e de fila única, obtidos a partir de 1000 simulações para cada uma dessas configurações.

 
Histograma de freqüências do tempo de espera na fila, nas duas configurações analisadas.

Apesar de o tempo médio em ambos os casos ser de 2 horas (120 minutos), há uma variação muito maior entre os possíveis tempos de espera no sistema de filas separadas. Observe a faixa de 15 minutos para mais ou para menos em relação ao tempo médio (ou seja, um tempo de espera entre 105 e 135 minutos): enquanto no sistema de filas separadas em aproximadamente 25,8% das vezes o tempo de espera ficou fora dessa faixa, no sistema de fila única isso só ocorreu em 1,4% das simulações.

Portanto, observa-se que, no sistema de filas separadas, há uma chance maior de esperar menos tempo do que a média – caso a pessoa tenha a sorte de pegar uma fila que anda mais rápido – porém há também um risco maior de esperar bastante, caso se tenha o azar de pegar uma fila mais demorada. Já no sistema de fila única a incerteza em relação à duração do tempo de espera é bem menor, pois muito provavelmente ele não se distanciará muito desse valor médio de 120 minutos. Isso ameniza em parte o aspecto negativo associado ao elevado tempo de espera, pois pelo menos a pessoa tem uma noção mais exata de sua duração.

Um segundo ponto que ilustro a seguir é a injustiça do sistema de filas separadas. Realizei simulações adicionais para esta configuração, observando o que poderia ocorrer com duas pessoas que estivessem em filas diferentes, na seguinte situação: a primeira na 40ª posição de uma das filas e a segunda em uma posição mais a frente (entre a 30ª até a 39ª) na fila ao lado. A idéia foi verificar o percentual de vezes em que a pessoa da primeira fila, mesmo estando mais atrás, ainda conseguiria ser atendida antes do que a pessoa da outra fila. Os resultados são mostrados na tabela abaixo:

Posição da pessoa na segunda fila
39ª
37ª
35ª
32ª
30ª
Percentual das vezes em que uma pessoa na 40ª posição da primeira fila ainda conseguiria ser atendida antes da pessoa na segunda fila
46,8%
31,8%
23,5%
11,1%
3,9%

Nota-se que em quase metade das vezes a pessoa da primeira fila seria atendida antes de uma pessoa 1 posição à frente na segunda fila, e em quase um quarto das vezes ela seria atendida antes da pessoa que estivesse 5 posições à frente na outra fila. Mesmo alguém na 30ª posição da outra fila ainda teria um risco próximo a 4% de ser atendido depois da pessoa da primeira fila, situada 10 posições atrás.

De qualquer forma, é importante ressaltar que o sistema de fila única não elimina o problema da pequena quantidade de caixas colocada para atender ao público do Rock In Rio, que nitidamente foi inferior ao que seria esperado para um evento destinado a receber 100 mil pessoas por dia.
_____________________________________________________________________________________

1) Nos exemplos citados de atendimento do Bob´s ou agências bancarias, é evidente que isto não ocorreria, pois se algum atendente ficasse ocioso as pessoas se deslocariam de uma fila para outra. Entretanto, em situações como um SAC por telefone onde houvesse vários números para se ligar diretamente, poderia haver fila em algum destes números, enquanto um outro número estivesse ocioso. Por este motivo, implantaram-se os atuais sistemas de atendimento onde há apenas um número, formando-se uma fila única imaginária (a famosa música que se ouve ao telefone) para distribuição dos clientes entre os vários ramais existentes.

2) Em alguns modelos, como por exemplo quando se utiliza uma distribuição exponencial para representar tanto a chegada como a saída de clientes, é possível deduzir expressões teóricas exatas para as medidas de desempenho do sistema.

3) É evidente que não coletei minuciosamente dados reais para modelar este sistema. Apenas para ilustrar a análise, considerei que o tempo de atendimento seguia uma distribuição gama, com parâmetro r = 2 e valor médio de 3 minutos. Esta distribuição tem a função densidade de probabilidade mostrada abaixo, onde r e a são parâmetros positivos. O valor médio de X é dado pela razão r/a.