segunda-feira, 10 de novembro de 2008

Vitória eleitoral da estatística

.
Por Nuno Crato
.
OS RESULTADOS DAS ELEIÇÕES PRESIDENCIAIS norte-americanas surpreenderam meio mundo. Sem razão. As percentagens de votos obtidos pelos dois principais candidatos estavam exactamente dentro das margens anunciadas pelas sondagens. De que se surpreenderam as pessoas, afinal?
.
Barak Obama ganhou uma das eleições mais contestadas e fascinantes da história dos Estados Unidos. Ao longo deste ano, as surpresas foram muitas. Até ao fim, houve quem duvidasse do que as últimas sondagens diziam. Falou-se dos erros de previsões anteriores. Falou-se do chamado «efeito de Bradley», que consiste em os inquiridos darem respostas falsas por terem algum receio de divulgar as suas intenções reais. Os mais prudentes mantiveram até ao último minuto uma incerteza sobre os resultados finais. Toda a imprevisível história política dos últimos meses inspirava dúvidas. As sondagens não.
.
Isto significa, julgará muita gente, que as amostras usadas pelos técnicos de sondagens eram representativas. Mas os estatísticos não gostam muito da expressão «amostra representativa» e preferem, habitualmente, designá-la por «amostra aleatória». Como será que uma amostra escolhida ao acaso pode apontar conclusões sobre o que se passa no universo em estudo?
.
Imaginemos um problema aparentemente simples. Queremos, por exemplo, estudar os hábitos dos estudantes universitários em Lisboa e saber a percentagem de fumadores nesse universo. Como o faremos? Vamos à porta de uma faculdade e perguntamos aos estudantes que lá estão? Não parece boa ideia, pois com a nova legislação os fumadores concentram-se nas portas dos edifícios públicos. A amostra seria enviesada. E devemos fazer o inquérito de manhã, de tarde ou de noite? Será que os alunos à noite, em horário pós-laboral, são mais velhos e fumam mais? Ou fumam menos? E escolher metade dos alunos de manhã e metade de noite? Mas isso não será dar o mesmo peso a ambos os grupos de alunos e não há muito mais alunos de dia? Não enviesará isso a amostra?
.
Procurar uma amostra que, com grande probabilidade e razoável aproximação, reproduza as características do universo em estudo pode ser muito difícil. A estatística matemática inventou a amostragem aleatória. No nosso exemplo poderíamos, por exemplo, aceder a uma listagem dos estudantes universitários e fazer um sorteio ao acaso. Antigamente usavam-se urnas, como as das lotarias. Agora usam-se geradores de números aleatórios em computador. Garante-se que a probabilidade de escolher uma dada amostra é igual à de escolher qualquer outra pelo mesmo processo. A probabilidade de enviesamento reduz-se.
.
Nas eleições norte-americanas o processo é mais difícil. Fazem-se estratificações para garantir que se tem um dado número de eleitores de cada sexo e de cada grupo etário. Estudam-se em separado grupos geográficos diferentes. Com isso reduz-se a variabilidade do processo, reduz-se o erro médio esperado. Podem ainda fazer-se correcções para o chamado «efeito Bradley», fazendo perguntas indirectas. As técnicas de amostragem e de sondagem atingiram hoje tal desenvolvimento que os erros elevados são muito pouco prováveis. As eleições norte-americanas foram também uma vitória da estatística matemática.

-
«Passeio Aleatório» - «Expresso» de 8 de Novembro de 2008
-
Este texto é uma extensão do que está publicado no Sorumbático [v. aqui], onde eventuais comentários deverão ser afixados.

Sem comentários: