top of page

Estatística: Conceitos para entender pesquisas

Às vésperas das eleições, os jornais trazem a manchete: "31,6% devem votar no candidato A". E o que isso quer dizer? Que o candidato será eleito? Para entender esse tipo de enunciado, é necessário compreender alguns conceitos de estatística, a área da matemática que cuida da probabilidade.

Representação gráfica com porcentagens. Note que o total das partes dá 100%

Para entender uma pesquisa eleitoral, por exemplo, é necessário conhecer alguns conceitos:


População é o universo que vai ser tema da pesquisa. No caso das pesquisas eleitorais, os eleitores brasileiros. Como seria quase impossível consultar mais de 125 milhões de eleitores, delimita-se o número de entrevistados, o grupo que vai servir de amostragem.


Amostragem é um número reduzido de pessoas que representa a população total.


Escolher quais pessoas serão entrevistadas é um problema complexo. Se metade dos eleitores são mulheres e ser mulher é um fator que interfere no voto, então metade da amostragem deve ser de mulheres.


Se a classe social a que pertence o eleitor interfere no voto, a amostragem deve se aproximar ao máximo das diversas classes sociais que formam a população.


Desse modo, se cada pessoa entrevistada representa o voto de 100.000 pessoas da população, cada entrevistado deve ser uma amostra, a mais fiel possível, dessas 100.000 pessoas.


Apesar de todo cuidado para escolher o público, e para calcular as previsões, os resultados não são exatos. Tanto que toda reportagem, de jornal ou televisão, deve exibir uma margem de erro da pesquisa. Normalmente 3 ou 4 pontos percentuais para mais ou para menos.


Para entender como são feitos os cálculos, também é importante ter algumas noções básicas de estatística: média, desvio padrão e variância.


A variância e o desvio-padrão são medidas de dispersão. Há situações em que as medidas de tendência central, como a média, a moda e a mediana, não são as mais adequadas para a análise de uma amostra de valores. Nesses casos, é necessário utilizar as medidas de dispersão.


Em um vestibular onde o critério de aprovação para a próxima fase é ficar acima da média de acertos dos candidatos, um determinado candidato só precisa comparar seu número de acertos com essa média para saber se passou para a próxima fase.


Para se ter uma ideia do tempo de viagem de uma determinada linha de ônibus, pode-se ter por base o tempo mais frequentemente observado, que seria a moda. Provavelmente, os resultados acima e abaixo desse valor mais frequente podem ter sido obtidos em dias mais atípicos, com mais congestionamento nas ruas, em finais de semana ou em um feriado.


Agora, considere uma escola que deseja ajudar alunos de uma turma com dificuldade em uma determinada matéria, por meio de um projeto específico de acompanhamento desses alunos. Sabendo somente que a média dos alunos dessa turma na referida matéria foi por volta de 6,0, ela não terá informações suficientes para fazer um projeto que atenda adequadamente os alunos com dificuldades. Nesse caso, interessa saber mais sobre os alunos que ficaram abaixo dessa média.


Como calcular

Para situações como essa, as medidas de dispersão são muito úteis. Vamos nos basear nesse último exemplo para mostrar como se calcula a variância e o desvio-padrão.


Considere que um grupo de alunos tenha tirado as seguintes notas em uma determinada matéria: 2,0; 3,0; 3,0; 4,0; 5,0; 6,0; 7,0; 8,0; 9,0; 10,0. Para calcular essas medidas de dispersão, é útil conhecer a média desses valores:

Agora, calculamos os desvios de todas essas notas em relação à média:


Se calcularmos a média desses desvios, somando-os e dividindo o resultado por 10, ela será nula, pois a soma de todos esses desvios será zero, pelo próprio significado da média como medida de tendência central.


Assim, elevamos ao quadrado esses desvios e, aí sim, tiramos a média dos resultados. É a variância.

Podemos concluir que a dispersão das notas em relação à média é de 6,81. No entanto, a variância não está na mesma unidade que as nossas notas, pois os desvios foram elevados ao quadrado. Para conservarmos as unidades do desvio e dos dados, calculamos o desvio-padrão, o qual nada mais é do que extrair a raiz quadrada da variância.

Logo, o desvio das notas em relação à média é de 2,61 pontos. No nosso exemplo, com essa informação, é possível à escola ter uma ideia melhor da situação da turma e dos alunos que estão abaixo da média.

Fontes: Carlos Alberto Campagner, engenheiro mecânico, com mestrado em mecânica, professor de pós-graduação e consultor de informática.

Michele Viana Debus de França, licenciada em matemática pela USP e mestre em educação matemática pela PUC-SP.

UOL Educação


bottom of page