Estatística na prática: Estimando a aceleração da gravidade no conforto do lar

Alexandre Esposte Santos
Data Hackers
Published in
11 min readJan 17, 2025

Já imaginou descobrir a aceleração da gravidade sem sair de casa? Neste post, mostro como usei estatística inferencial e física básica de um jeito bem prático e divertido para estimar esse valor fundamental da física. Com apenas uma bolinha de papel, um cronômetro e uma trena, fiz 50 medições simples deixando a bolinha cair de uma altura conhecida. Analisei os dados usando conceitos básicos de estatística e, surpreendentemente, consegui chegar bem perto do famoso 9,81 m/s²! Além disso, explorei como o número de medições afeta a precisão dos resultados.

Photo by Benjamin Recinos on Unsplash

Introdução

Um tópico muito interessante da estatística é a estatística inferencial. Ela é um campo fundamental da estatística, que permite a estimativa de parâmetros populacionais sem a necessidade de acessar toda a população.

Um exemplo clássico dos livros de estatística é a estimativa da altura média de meninos em uma escola, utilizando uma amostra aleatória com poucos alunos. O processo envolve a coleta da altura de alguns meninos e, a partir desses dados, faz-se a inferência sobre a altura média de todos os meninos da escola. Essa abordagem é amplamente utilizada em diversas áreas, pois possibilita tirar conclusões sobre grandes populações a partir de uma amostra representativa, economizando tempo e recursos.

Outro exemplo são em pesquisas de opinião pública / eleições, uma amostra representativa de eleitores é entrevistada para prever a distribuição de votos em uma eleição, sem a necessidade de consultar todos os eleitores, o que seria inviável em países que a população é na casa dos milhões ou algumas centenas de milhares.

No controle de qualidade industrial, é comum selecionar aleatoriamente uma amostra de produtos de uma linha de produção para verificar se atendem aos padrões de qualidade estabelecidos, permitindo inferir a qualidade de toda a produção sem a necessidade de testar cada item individualmente.

Esses exemplos demonstram como a estatística inferencial é crucial para tomar decisões em diversas áreas, mesmo quando o acesso à população é inviável.

Na publicação de hoje, vamos explorar um exemplo prático de como podemos aplicar a estatística inferencial para estimar uma constante fundamental que está conosco o tempo todo, a aceleração da gravidade. Para isso, vamos coletar as nossas amostras por meio de um experimento simples, que qualquer pessoa pode realizar no conforto do lar. Após a coleta dos dados, analisaremos os resultados e utilizaremos a estatística inferencial para calcular um valor médio e um intervalo de confiança, permitindo assim, estimar a aceleração da gravidade com base nas amostras obtidas. Para isso, só vamos precisar de um cronometro e uma bolinha de papel.

Nosso objetivo aqui é simplesmente demonstrar uma forma diferente e descontraída de aplicação da estatística inferencial.

Vale ressaltar que, para simplificar este pequeno projeto, estaremos desconsiderando uma série de fatores. Explico, toda medida realizada envolve uma certa margem de erro, pois o próprio instrumento de medição introduz incertezas. No nosso caso, as incertezas estão associadas às medições do tempo e da altura, que serão feitas, respectivamente, com um cronômetro e uma trena. Em um experimento mais robusto realizado em um laboratório, seria necessário levar em consideração esses erros, bem como a propagação desses erros nas fórmulas que utilizaremos. No entanto, vamos desconsiderar esses fatores e focar na aplicação da estatística inferencial de forma simplificada.

Os próximos tópicos consistem em como realizar o experimento, apresentar uma breve introdução ao desenvolvimento teórico necessário para compreendermos o que estamos fazendo, mostrar os resultados e as análises realizadas, e, por fim, tirar as conclusões.

Experimento

Esse experimento é bastante simples, tudo que vamos precisar é de uma bolinha de papel, um cronômetro (que pode ser acessado online em https://www.online-stopwatch.com/portuguese/full-screen-stopwatch.php), uma trena e uma superfície que servirá como referência de altura.

Os procedimentos também são simples e diretos:

  1. Meça a altura da superfície de referência até o solo e registre o valor
  2. Posicione a bolinha de papel sobre a superfície de referência.
  3. Libere a bolinha para que ela caía livremente até o chão.
  4. Simultaneamente, acione o cronômetro no momento em que a bolinha é liberada.
  5. Pare o cronômetro assim que a bolinha atingir o solo e registre o valor.
  6. Repita os passos 2 a 5 por N vezes para obter mais dados.

No meu caso, realizei esse experimento no meu quarto, utilizando minha mesa como referência de altura. A imagem a seguir mostra a minha mesa juntamente com a altura medida com a trena.

Mesa com referência de altura. Fonte: Autor

A bolinha era sempre posicionada no traço horizontal superior, conforme na foto acima, e então liberada para cair até o solo. O tempo de queda foi medido com um cronômetro online, pois o cronômetro do meu celular possuí uma resolução de 10 milissegundos, enquanto o cronômetro online oferece uma resolução de 1 milissegundo.

Lembra que eu disse que estaria desconsiderando os erros de medidas, então, talvez uma boa justificativa seriam os erros grosseiros cometidos no momento em que eu acionava e parava o cronômetro. É necessário realizar alguns arremessos para adquirir o reflexo mínimo necessário para o experimento, mas, mesmo assim, o tempo de resposta humano pode introduzir um erro superior ao de que qualquer outro erro de medida associado ao cronômetro.

Outra fonte de erro é o posicionamento da bolinha. No meu caso, eu estava posicionando com a mão tentando manter o padrão entre os experimentos, mas com certeza essa altura variou durante os experimentos.

Desse modo, essas duas fontes de erro podem juntas introduzir desvios mais significativos do que os próprios erros dos instrumentos de medição. E, talvez, essa seja uma justificativa plausível para desconsiderarmos os erros introduzidos pela trena e cronômetro.

Desenvolvimento teórico

Antes de abordarmos os conceitos estatísticos e sua aplicação na determinação da aceleração da gravidade, é necessário discutir brevemente a física envolvida nesse problema. Para alguns, isso pode ser uma tortura, mas é totalmente necessário no nosso contexto.

Para começar, vamos relembrar a equação horária da posição, aprendida nas aulas de física no primeiro ano do ensino médio. Essa equação descreve o movimento de um objeto acelerado e será a base para a nossa estimativa de g.

onde

  • h: Posição ou altura final da bolinha. No nosso caso, será zero, pois a posição final será no chão.
  • h0: Posição ou altura inicial da bolinha, que corresponde a 73 cm.
  • v0: Velocidade inicial da bolinha. Essa variável será zero, já que a bolinha será liberada a partir do repouso.
  • a: A aceleração, é o que queremos estimar. No nosso caso, a = −g. Pois no nosso referencial, a aceleração “aponta” para baixo com magnitude g.
  • t: Corresponde ao intervalo de tempo.

Ao manipularmos a equação acima e introduzirmos os valores conhecidos, obtemos uma expressão teórica que relaciona o tempo de queda com a aceleração da gravidade (g) próxima à superfície terrestre:

Essa expressão nos permite calcular a aceleração da gravidade (g) com base no tempo que a bolinha leva para chegar ao solo.

Sabemos que o valor padrão de g na Terra é aproximadamente 9.81 m/s². Substituindo esse valor e isolando o tempo (t) na equação acima, podemos calcular o tempo teórico para uma bolinha cair de uma altura de 73 cm. O resultado é aproximadamente 386 milissegundos.

Após realizar o experimento 50 vezes, obtemos uma lista com 50 valores de tempo. Com esses tempos, é possível calcular uma lista com 50 valores para g, utilizando a equação apresentada anteriormente. A partir dessas medidas, utilizaremos da teoria da estatística inferencial para estimar o parâmetro populacional de interesse, sendo esse a verdadeira aceleração da gravidade.

A escolha de realizar 50 medições vem do Teorema do Limite Central. Esse teorema nos permite assumir que, para um número suficientemente grande de amostras, a distribuição das médias amostrais se aproxima de uma distribuição normal, independentemente da distribuição original dos dados. A média dessa distribuição é um estimador não viciado do parâmetro populacional, ou seja, fornece uma estimativa confiável da aceleração da gravidade. Além disso, o desvio padrão dessa distribuição, conhecido como erro padrão, permite quantificar a incerteza associada à estimativa da média através da construção de um intervalo de confiança.

No entanto, a estimativa pela média é algo pontual e não suficiente para garantir uma análise confiável. É mais robusto construir um intervalo de confiança ao redor dessa média, fornecendo uma faixa de valores que contém o parâmetro populacional com um certo nível de confiança. Para isso, utilizaremos o erro padrão e construiremos um intervalo de confiança com nível de confiança de 95%, poderíamos escolher qualquer outro nível.

Resultados

Os resultados das medidas foram armazenados em uma planilha no google drive, e com os tempos medidos, calculamos os valores de g para cada experimento utilizando a equação que foi apresentada no tópico de desenvolvimento teórico. A imagem a seguir exibe como esses resultados ficaram estruturados.

A coluna # representa o número do experimento, a coluna tempo(s) apresenta o tempo de queda da bolinha em segundos e a coluna g representa a aceleração da gravidade calculada a partir do tempo em m/s².

Através dessa lista de 50 valores de g, podemos explorar alguns tópicos bem interessantes da estatística inferencial.

  1. Inferência de g a partir de uma lista de amostras
  2. Entender como o tamanho amostral influencia nos resultados inferenciais

agora vamos analisar cada caso separadamente.

1. Inferência de g através de um tamanho amostral igual a 50

Essa tarefa é bastante simples, precisamos somente calcular a média dos 50 valores de g, utilizando a fórmula padrão para a média:

Ao fazer essa conta, obtemos uma média de 10.30 m/s². O valor usual para g é 9.81 m/s², o que resulta em uma diferença de 0.49 m/s² entre o valor estimado e o valor de referência. Isso é um bom ou um mau resultado? Existem várias maneiras de avaliar, uma forma prática é calcular o desvio percentual.

Logo, o desvio percentual calculado foi de 4.97%, o que é um bom valor.

Outro ponto interessante a se notar são as demais estatísticas descritivas,

Estatísticas descritivas para as acelerações calculadas. Fonte: Autor

Uau, a mediana foi de 9.90 m/s²!!

Bom, chega de divagar e vamos retornar à nossa boa e velha média. A média é o nosso estimador não viesado, entretanto, ela é somente uma estimativa pontual. Então como podemos expressar maior confiabilidade para o nosso resultado? Através de um intervalo de confiança !

Neste caso , o intervalo de confiança será calculado em torno da média usando a seguinte expressão:

onde g barra é o valor médio, z é o valor crítico, sigma é o desvio padrão populacional e n é o tamanho amostral.

No nosso caso, não conhecemos o desvio padrão populacional, portanto, estaremos utilizando o desvio padrão da própria amostra.

O valor crítico z será fixado em 1.96, o que corresponde a um nível de confiança de 95% quando consideramos uma distribuição normal. Podemos considerar uma distribuição normal aqui, pois temos um um tamanho amostral razoável. No entanto, como veremos mais adiante, para tamanhos amostrais menores, devemos utilizar o valor crítico advindo da distribuição t-Student para um nível de confiança de 95%.

Fazendo essas contas, obtemos:

Média com seu respectivo intervalo de confiança.

Uau, veja como o nosso resultado fica muito mais interessante agora. O intervalo calculado utilizando estatísticas básicas e desconsiderando vários outros aspectos, inclui o valor de 9.81 m/s². Esse resultado é muito bom, considerando que o experimento foi realizado em um quarto com uma bolinha de papel irregular, um cronômetro online e no “olhômetro” confiando totalmente nas minhas habilidades motoras. Ou eu sou muito bom, ou de fato a estatística funciona e é incrível!

Agora, vamos observar a distribuição que obtivemos nessa amostra de tamanho 50.

Distribuição de acelerações em uma amostra de tamanho 50. Fonte: Autor

Olha que legal, apesar de não ser uma gaussiana perfeita, essa curva já se assemelha bastante com uma.

2. Influência do tamanho amostral

Vamos imaginar uma situação em que a coleta de amostras é limitada, o que pode ocorrer por diversos motivos. Por exemplo, obter novas amostras pode ser um processo complexo, caro ou você está simplesmente com preguiça de lançar 100 vezes uma bolinha e medir o tempo que ela leva para atingir o solo.

Nesse caso, vamos considerar situações onde fizemos apenas as 10 , 20 , 30 e por fim as 40 primeiras medidas. Também poderíamos fazer uma reamostragem aleatória sem reposição.

O procedimento em cada caso será o mesmo do tópico anterior: calcular a média e o respectivo intervalo de confiança para cada tamanho amostral. Mas lembrando que agora estaremos lidando com tamanhos amostrais menores, ou seja, vamos precisar estabelecer os valores críticos de acordo com a distribuição t-Student.

Para começar, vamos observar a distribuição de cada tamanho amostral.

Distribuição de aceleração para diferentes tamanhos amostrais. Fonte: Autor

Observe como o formato da curva se aproxima progressivamente de uma distribuição em forma de sino à medida que o tamanho da amostra aumenta. Você, leitor, acha que esse comportamento é devido a lei dos grandes números, teorema do limite central ou tem algum outro palpite?

Agora, vamos calcular a média e o intervalo de confiança para cada um dos casos.

Média e intervalo de confiança para cada tamanho amostral. Fonte: Autor

O mais interessante de observarmos aqui é como o intervalo de confiança vai se estreitando à medida que aumentamos o tamanho amostral. Isso é de fato esperado, pois, como vimos anteriormente, o intervalo de confiança pode ser entendido como uma função inversa da raiz quadrada do tamanho amostral, ou seja, quanto maior o tamanho amostral, menor será o intervalo de confiança.

Vale lembrar que, para uma amostra de tamanho 50, o intervalo calculado foi de 0.49. Assim, é possível perceber que a diferença entre os intervalos diminui à medida que o tamanho da amostra cresce. A diferença foi de 0.51 de 10 para 20, de 0.1 de 30 para 40 e de 0.08 de 40 para 50. Esse comportamento é explicado pela presença da raiz quadrada na fórmula do intervalo de confiança.

Inicialmente, ter tamanhos amostrais maiores é vantajoso, mas conforme o tamanho da amostra aumenta, os benefícios práticos são cada vez menores. Além disso, a distribuição para o tamanho 40 é praticamente a mesma da distribuição para o tamanho 50.

Poderíamos melhorar ainda mais os nossos resultados se fizéssemos um tratamento melhor desses dados, como analisando e desconsiderando possíveis outliers.

Por fim, nota-se que todos os intervalos incluem o nosso valor de referência, que é 9.81 m/s².

Conclusões

Esse experimento nos mostrou alguns resultados bem interessantes! Em primeiro lugar, conseguimos demonstrar que é possível fazer uma estimativa surpreendentemente boa da aceleração da gravidade usando materiais simples do dia a dia em um quarto escuro. Nossa média de 10.30 m/s² ficou apenas 5% diferente do valor de referência (9.81 m/s²), o que é um resultado muito bom considerando as condições do experimento.

Um dos aspectos mais legais foi observar o Teorema do Limite Central acontecendo na prática. À medida que aumentamos o número de medições, vimos claramente a distribuição dos dados se aproximando cada vez mais de uma curva normal, exatamente como a teoria prevê.

Outro ponto importante que descobrimos foi sobre o número ideal de medições. Os dados mostraram que, após 40 medições, o ganho em precisão começou a diminuir significativamente. Por exemplo, a diferença no intervalo de confiança entre 40 e 50 medições foi de apenas 0.08, muito menor que a diferença observada entre as medições de 10 e 20, que foi de 0.51.

Uma ponto interessante foi que mesmo com amostras menores, nossos intervalos de confiança sempre incluíram o valor de referência de 9.81 m/s². Isso indica que o método é robusto mesmo com um número reduzido de medições, embora mais medições nos garanta uma maior precisão.

Referências

NUSSENZVEIG, Herch Moysés. Curso de física básica: Mecânica (vol. 1). Editora Blucher, 2013.

BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatística básica. In: Estatística básica. 2010. p. xvi, 540-xvi, 540.

— — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — —

Chegamos ao final de mais um artigo, espero que todos tenham aproveitado a leitura.

Fiquem à vontade para me seguir no Linkedin e aqui no Medium para mais conteúdos.

--

--

Alexandre Esposte Santos
Alexandre Esposte Santos

Written by Alexandre Esposte Santos

Bacharel em Física com ênfase em física computacional e estudante de ciência de dados

No responses yet