Close mostrando duas pessoas sentadas e bebendo chá, sem mostrar o rosto delas. Uma veste uma camiseta branca e calça jeans, e a outra veste uma jaqueta de couro e calça jeans rasgada no joelho.
Photo by Matthew Henry on Unsplash

Quando Bhaskara encontra a Estatística

Se você aprender algo neste post, quer dizer que finalmente usou a Fórmula de Bhaskara para algo, certo?

Antonio Carlos
Published in
9 min readNov 7, 2023

--

Caso você se veja precisando modelar matematicamente uma situação de extremos, que tal usar o ditado popular x = 44 ± 36 (x é igual a 44 mais ou menos 36)?

Ao final das contas (literalmente), o símbolo ± permite que a expressão anterior seja vista como uma forma diferente de dizer “ou 8 ou 80”:

Neste post, iremos:

  1. Aprender a escrever qualquer par de números A e B no formato C ± D;
  2. Entender o que a Estatística tem a ver com isso;
  3. Revisitar a Fórmula de Bhaskara sob um novo olhar.

Pegue dois números e troque por outros dois

Observe a animação abaixo e perceba que a expressão x = C ± D pode ser entendida como uma sequência de instruções:

Animação representando a reta real com os números de 0 até 88. Existe uma marcação do ponto C sobre o valor 44, além de uma transição que adiciona os pontos A=8 e B=80. Ainda existe duas outras marcações, sinalizando que a distância entre os pontos A e C, e a distância entre os pontos C e B ambas medem o valor representado por D.
Animação ilustrando como os valores A, B, C e D se relacionam uns com os outros.

1. Comece em C,

2. Ande D unidades ou para a esquerda ou para a direita,

3. Você chegará ou em A ou em B.

No caso da animação, começamos no número 44 e nos deslocamos 36 unidades para mais ou para menos. Isso nos permite obter seja o valor 8, seja o valor 80.

Propriedades

A partir disso já é possível perceber algumas propriedades importantes sobre os números C e D:

  • O valor C está exatamente no meio entre A e B. Isso é verdade já que a distância de C até A é a mesma que de C até B.
  • O valor D indica o quanto A e B distam do valor C. Por exemplo, D é igual à distância de A até C, que é a mesma distância de B até C.

Em fórmulas, podemos escrever:

Se quisermos complicar um pouco mais a definição de D, podemos colocar todos os elementos (A, B e C) em uma mesma representação:

Aqui vale parar um minuto para absorver a ideia. Basicamente, estamos calculando D = (D+D)/2, o que obviamente é verdade. Mesmo assim, é interessante o fato de utilizarmos os valores A e B junto com um ponto de referência, que no caso é a média deles, o valor C.

Calculando na mão

Lembre-se que a ideia é começar com os valores A e B, e conseguir representá-los como x = C ± D. Assim, uma definição mais prática para calcular é observar que D é a metade da distância entre A e B, ou então:

Ou seja, sempre que quiser escrever dois números no formato C ± D, basta aplicar alguma dessas variações de fórmulas. Provavelmente a forma mais fácil de calcular na mão seja:

Por exemplo, podemos representar:

Pausa para a Estatística

Foto profissional de uma pizza cortada em pedaços, junto com alguns outros ingredientes in-natura como tomate cereja e tomilho.
Photo by Ivan Torres on Unsplash

A Estatística é, dentre outras coisas, um grande cinto de utilidades para quando precisamos analisar conjuntos de dados.

O “meio”, e quão longe do “meio”

Talvez o caso mais cotidiano da estatística seja a média aritmética: soma tudo e divide pela quantidade de valores que foram somados.

Por exemplo, suponha que um grupo de 4 amigos foi a um rodízio de pizza e que cada um comeu, respectivamente, 8, 10, 16 e 22 pedaços. Podemos dizer que, em média, cada um deles comeu (8+10+16+22)/4 = 14 pedaços.

Esse cálculo é categorizado formalmente como uma medida de centralidade, já que busca sumarizar os dados definindo algum tipo de “centro” para eles.

Entretanto, é óbvio que alguns comeram bem menos pedaços do que 14 (e outros bem mais). Para entender como os valores variam ao redor da média, podemos contar com as medidas de dispersão.

Por exemplo, podemos utilizar uma estratégia semelhante ao que usamos antes para descrever o número D olhando para como os valores A e B distam da média C. Aqui, calculamos o quanto cada valor varia em relação à média, e depois tiramos a média desses valores:

Aliás, esse cálculo é tão interessante que possui um nome na Estatística: Desvio Absoluto Médio. Ou seja, estamos calculando o quanto os valores variam em relação à média, em média, e utilizando o valor absoluto deles como medida de variação.

Além disso, na Estatística existe um outro tipo de desvio tão importante que recebeu o nome de Desvio Padrão. O porquê de usar um ou outro desvio desvia do escopo deste artigo, mas considere uma combinação de fator histórico e praticidade na hora de fazer contas (por mais que não pareça a princípio).

A fórmula do desvio padrão é:

A interpretação desse valor (e dessa fórmula) não é exatamente intuitiva, mas dentro de um contexto maior ele se torna bastante útil. Por exemplo, ouça esse episódio do Naruhodo para entender a importância do desvio padrão quando pensamos nas mudanças climáticas.

Se a fórmula permite…

Quando se trata de aplicar essas estratégias de sumarizar os dados, podemos considerar que um conjunto de dados com 1 elemento é pouco, com 2 é questionável, e a partir de 3 talvez seja relevante.

Isso acontece porque cálculos como média e desvio padrão buscam capturar determinadas características dos dados, mas se temos poucos dados, então seria mais fácil reportar os próprios valores ao invés das métricas de sumarização.

Entretanto, os conceitos e as fórmulas estão aí para serem aplicados. O importante é saber quando faz sentido e quando não faz.

Animação representando a reta real com os números de 0 até 88. Existe uma marcação do ponto C sobre o valor 44, além de uma transição que adiciona os pontos A=8 e B=80. Ainda existe duas outras marcações, sinalizando que a distância entre os pontos A e C, e a distância entre os pontos C e B ambas medem o valor representado por D.
Animação ilustrando como os valores A, B, C e D se relacionam uns com os outros.

Por exemplo, vamos voltar à animação do início. Quão absurdo seria dizer que, dado nosso conjunto de dados formado pelos números A e B:

  • C é a média do conjunto de dados; e
  • D é o quanto os valores do conjunto variam ao redor de sua média?

De certa forma, já vínhamos tratando os valores C e D como conceitos semelhantes, certo?

Como estamos falando de um conjunto formado apenas por dois números, A e B, podemos nos dar ao luxo ainda de escolher se queremos usar o Desvio Absoluto Médio ou o Desvio Padrão para calcular D: ambos darão o mesmo resultado nesse caso, embora passando por diferentes manipulações matemáticas.

Ou seja, podemos re-escrever nossa equação utilizando algumas letras gregas que a Estatística adora. Por exemplo, podemos utilizar nesse contexto a letra µ e σ (lê-se, mi e sigma) para representar, respectivamente, a média e o desvio padrão do nosso conjunto de dados:

Coelho na cartola

Tem um outro detalhe muito importante para nossa discussão aqui, mas vou proceder como um ótimo mal professor de matemática e deixar a demonstração como tarefa de casa.

O ponto é: a fórmula para calcular o desvio padrão pode ser simplificada quando estamos tratando de um conjunto com apenas 2 números (no nosso caso, A e B). Fazendo algumas manipulações, podemos chegar em:

Eu sei que isso é um grande salto de raciocínio, mas basicamente quer dizer que o desvio padrão entre 2 números pode ser definido como:

  1. Calcula a média (µ) entre A e B, e depois o quadrado dela (µ²);
  2. Calcula A vezes B (A*B);
  3. Calcula a diferença entre esses valores (µ² - A*B);
  4. Calcula a raiz quadrada desse último valor.

Vou deixar aqui uma demonstração dessa propriedade:

A Fórmula de Bhaskara, igual mas diferente

Agora vamos para a última peça que falta…

Foto de uma construção baixa abandonada, tomada pela natureza e com algumas árvores ao redor. Sobre a construção existe uma grande antena parabólica apontada para o céu. Ao fundo, temos um céu azul com nuvens brancas.
Photo by Kenrick Baksh on Unsplash

Sinal de ± e dois números pintados em uma reta não é algo que se vê todo dia. Chances de que você também já teve que decorar a famosa Fórmula de Bhaskara, provavelmente sem entender o porquê.

Escreve lá, compadre: Todo o Mundo quer saber para que isso serve e Ninguém quer responder.

Recap

A Fórmula de Bhaskara está associada às funções do segundo grau, f(x) = ax² + bx + c, famosas por descreverem uma parábola. A fórmula em si é utilizada para encontrar dois números, x₁ e x₂, que possuem uma característica interessante nesse contexto: são valores onde a parábola possui o valor 0, ou seja, f(x₁) = f(x₂) = 0. Esses valores são chamados de raízes da função.

Abaixo temos uma animação representando a equação f(x) = x² - 7x + 6, com destaque para os pontos x=1 e x=6, que são os valores em que a função se torna zero.

Animação ilustrando uma parábola. Temos um plano cartesiano com os eixos x e f(x), e uma parábola descrita pela função f(x)) = x²-7x+6. A animação segue um ponto que percorre a curva da parábola, começando no topo esquerdo e percorrendo até o topo direito. O ponto passa por dois valores importantes, x₁ e x₂, onde os valores da função se tornam 0. É possível notar que x₁=1 e x₂=6.
Acompanhe os valores que a função assume conforme variamos x entre -1 e 8. Em especial, note o que acontece quando x=1 e x=6.

Construção

Já que queremos representar dois números, x₁ e x₂, por que não usar nosso conhecimento lá do início e representar eles como x = C ± D? Além disso, podemos usar alguma das formas de calcular C e D para tentarmos descobrir os valores x₁ e x₂. Afinal, normalmente queremos justamente encontrar esses últimos números.

Aqui entra novamente o que falamos sobre desvio padrão: algumas representações são mais ou menos úteis, dependendo da situação. Achar a melhor representação exige coisas como:

  • Repertório para saber as possibilidades que já existem;
  • Conhecimento de domínio para saber filtrar as possibilidades;
  • Conhecimento das regras básicas para derivar novas possibilidades;
  • Um pouco de tentativa e erro.

Por exemplo, o conhecimento de domínio sobre funções de segundo grau nos dirá que sabemos os valores Soma = (x₁ + x₂) e Produto = (x₁ * x₂) facilmente, já que eles estão relacionados à forma com que uma função de segundo grau é definida (ou polinômios de forma geral). No caso, podemos ter certeza de que:

De forma igualmente importante, conhecer um pouco de Estatística e Matemática nos ajudou anteriormente a derivar uma fórmula especial para quando queremos representar 2 números em uma expressão. E nessa fórmula usamos basicamente… a soma dividida por 2 (média), e a soma e o produto (desvio padrão) dos nossos dados.

Desconstrução

Algo que não nos atentamos normalmente é o quanto a língua que nós falamos influencia a forma com que pensamos. E, bem, a Matemática em si possui sua própria linguagem.

Sabe o ± na parte de cima, e o 2a que divide tudo? São só uma forma compacta de escrever a equação. A animação abaixo manipula a Fórmula de Bhaskara para evidenciar as semelhanças com a expressão μ ± σ que vimos anteriormente:

Animação representando a Fórmula de Bhaskara passando por gradativas manipulações aritméticas. Começamos, isolando o denominador 2a nas duas parcelas. A próxima manipulação coloca o 2a para dentro da raiz, tornando-o 4a². Quebramos esse denominador em duas parcelas, e por fim transformamos a primeira parcela em um quadrado. O efeito final é obtermos uma fórmula muito similar ao formato de μ ± a raiz quadrada de μ² menos o produto dos valores. Isso é equivalente à μ ± σ visto anteriormente.
Podemos manipular a fórmula original para rearranjar alguns termos, em um processo inverso ao de simplificação da equação. O benefício é poder ver tudo sobre uma nova perspectiva.

Considerando tudo que você já leu neste post, talvez as peças tenham se encaixado naturalmente:

A Fórmula de Bhaskara descreve um conjunto de dados de dois elementos (as raízes) em função de como elas variam (desvio padrão) em relação a um ponto central (a média).

O pulo do gato é que sabemos algumas propriedades intrínsecas relacionadas à soma e ao produto dos dois números que temos interesse. Ou seja, a Fórmula de Bhaskara combina alguns cálculos estatísticos com algumas restrições impostas pela forma com que uma função de segundo grau é definida.

(TL;DR)²

A Fórmula de Bhaskara é, em notação estatística, x = μ ± σ.

Aproveite também para comentar!

Inspiração

Este post surgiu da combinação de algumas ideias discutidas neste vídeo do 3blue1brown com alguns conceitos estatísticos que eu tinha acabado de revisar na época.

Reflexões…

… para todo mundo:

  • Se você não sabia para que serve aprender a Fórmula de Bhaskara, provavelmente continua sem saber. Dá uma ouvida nesse episódio do Scicast aqui:
  • Viu alguma oportunidade de melhorar a explicação ou outras implicações dessa ideia? Deixe um comentário!
  • Você já conhecia essa interpretação da Fórmula de Bhaskara? Eu realmente não achei nada do tipo na internet.

… para quem gosta de Estatística:

  • O que quer dizer quando um conjunto de dados possui variância negativa? Bem, no caso de funções de segundo grau, quer dizer que não existem raízes entre os números reais.

… para quem gosta de Ciência de Dados :

  • Sabe por que dividimos tudo por a? É uma etapa de pré-processamento. Afinal, é importante normalizar os dados, certo?

… para quem gosta de Matemática:

  • Podemos derivar uma fórmula que combina o conceito de Soma e Produto e de Bhaskara. Normalmente, em métodos como completar os quadrados, esse "estado intermediário" da fórmula acaba não ficando tão evidente. Considerando que S e P são dados, a fórmula de Bhaskara pode ser expressa como:

… para quem gosta de Gen AI:

  • Eu tentei usar o Chat-GPT com instruções como "expanda o segundo termo dessa equação LaTeX". Normalmente dava certo, mas ainda preferi fazer todo trabalho manualmente para ter maior controle do resultado. Seria interessante ter um editor LaTeX com integração aos LLMs.

--

--