Cuidados com Excel como banco de dados

O Excel não foi feito para ser um banco de dados completo. Seguem alguns cuidados.

Notação decimal

Se escrevermos =1E3 numa célula do Excel, ele vai entender que é notação decimal (10 elevado à 3), e vai transformar o conteúdo em 1000 (teste em qualquer planilha).

Porém, e se o conteúdo que quisermos armazenar for realmente a string “1E3”? Teremos que mudar o formato da célula, de geral para texto, o que é possível, porém, requer atenção.

Datas

Se escrevermos 1/mar numa célula qualquer, o Excel vai entender que é uma data, 01/março.

E se quisermos armazenar a string “1/mar”, por algum motivo? O Excel vai entender errado, novamente.

Números grandes

Da mesma forma, um número grande vai ser descrito em notação científica — vamos perder precisão, se o objetivo for armazenar exatamente todos os dígitos.

Muitos dos erros são devido ao tipo de conteúdo — número (int, float), datas, strings, etc.

Num banco de dados como o Access, temos que declarar o tipo da coluna em separado ao conteúdo, o que ajuda (mas não resolve totalmente) nesse tipo de problema.

Limite de linhas e colunas

Outro erro comum. O Excel antigo (até 2003) tinha 65 mil linhas — o que era suficiente na época, mas muito pouco hoje.

O Excel atual tem máximo 1 milhão de linhas e 16 mil colunas — e isso não é suficiente para um banco grande.

Um erro possível é truncar linhas de um banco de dados, e trabalharmos com menos informação que existe de verdade.

Caso: banco de genomas

Pode parecer improvável, mas é possível errar muito sem essas noções.

Estudo: 20% dos papers de genômica tinham algum erro de Excel.

Bases de genoma têm siglas esquisitas, como SEPT2 — que facilmente pode virar 2 de Setembro!

Report Finds Microsoft Excel Causes Errors in 20 Percent of Genomics Studies | Mental Floss Erros de arredondamento

Quanto é 0,5–0,4–0,1?

Claramente, é igual a zero.

Coloque =0,5–0,4–0,1 no Excel, e vai dar zero.

Porém, uma pequena modificação (multiplicar por 1) e vai dar -2.77E-17

=(0,5–0,4–0,1)*1

Ou seja, -2,77 elevado a -17. Um número pequeno, mas não zero.

Isso ocorre devido à erro de arredondamento, na representação do número em binário.

Aliás, esse não é um privilégio do Excel. Em Python e outras linguagens também acontece.

Ou seja, cuidado ao utilizar o Excel como banco de dados.

(Inspirado em trechos do livro Humble Pi, sobre erros matemáticos em geral)

Link da Amazon: https://amzn.to/3O27yjx

Visualização da semana

Veja também:

https://ideiasesquecidas.com/

Originally published at http://ferramentasexcelvba.wordpress.com on November 14, 2022.

--

--

Publicação sobre projetos, ideias e fundações de Advanced Analytics: Excel. Matemática. Simulação. Computação quântica.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store
Arnaldo Gunzi

Project Manager - Advanced Analytics, AI and Quantum Computing. Sensei of Analytics.