O que são Dados Sintéticos?

Elint
ElintTech

--

Frequentemente, profissionais da área de dados deparam-se com situações em que não possuem os dados reais ou não podem usá-los devido a questões de confidencialidade ou privacidade. Para superar esse problema, a geração de dados sintéticos é realizada para criar uma alternativa aos dados reais.

De acordo com um estudo realizado pela Gartner e publicado pelo The Wall Street Journal, espera-se que até 2024, 60% dos dados utilizados para o desenvolvimento de projetos de Inteligência Artificial e analytics sejam gerados sinteticamente.

Mas afinal, o que são dados sintéticos?

Os dados sintéticos podem ser definidos como quaisquer dados que não foram coletados de eventos do mundo real, ou seja, são gerados por um sistema. Eles podem ser artificiais, mas refletem os dados reais, tanto matemática quanto estatisticamente.

Existem algoritmos específicos que são projetados e capazes de gerar dados sintéticos realistas que podem ser usados como um conjunto de dados de treinamento.

Quais as aplicações dos dados sintéticos?

Como os dados sintéticos de qualidade são uma representação precisa dos dados originais, eles podem ser utilizados em diversos processos, desde treinamento de Inteligência Artificial, análises, testes e desenvolvimento de software, entre outros.

Os dados sintéticos também podem ajudar com a tomada de decisão quando:

  • Modelos de estimativa ou previsão baseados em dados históricos não funcionam mais.
  • Suposições baseadas em experiências passadas falham.
  • Os algoritmos não podem modelar de forma confiável todos os eventos possíveis devido às lacunas nos conjuntos de dados do mundo real.

Além disso, as aplicações de dados sintéticos no dia a dia vão desde bancos, varejistas até hospitais. Por exemplo, os prestadores de serviços de saúde em áreas como imagens médicas usam dados sintéticos para treinar modelos de IA enquanto protegem a privacidade do paciente, e alguns bancos os utilizam para ajudar no treinamento de modelos de detecção de fraudes.

--

--