Entenda por que você não gostaria dos filmes da Marvel se não existisse a segmentação de imagens!

Antonio Ramos
6 min readApr 18, 2023

--

O computador definitivamente pode enxergar!

A série “O computador definitivamente pode enxergar” tem o objetivo de desmistificar a inteligência artificial além de disseminar conhecimento prático sobre o assunto. Em especial, essa série se trata sobre uma das áreas mais fascinantes da IA que é a capacidade do computador de entender, processar, analisar e extrair informações de imagens/vídeos. Como falamos no nosso post de lançamento da série:

A visão computacional 👀🖥️ é uma tecnologia que permite que computadores possam “ver” o mundo ao seu redor. Ela utiliza algoritmos e modelos matemáticos para analisar imagens e vídeos, tornando possível a interpretação e entendimento do conteúdo visual. Com o avanço das tecnologias de inteligência artificial, a visão computacional tem se tornado cada vez mais presente em nossas vidas, trazendo inúmeras aplicações e possibilidades para o futuro.

Quer saber mais, acesse os links sobre a série:

  1. O computador definitivamente pode enxergar!
  2. Recomendação de imagens por similaridade utilizando TensorFlow Similarity

Mas vamos ao assunto de hoje, o que diabos é segmentar uma imagem???

O que é segmentação de imagens?

A segmentação de imagens é um processo essencial em diversas áreas, como a visão computacional, a análise de imagens médicas e a robótica. Esse processo consiste em dividir uma imagem em regiões ou segmentos com características semelhantes. Isso permite que os algoritmos de processamento de imagem possam analisar cada região separadamente, facilitando a detecção de objetos, a identificação de padrões e a extração de informações úteis.

Um dos principais desafios da segmentação de imagens é a diversidade das imagens. Cada imagem é única e apresenta características distintas, o que torna difícil criar um algoritmo genérico capaz de segmentar todas as imagens. Por esse motivo, os algoritmos de segmentação de imagens são projetados para trabalhar com diferentes tipos de imagens, levando em consideração suas características específicas.

Existem diversas técnicas de segmentação de imagens, cada uma com suas vantagens e desvantagens. Alguns algoritmos utilizam técnicas de limiarização, que consiste em separar uma imagem em duas ou mais regiões com base em um limiar de intensidade. Outros algoritmos utilizam técnicas de agrupamento, que dividem a imagem em regiões com base nas características de cor, textura ou forma. Além disso, existem técnicas mais avançadas, como a segmentação por contorno ativo, que utiliza modelos matemáticos para identificar os limites das regiões de interesse.

Por que segmentar imagens é importante?

O processo de segmentação de imagens é importante porque permite dividir uma imagem em regiões ou segmentos com características semelhantes, simplificando a análise de dados complexos. A segmentação de imagens é uma técnica amplamente usada em muitas áreas, incluindo a análise de imagens biomédicas, visão computacional, detecção de objetos, robótica, entre outras.

A análise de imagens biomédicas, por exemplo, depende fortemente da segmentação de imagens para diagnosticar patologias e monitorar a progressão de doenças. A segmentação de imagens pode ser usada para identificar diferentes estruturas em uma imagem médica, como tecidos, órgãos e tumores, tornando mais fácil e preciso o diagnóstico médico.

Além disso, a segmentação de imagens também é essencial para a identificação de padrões e características em grandes conjuntos de dados, permitindo que os cientistas possam analisar dados de forma mais precisa e eficiente. Dessa forma, a segmentação de imagens é uma ferramenta crucial para o avanço de muitas áreas da ciência e tecnologia.

Casos de uso

Diagnóstico médico

A segmentação de imagens é amplamente utilizada na análise de imagens médicas para detectar tumores, anomalias em órgãos e outras patologias. A segmentação permite que os médicos identifiquem regiões específicas em uma imagem que possam indicar a presença de uma doença, permitindo um diagnóstico mais preciso.

Post sobre “Segmentação de Imagens Médicas com Deep Learning”

Análise de imagens de satélite

A segmentação de imagens é usada para analisar imagens de satélite para detectar características geográficas e ambientais, como florestas, rios, cidades e campos agrícolas. A segmentação permite que os cientistas identifiquem e monitorem essas características em grande escala, permitindo uma melhor compreensão do nosso planeta e do meio ambiente.

Como mencionado acima, a segmentação é ótima para análise de imagens de satélite (Inclusive isso é uma das coisas que trabalho no meu mestrado kkkk), Vou falar mais afundo em uma outra publicação futuramente aqui, mas com a segmentação é possível analisar diversas imagens por exemplo onde ocorreu algum desastre natural e poder entender quais áreas foram mais impactadas. Treinar um modelo para executar esse tipo de função pode ser muito útil pois após ocorrer um acontecimento como este podemos analisar as áreas mais impactadas e direcionar reforços de buscas e atuações sobre a área, isso salva vidas.

Na primeira imagem abaixo temos a área antes do terremoto, a imagem central indica a área após o terremoto, e a imagem da esquerda indica a segmentação pontuando como vermelho os edifícios mais destruída e como verde os edifícios menos destruídos. Pegamos imagens de desastres que já aconteceram e treinamos nossos modelos para entender edifícios mais afetados pelo desastre.

Segmentação de imagens de satélites após terremoto

Efeitos visuais em filmes e animações

A segmentação de imagens é usada para separar objetos em primeiro plano do fundo da imagem. Isso permite a criação de efeitos visuais impressionantes, como fundos em movimento e sobreposições de imagens.

Antes da utilização de técnicas de segmentação de imagem, a criação de efeitos especiais era uma tarefa extremamente desafiadora e muitas vezes impossível de ser realizada com precisão. Isso porque, sem a separação do plano de fundo, o objeto ou personagem inserido na cena não teria uma borda clara e definida, o que tornaria difícil integrá-lo com o restante da imagem.

Com o avanço da tecnologia de segmentação de imagem, tornou-se possível criar efeitos especiais cada vez mais realistas e convincentes. Hoje em dia, a maioria dos filmes de grande orçamento utiliza técnicas de segmentação de imagem em algum momento da produção, desde a criação de criaturas fantásticas até a inserção de cenários inteiros gerados por computador.

Além disso, a segmentação de imagem também permite que os cineastas tenham mais controle sobre a imagem final, já que é possível separar elementos específicos da cena e manipulá-los individualmente. Isso torna possível criar cenas complexas com muitos elementos diferentes, cada um sendo manipulado de forma independente.

Segmentação da área verde da imagem, permitindo separar personagens do ambiente real

Potencial futuro

No futuro, podemos esperar avanços significativos na área de segmentação de imagem. Uma das tecnologias emergentes é a segmentação semântica, que permite que um algoritmo identifique os objetos em uma cena e os rotule de acordo com sua categoria. Isso é útil em muitos contextos, como na navegação autônoma de veículos, na detecção de objetos em imagens de satélite e em muitos outros.

Outra tecnologia promissora é a segmentação de vídeo em tempo real, que permite que uma câmera capture e segmente objetos em movimento em tempo real. Essa tecnologia tem aplicações em várias áreas, como na vigilância de segurança e na detecção de objetos em ambientes de realidade aumentada.

Além disso, a segmentação de imagem também está se tornando cada vez mais acessível graças à adoção de técnicas de aprendizado de máquina. Isso permite que até mesmo usuários com pouca experiência técnica possam segmentar imagens com facilidade e rapidez.

Um pouco sobre mim

Como um profissional dedicado à área de projetos de melhoria e ciência de dados, iniciei minha carreira em 2018 com um estágio na modelagem de móveis usando o Solidworks. No início de 2019, me juntei à empresa júnior Projet Jr como consultor e diretor de projetos, onde fui responsável pela gestão de 41 projetos premiados como empresa júnior de alto crescimento e impacto. Nesse mesmo ano, também participei do programa de qualificação para exportação da Apex-Brasil como apoio técnico e atuei como estagiário na Rede Primavera de saúde no setor de controle de indicadores e SAC. Com um bom desempenho, fui contratado como analista administrativo para liderar projetos na área da diretoria comercial, usando meus conhecimentos em lean six sigma e ciência de dados.

Atualmente, trabalho como Data Scientist na Insidergic, com foco em projetos relacionados a visão computacional, e na A3Data, em um projeto de desenvolvimento de análises exploratórias que trazem aumento na receita do cliente da empresa. Minha trajetória profissional até aqui me permitiu aprimorar minhas habilidades em ciência de dados e aplicá-las em diferentes setores, buscando sempre soluções inovadoras e eficientes para as demandas dos projetos.

Linkedin: https://www.linkedin.com/in/antoniodramos/

Github: https://github.com/tonylincon1

--

--