O que é Data Loss Prevention e qual sua função na gestão de dados?

Conheça esse poderoso aliado da segurança digital

DataLakers Tecnologia
Blog DataLakers
4 min readOct 8, 2021

--

Data Loss Prevention (DLP) é um conceito que vem ganhando mais notoriedade nos últimos anos, principalmente com o surgimento de novas legislações de proteção de dados, já que é um poderoso aliado na prevenção de vazamentos acidentais e acessos não autorizados.

Nesse artigo, vamos explicar no que consiste o conceito de DLP, como ele opera e como ele ajuda uma organização a ter mais segurança em seu manuseio de dados.

Photo by Franck, via Unsplash

O que é DLP?

O termo Data Loss Prevention (DLP) designa um conjunto de tecnologias e práticas de inspeção que visa garantir que os dados confidenciais ou críticos de uma organização permaneçam disponíveis para os usuários autorizados e não sejam compartilhados com usuários não autorizados.

Para isso, é comum que seja realizada ocultação ou mascaramento automático de dados sensíveis, em paralelo com a aplicação dinâmica de políticas empresariais de governança de dados (como classificação, realocação, encriptação, etc.).

Para que serve?

A adoção de DLP nas empresas ameniza pelo menos 3 dificuldades comuns:

  1. Proteção de informações pessoais: grande parte das organizações coleta diversos dados caracterizados como sensíveis e que são regidos pela LGPD ou outras regulações internacionais. Portanto, é essencial garantir a proteção desses dados através de identificação, classificação e ocultação, conforme necessário. Ferramentas de DLP podem acelerar esse processo; e os relatórios disponibilizados ainda facilitarão as auditorias de conformidade.
  2. Obtenção de visibilidade dos dados: entender bem sua estrutura de dados é tarefa essencial para mantê-la segura; isso inclui saber onde seus dados estão e como eles se movimentam durante as rotinas. Muitas ferramentas modernas de DLP oferecem essa funcionalidade, permitindo uma visão geral da infraestrutura e o mapeamento dos pontos de acessos.
  3. Proteção de propriedade intelectual: toda empresa tem suas próprias informações confidencias, seja no âmbito de produto/tecnologia ou administrativo/financeiro. No caso de usuários não autorizados ou agentes externos obterem essas informações, sérios prejuízos podem atingir a organização. Com políticas e controles eficientes implementados, é possível se proteger contra esse tipo de situação.

Como funciona?

A DLP consiste em providências tanto para identificar os dados confidenciais que precisam ser protegidos e quanto para evitar a perda destes. Mas mesmo a identificação desse tipo de dado pode ser complicada, pois os dados podem existir em vários estados e locais diferentes em uma infraestrutura:

  • Dados em uso: dados ativos em RAM, memória cache ou registros de CPU.
  • Dados em movimento: dados sendo transmitidos por meio de uma rede, seja internamente de forma segura, de e para nuvem ou pela Internet pública.
  • Dados em repouso: dados armazenados em um banco de dados, em um sistema de arquivos ou em algum tipo de infraestrutura de armazenamento de backup.

Então, para executar essas tarefas de forma eficaz, é geralmente necessário uma ferramenta especializada. Para tanto, as chamadas soluções DLP tem alta eficiência, já que aplicam técnicas variadas para garantir a identificação de todos os dados sensíveis na estrutura da organização. Algumas dessas técnicas são:

  • Correspondência baseada em regras ou expressões regulares: utiliza padrões conhecidos para encontrar dados que correspondam a regras específicas, por exemplo: números de 16 dígitos geralmente são números de cartão de crédito e números de 11 dígitos geralmente são números de CPF. Esse normalmente é o primeiro passo para marcar documentos para análise posterior.
  • Identificação digital do banco de dados ou correspondência exata de dados: busca-se correspondências exatas para dados estruturados pré-fornecidos.
  • Correspondência exata de arquivo: procura-se documentos com base em seus hashes, em vez de seu conteúdo.
  • Correspondência parcial de documentos: trata de arquivos que correspondam parcialmente a padrões definidos previamente. Por exemplo, diferentes versões de um formulário preenchido por diferentes usuários terão a mesma estrutura, que pode ser usada para identificação digital do arquivo.
  • Análise estatística: algumas soluções de DLP usam aprendizado de máquina ou análise Bayesiana para tentar identificar dados confidenciais. Neste caso, é preciso um grande volume de dados para treinar o sistema, que ainda pode estar sujeito a falsos positivos e negativos.

Também é possível, na maioria das soluções DLP, criar as próprias combinações de regras customizadas, buscando dados conforme a necessidade da sua empresa.

O software DLP então classifica dados regulamentados, confidenciais e críticos para os negócios e, a partir disso, identifica violações dentro de um pacote de políticas predefinido, normalmente conduzido por conformidade com legislações como LGPD, GDPR ou similares.

Quando essas violações são identificadas, entram em cena medidas como alertas, criptografia e outras ações de proteção para evitar que os usuários finais compartilhem dados, acidental ou maliciosamente, de modo a colocar a organização em risco.

Dentre as esferas monitoradas pela DLP estão as atividades de endpoint, os fluxos de dados em redes corporativas, os dados na nuvem e outros, protegendo assim os dados em repouso, em movimento e em uso.

Por fim, as ferramentas DLP também fornecem relatórios para atender aos requisitos de conformidade e auditoria e identificar áreas de fraqueza e anomalias para análise forense e resposta a incidentes.

--

--

DataLakers Tecnologia
Blog DataLakers

As melhores soluções para seu projeto de Big Data. A DataLakers Tecnologia é uma empresa especializada em automatização de pipeline e governança de dados.