Como o Google utiliza inteligência artificial para detectar apps maliciosos

ELIEZER BOURCHARDT
Aug 28, 2017 · 3 min read

Os aplicativos móveis nos distraem e nos ajudam, facilitam muito na hora de nos comunicar com nossos amigos e familiares, nos fornecem ferramentas que vão desde mapas até carteiras eletrônicas. Mas estes aplicativos também podem extrair mais informações que o necessário para fazer seu trabalho, tal como dados pessoais e dados de sensores de componentes, como câmeras e GPS.

Para proteger os usuários e ajudar os desenvolvedores, o Google analisa dados de privacidade e segurança de cada app no Google Play. Cada app é comparado com outros de recursos semelhantes para assim descobrir características em comum, conhecidos como pares funcionais. Ao criar estes grupos de pares é possível estimar o comportamento de cada grupo, permitindo definir limites adequados de comportamentos que podem ser considerados inseguros ou intrusivos. Este processo permite detectar apps que coletam e enviam dados sensíveis sem uma necessidade clara, isto permite aos usuários encontrarem aplicativos que fornecem o serviço que se propõem e que respeitam a sua privacidade. Por exemplo, uma calculadora não precisa saber a localização de um usuário para funcionar. Ao contrário de um app de navegação que realmente precisa saber a localização e necessita acesso do sensor GPS.

Uma maneira de criar grupos de apps é criando uma lista fixa de categorias e atribuir cada aplicativo em uma ou mais categorias, como ferramentas, produtividade e games. Entretanto, categorias fixas não são ideais para capturar e rastrear as muitas definições e alterações nos conjuntos de aplicativos mobiles. A curadoria e manutenção manual de cada categoria também é uma tarefa tediosa e suscetível a erros.

Uma abordagem utilizando inteligência artificial

Para resolver isso, o Google desenvolveu um algoritmo de machine learning para agrupar aplicativos móveis com recursos semelhantes. Sua abordagem utiliza deep learning para identificar grupos de pares de apps com funcionalidades similares, utilizando metadados, como descrições de texto e métricas de usuários. Então estes grupos de pares são utilizados para identificar anomalias, sinais potencialmente prejudiciais relacionados à privacidade e segurança das permissões solicitadas por cada aplicativo e seus comportamentos observados. A correlação entre diferentes grupos de pares a seus sinais de segurança ajudam diferentes times do Google a decidir quais apps devem ser verificados mais detalhadamente por especialistas de segurança e privacidade.

Em resumo, o algoritmo “aprende” como classificar cada app e a partir disso consegue descobrir comportamentos anormais, permitindo ser efetivo na detecção de apps nocivos. Esta análise automatizada de aplicativos utilizando inteligência artificial, possibilitou o Google a reduzir a quantidade de apps maliciosos na Play Store.

Tal qual o Google, também podemos utilizar técnicas de machine learning para resolver outros problemas de classificação. Um exemplo é a segmentação de clientes, onde temos uma grande base de clientes e queremos separá-los de acordo com suas características. Uma empresa que se utiliza destas técnicas torna-se competitiva no mercado, pois consegue entender melhor o seu cliente.

As aplicações são divididas em grupos de funcionalidades semelhantes, e em cada cluster de aplicativos similares, a linha de base estabelecida é usada para encontrar sinais anormais de segurança e privacidade.
)
ELIEZER BOURCHARDT

Written by

Bacharel em Sistemas de Informação, programador e cientista de dados.

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade