Helicóptero Autônomo

Matheus Mota
RanbookM
Published in
3 min readAug 15, 2020

Introdução

Helicópteros são considerados mais difíceis do que aeronave de asa fixa por causa de ruído e assimetria. As maneiras de resolver esse problema são mostrados na tabela abaixo.

Características do Helicóptero

O helicóptero analizado pelo artigo, possui 3.6 m de comprimento e pesa 20 kg. Nele estão colocados 3 acelerômetros e 3 giroscópios. Além disso, há um sistema GPS e um compasso, que reporta 50 Hz.

Os valores obtidos são: (x,y,z), (θ, Φ ,ω), d(x,y,z)/dt, d(θ, Φ ,ω)/dt.

Explicação Simples de Aprendizado por Reforço

O aprendizado por reforço é um método de inteligência artificial que visa trabalhar com um aprendizado sem a necessidade de um dataset. Os parâmetros a ele relacionados estão inseridos em um estado de Markov, que é um sistema constituído por uma política, um agente, um estado e uma ação. Para dar prosseguimento ao aprendizado, também é definido uma função de ganho para a cada novo estado o agente aprender algo com as escolhas das ações anteriores.

Para o caso do helicóptero, são definidos os seguintes parâmetros:

A partir disso são encontrados os valores, que são encontrados por fórmulas de recorrência e métodos de maximização.

As maneiras possíveis para o aprendizado do helicóptero são duas.

As ações são relacionam com o movimento do helicóptero.

O artigo analizado usa o algoritmo de Pegasus para otimizar. Monte Carlo que geralmente fornece valores ligeiramente diferentes de qπ. A melhor opção é simular vários por Monte Carlo π e tirar o melhor deles.

Para a função de recompensa, ele usa o seguinte:

Que é uma separação da recompensa relacionada à ação e uma recompensa relacionada ao estado. O primeiro tem o objetivo de tornar suave a movimentação. O segundo seria uma recompensa por ir para o melhor estado (*) e o estado original. No final, as duas funções são unidas no R(s,a).

Resultados

Pelos testes feitos, os resultados são mostrados abaixo. Cada um dos gráficos é uma variação de algum dos graus de liberdade definidos para o helicóptero. A linha vermelha é a rota feita pelo humano e a linha azul é a feita pela inteligência artificial. Os testes mostram que em todos os momentos ele tentou manter o helicóptero o mais estável possível.

Conclusão

Com isso, temos que o uso de uma Inteligência artificial para o helicóptero é útil para tornar a movimentação mais suave e estável possível. O aprendizado por reforço mostrou resultados satisfatórios para o problema.

Para mais informações, acesse o artigo original.

--

--