머신러닝 기반의 이상 탐지-자율주행 차량 이상 징후 탐지 (part 2)

Heeyeon Kim
XBrain
Published in
9 min readJan 4, 2021

Part 1에서 우리는 이상 탐지의 개념과 종류, 이상 탐지에 쓰이는 머신러닝 기법 등에 대해 알아보았습니다. Part 2에서는 자율주행 차량의 보안의 중요성과 머신러닝을 이용한 차량 이상 징후 탐지 기법 등을 통하여 실제 차량 보안 분야에서 머신러닝이 활용되고 있는 사례를 알아보겠습니다.

자율주행 시대의 차량 보안 위협

5G와 사물인터넷 시대에 가장 각광받고 있는 기술이 있다면 ‘자율주행’차 일 것 입니다. 자율주행 자동차란 운전에 있어서 운전자의 개입을 최소화하고 동적 주행을 자동화하는 것으로, 자율주행 5단계(완전 자율주행)은 사람의 개입없이 자동차가 스스로 완벽하게 주행을 컨트롤하는 상황을 말합니다. 이러한 자율주행 차량의 발달로 우리는 졸음, 음주운전, 운전 미숙 등에서 발생하는 교통사고를 극적으로 줄일 수 있을 것으로 예상합니다. 또한 자율주행 자동차는 궁극적으로 커넥티드 기술을 적용하여 차량 자체가 스마트폰처럼 무선 통신망과 연결되어 ‘커넥티드카’로 완성됩니다. 커넥티드카는 5G통신망으로 중앙 서버와 연결되어 주행 경로, 교통량 등 많은 정보들을 실시간으로 주고받게 될 뿐만 아니라, 차량과 차량, 차량과 사물, 차량과 보행자 간의 통신을 가능하게 해 다양한 정보를 주고받을 수 있게 됩니다. 결과적으로 차량 간의 통신과 신호 체계, 지능형 도로와의 정보 교환을 통해 차량 간의 사고 발생을 획기적으로 줄일 수 있게 됩니다.

V2X(Vehicle to Everything) (https://m.blog.naver.com/soyose1/221357098524)

하지만 차량 인터넷 기술의 발달은 좋은 점만 있는 것은 아닙니다. 커넥티드카의 발달과 함께 자율주행 차량의 보안 문제가 화두로 떠오르고 있습니다. 현재 가장 널리 사용되고 있는 차량 통신 표준 프로토콜인 CAN(Controller Area Network)은 보안에 취약하다는 단점이 있습니다. CAN은 특정 메시지의 발신자를 식별하기 위한 인증 메커니즘이 없습니다. 과거 그리고 현재까지도 자동차 내부 데이터에 접근할 수 있는 유일한 방식은 USB를 통한 접근 등의 물리적 접근이므로, CAN은 차량 데이터가 폐쇄된 네트워크에서만 유지된다고 가정하고 설계되었기 때문입니다.

만약 자율주행 차량이 외부 무선 네트워크와 완전히 연결된다면 다양한 원격 사이버 공격의 발생 가능성을 배제할 수 없을 것 입니다. 자율주행차를 악성코드에 감염시켜 해킹을 통해 원격으로 차량을 제어하거나 악의적인 메시지를 송신하여 차량이 이상행동을 하게 만들 수 있습니다. 차량과 차량 통신 시에 특정 차량에서 생성된 조작된 정보가 자율주행 차량 간의 사고를 일으키게 할 수도 있습니다. 자율주행 차량이 우리 생활에 점차 가까워져 가는 만큼 이러한 보안 위협을 하루빨리 파악하고 대응책을 확보하는 것이 필수적일 것 입니다.

자율주행 차량의 외부 침입 공격을 탐지하고 진단하기 위한 머신러닝의 역할 또한 중요해지고 있습니다. 자동차 네트워크의 보안을 강화하기 위해서는 크게 두 가지 방식이 있는데, 하나는 현재 사용되고 있는 차량 내부 프로토콜의 취약점을 인지하여 보안이 강화된 프로토콜과 네트워크 프레임워크를 개발하는 것이고, 다른 하나는 차량 내/외부 데이터 분석 및 이상 탐지 기법을 통해 보안 위협을 검출하는 것입니다.

Can bus frame (https://en.wikipedia.org/wiki/CAN_bus)

머신러닝을 이용한 자율주행 차량 이상 탐지

그렇다면 자율주행 차량 데이터의 이상 탐지에 가장 적절한 머신러닝 알고리즘은 무엇일까요? 이상 탐지 분야에서는 범용적으로 성능이 뛰어난 알고리즘보다는 도메인의 특성에 알맞은 알고리즘이 효과적이라는 것을 part 1에서 이미 살펴보았습니다. 데이터의 특징을 먼저 알아보면, 차량 내부 데이터는 다변량 시계열(Multivariate time series) 데이터입니다. 차량과 통신하는 사물 인터넷의 장치, 센서들로부터 생성되는 데이터 또한 대부분 시계열 데이터입니다. 따라서 전통적인 시계열 데이터 이상 탐지에 사용되는 RNN, LSTM 기반의 딥러닝 알고리즘이 효과적일 것을 쉽게 예상할 수 있습니다. 그 외에는 HMM(Hidden Markov Model)등의 statistical sequential 모델, SVM(Support Vector Machine)등도 활발히 연구되어 왔습니다.

하지만 자율주행 차량의 보안 시스템 구축은 단순한 이상 탐지만으로는 이루어질 수 없습니다. 보안 시스템이 견고해 질수록 그것을 뚫기 위한 신종 악성코드, 사이버 공격 또한 끊임없이 개발될 것입니다. 결국 이미 알려진 보안 위협 외에 변칙적이고 새로운 보안 위협을 탐지하는 기술 개발이 필요할 것이고, Autoencoder 등의 비지도학습 머신러닝 모델의 역할이 필수적입니다. [3]에서는 GAN(Generative Adversarial Network)을 이용하여 새로운 외부 메시지 공격을 높은 정확도로 탐지하는 IDS(Intrusion Detection System)을 제안합니다.

자율주행 차량 보안 시스템은 이상 탐지에 대한 높은 정확도가 필요할 뿐만 아니라 이상치의 원인을 분석하고, 나아가 이상 행위에 대한 대응책을 강구하는 것도 중요한 포인트입니다. 차량이 보안 위협으로 인해 오작동 등의 이상 행위를 일으킨다면 이러한 이상 행위는 보행자, 다른 차량의 안전과 직결되기에 이상 행위에 대한 빠른 대응이 필요합니다. [4]에서는 계층적 분류 침입 탐지 모델(Hierarchical classification intrusion detection Model)을 제안하여 공격 발생 여부 판단 뿐만 아니라 모델이 침입 공격의 유형과 대상 차량을 분류할 수 있게 합니다.

지금까지 다룬 차량 보안 연구는 주로 차량 통신 데이터인 CAN 데이터를 분석하고 탐지하는데 초점을 맞췄습니다. 하지만 CAN 데이터 뿐만 아니라 차량 센서 데이터, 주행 중에 주변이나 내부를 관찰할 수 있는 영상 데이터, GPS 데이터, 차량 외부 데이터 또한 이상 징후를 탐지하는데 기여할 수 있습니다. 자율주행의 레벨이 점점 올라가면서 운전자의 개입이 최소화되고 있고, 그와 동시에 예상하지 못했던 차량 보안 시스템의 허점이 점점 드러나고 있습니다. [5]에서는 교통 표지판을 변형하여 자율주행 차량이 교통 신호를 인식하지 못하게 만드는 적대적 샘플을 생성합니다. 아래 그림을 보시면 운전자라면 충분히 인식할 수 있는 수준의 표지판 변형도 자율주행 카메라는 잘 인식하지 못하는 것을 볼 수 있습니다. 이와 같은 새로운 사이버 공격 시나리오를 예측하고 차량 내/외부 데이터를 활용하여 대응책을 마련해야 합니다.

Examples of rogue signs: (c) shows that modified innocuous images in (a) can be misunderstood as adversarial signs. (Sitawarin et al. [5])

임베디드 시스템으로서 차량 보안 시스템은 제한된 시간과 컴퓨팅 자원의 문제를 해결해야 합니다. 이상 징후는 실시간으로 탐지되어 경보를 울리게 해야하며, 차량의 제한된 컴퓨팅 자원으로 운영 가능할 만큼의 경량 모델일 필요가 있습니다. 현재 딥러닝 기반의 이상 탐지 연구가 활발하게 이루어지고 있는데, 차량 이상 탐지 시스템이 실제 차량 임베디드 환경에 잘 구축되기 위해서는 이상 탐지 모델의 성능 뿐만 아니라 시간적, 공간적 자원 이용에 대한 많은 고민과 연구가 필요할 것입니다.

글을 마치며

컴퓨터 시스템에서 해킹 등 외부 침입을 탐지하는 문제는 이미 오래전부터 연구되어온 문제입니다. 하지만 자동차의 보안은 자율주행 차의 각광과 함께 막 주목받기 시작한 유망한 분야입니다. XBrain에서는 자율주행 차량 네트워크의 외부 침입 공격 탐지 뿐만아니라 운전자의 졸음, 음주 운전을 비롯한 이상 행위 탐지 등 자동차 이상 탐지 분야의 다양한 주제에 관심을 가지고 연구하고 있습니다. XBrain에서는 다양한 분야에서의 새로운 문제와 그 해결 방안에 관심이 있는 엔지니어분의 참여를 환영합니다 :)

Machine Learning Engineer 채용 공고 확인하러 가기

References

[1] R. Buttigieg, M. Farrugia and C. Meli, “Security issues in controller area networks in automobiles,” in Proc. 2017 18th International Conference on Sciences and Techniques of Automatic Control and Computer Engineering (STA), Monastir, 2017, pp. 93–98.

[2]C. Wang, Z. Zhao, L. Gong, L. Zhu, Z. Liu, and X. Cheng, “A distributed anomaly detection system for in-vehicle network using HTM,” IEEE Access, vol. 6, pp. 9091–9098, 2018.

[3] E. Seo, H. M. Song and H. K. Kim, “GIDS: GAN based Intrusion Detection System for In-Vehicle Network,” 2018 16th Annual Conference on Privacy, Security and Trust (PST), Belfast, 2018, pp. 1–6

[4] S. Park, J. Choi, “Hierarchical Anomaly Detection Model for In-Vehicle Networks Using Machine Learning Algorithms”, Sensors (Switzerland), 2020, 20, 3934.

[5] C. Sitawarin, A. N. Bhagoji, A. Mosenia, P. Mittal, and M. Chiang, “Rogue Signs: Deceiving Traffic Sign Recognition with Malicious Ads and Logos” (2018)

--

--