Report Dataset Kompetisi Data Engineering — #4 Epileptic Seizure EEG Dataset

Ramdhanii Ram
BISA.AI
Published in
3 min readMay 15, 2020
Image from Tayla Jeffs @ Unsplash

Dengan mengambil data-data mentah yang tersedia di Internet dan mengolahnya secara mandiri, Muhammad Irfan Girindra mahasiswa Institut Teknologi Bandung ini berhasil meraih kategori Best Science dalam kompetisi pengumpulan data yang dilaksanakan oleh BISA.AI dan Tebar Bisa Foundation.

Penjelasan Dataset

EEG atau kepanjangannya electroencephalogram adalah sebuah tes yang berfungsi untuk mengevaluasi aktivitas otak, salah satu pemanfaatannya adalah epilepsi/seizure. Berikut contoh hasil berbagai gelombang EEG:

Malmivuo, Jaakko & Plonsey, Robert. (1995). Bioelectromagnetism. 13. Electroencephalography.

Dataset ini bersumber dari CHB-MIT yang dapat diunduh pada link berikut : https://physionet.org/content/chbmit/1.0.0/

Data di atas terdiri dari rekaman 23 pasien epilepsi yang mengalami kejang-kejang selama perekaman sinyal EEG nya.

Cara Pengolahan

Kembali lagi kita menggunakan Python sebagai bahasa pemrograman yang membantu proses ekstraksi fitur-fitur, ekstraksi fitur lainnya yang pernah saya bahas ada di “Report Dataset Kompetisi Engineering #01 — Dataset Klasifikasi Fitur dan Emosi pada Podcast”.

Namun kali ini proses ekstraksi fitur cukup berbeda. Alurnya seperti di bawah ini :

Bersumber dari proposal dataset

Berikut saya kutip beberapa penjelasan dari pembuat dataset tentang masing-masing tahap:

  • Pengumpulan Data EEG, dilakukan pengumpulan dari website di atas.
  • Filtering, dilakukan filtering sinyal EEG untuk menghilangkan Noise.
  • Centerin, dilakukan centering sinyal EEG, yaitu menjadikan sinyal EEG berosilasi di titik 0.
  • Independent Component Analysis, untuk menghilangkan artefak sinyal, seperti sinyal detak jantung, sinyal pada saat menutup dan membuka mata, dll.
  • Average and crop data, dilakukan transformasi multi channel sinyal yang terdapat pada EEG menjadi satu sinyal gelombang saja. Lalu, sinyal akan dipotong setiap lima detik untuk memperbanyak data.
  • Feature extraction, sinyal EEG diekstrak menggunakan Python dan library-nya agar dapat dianalisis oleh Data Scientist atau dipakai oleh Machine Learning Engineer.

Semua hal di atas dibantu oleh :

  • MNE Python, untuk load data, Filtering, ICA, Evoked Data, dan Feature Extraction.
  • PyEEG, membantu ekstraksi fitur lainnya
  • Librosa, membantu ekstraksi fitur

Hasil

Terdapat 11 fitur yang berhasil diekstrak, satu diantaranya adalah High Level Feature yang berbentuk Spectogram.

Berikut Low Level Features yang diesktrak :

  • Mean
  • Variance
  • Standar Deviance
  • Kurtosis
  • Skewness
  • Power Spectral Density
  • Zero Crossing
  • Spectral Entropy
  • Spectral Centroid
  • Kelas (0=Normal, 1=seizure)

Ada juga informasi tambahan seperti nomor pasien untuk memastikan pasien mana yang mengalami kejang-kejang. Hasilnya ada file berbentuk .csv dan .sql. Contohnya seperti di bawah:

Hasil data berbentuk .csv

High Level Features :

Dengan Perkiraan total ada kurang lebih 4000 data dengan masing-masing 2000 data normal dan 2000 data epilepsi/seizure.

Pemanfaatan

Di proposal, pembuat dataset juga mencantumkan dua manfaat yang diharapkan bisa dicapai.

  1. Dalam Bidang Edukasi

Memperkenalkan Machine Learning dan Artificial Intelligence dalam bidang biofisika/biomedis kepada mahasiswa biologi/fisika. Dengan ada nya data yang sudah berupa fitur, maka diharapkan mahasiswa biologi dan fisika dapat mempelajari bagaimana mengaplikasikan Machine Learning di bidang jurusannya

2. Dalam Bidang Research

Dengan ada nya data ini, maka diharapkan terdapat model Machine Learning yang mampu mempelajari pola data sinyal EEG, yang dapat mengklasifikasikan antara sinyal normal dan saat kejang-kejang. Sehingga model Machine Learning tersebut dapat dijadikan sebagai alat pendeteksi epilepsi, atau bersama dengan Brain Computer Interfrace (BCI), dapat dijadikan sebagai alat early epilepsy detection.

Dataset ini bisa anda lihat dan dapatkan di https://bisa.ai/Dashboard/dataset

Sekian tulisan saya mengenai laporan dataset keempat kompetisi Data Engineering BISA.AI dan Tebar Bisa kali ini. Mohon maaf jika sebelumnya ada kesalahan. Terimakasih!

--

--

Ramdhanii Ram
BISA.AI
Writer for

Work stuffs & making sense interesting thoughts from my brain.