Import Dataset ke Python dan R

Data Preprocessing 02

R. Kukuh
3 min readFeb 5, 2018

Berikut adalah cara untuk meng-import dataset ke dalam Spyder / Python atau RStudio / R. Adapun dataset yang dibutuhkan dalam tutorial kali ini dapat di-download disini.

Spyder / Python

IMPORT DATASET

Buka Anaconda Navigator

Jalankan Spyder

Import libraries yang dibutuhkan

Ketik kode berikut:

Kode python untuk membaca file CSV

Jalankan kode tersebut, maka di window console akan muncul pesan ini:

Hasil eksekusi kode

Klik tab variable explorer, akan tampak dataset yang baru saja ter-import

Terciptanya objek baru dalam variable explorer

Dobel klik pada dataset cell, akan muncul popup window seperti ini:

Isi dari objek “dataset”

Seperti yang kita lihat, dataset ini memiliki:

  • Kolom Country, Age, dan Salary sebagai independent variable-nya
  • Kolom Purchased sebagai dependent variable-nya

MATRIX OF FEATURES

Kita akan membuat 2 matrix of features yang berisi values dari independent variable dan dependent variable di atas.

Ketik kode berikut untuk membuat independent variable matrix:

Kode python untuk membuat matrix dari suatu dataset

Eksekusi kodenya. Jika berhasil maka hasilnya seperti ini:

Matrix hasil eksekusi kode

Ketik kode berikut untuk membuat dependent variable matrix:

Kode python untuk membuat matrix dari suatu dataset

Eksekusi kodenya. Jika berhasil maka hasilnya seperti ini:

Matrix hasil dari eksekusi kode

Sampai di sini, jika semua dilakukan dengan benak, maka variabel explorer akan berisi seperti ini:

Terciptanya objek-objek baru hasil pembuatan matrix

RStudio / R

Buka RStudio

Cari folder tempat kerja Anda, lalu Set As Working Directory

Setting untuk “set as working directory” dalam RStudio

Buat R script baru

Cara membuat script R baru

Tulis dan eksekusi kode berikut:

Kode R untuk import dataset

Perintah di atas akan membuat sebuah global environment baru

Terciptanya objek baru hasil eksekusi kode

Klik pada dataset, dan akan muncul tabel berisi dataset

Isi dari objek dataset

Demikian import dataset dalam R. Kita tidak perlu membuat matrix of features-nya.

--

--

R. Kukuh

Sr. Software Dev Learning Facilitator at Apple Developer Academy @UC