Mengenal Software R dan Manfaatnya Bagi Data Scientist

IYKRA
Iykra
Published in
3 min readJul 20, 2018

Dalam dunia teknlogi ada beragam jenis software bahasa pemrograman, salah satunya adalah R. Dikalangan para data scientist mungkin nama R sudah tidak asing lagi di dengar bahkan digunakan dalam menunjang pekerjaan sehari-hari.Pada awalnya, R sendiri diciptakan oleh Ross Ihaka dan Robert Gentleman pada tahun 1995 sebagai implementasi dari bahasa program S. Tujuannya untuk mengembangkan bahasa yang fokus pada analisis data, statistik, dan model grafis.

Dahulu, R hanya digunakan oleh para akademisi, namun lama-kelamaan R juga banyak digunakan oleh para praktisi di dunia bisnis. Hal inilah yang membuat R menjadi sangat terkenal di seluruh dunia.

Salah satu keunggulan R adalah komunitas besar yang tergabung dalam satu mailing-list, dokumentasi para pengguna yang mudah diakses, grup Stack Overflow yang sangat aktif, dan koleksi packages R yang dibagikan oleh sesama pengguna.

Di masa sekarang, R biasanya lebih banyak digunakan untuk analisis data yang dikerjakan pada server pribadi. R dapat difungsikan untuk pekerjaan eksplorasi hampir semua jenis data karena banyaknya jenis packages, test, dan tools yang dengan mudah bisa diadaptasi.Penggunaan rumus-rumus rumit dalam R juga mudah diatur. Pada penggunaan R, langkah pertama yang harus dilakukan adalah mengunduh RStudio IDE (Integrated Development Environments). Lalu, mengapa kebanyakan data scientist lebih suka menggunakan R?

Jawabannya tak lain adalah karena R sangat baik dan mudah digunakan dalam visualisasi data. Ya, ada banyak sekali packages yang mendukung R untuk membangun visualisasi menarik, seperti GGPLOT2 untuk membuat grafik, lattice untuk menampilkan hubungan varibel, dan rCharts untuk menerbitkan visualisasi Java Script dengan R.

R juga dibangun dalam ekosistem yang baik sehingga memudahkan penggunanya untuk menemukan packages dalam cran, bioconductor, dan github. R pun dibangun oleh statistisi untuk statistisi, sehingga siapapun yang tidak memiliki keahlian programming dalam dengan mudah beradaptasi dengan R.

Namun, di balik semua itu, R bersifat lambat. Hal ini disebabkan oleh kondisi yang tidak jelas dimana R merupakan bahasa dan implementasi dari bahasa tersebut. Bahasa R juga mempunyai definisi abstrak, yang mengartikan maksud kode R dan bagaimana kode tersebut bekerja.

Lalu bagaimanakah cara mudah bagi pemula dalam menggunkan software ini? Langkah pertama tentunya adalah dengan meninstall software R, kemudian install R studio untuk melakukan coding dengan lebih mudah.

Setelah selesai melakukan proses coding, Anda bisa menyimpan value di sebuah variable, namun perlu diperhatikan bahwa data yang tersimpan harus ada angka numeric, character, dates dan logical (boolean). Anda juga bisa mengelompokan tipe data yang sama melalui vectors dan functions untuk memudahkan Anda memproses data. Data-data tersebut juga bisa diisi pada kolom data frame sejenis excel agar mudah dibaca.

Setelahnya Anda bisa langsung membuat list container data yang berbeda, melalui matrix berisi index colomn dan row. Hampir mirip data frame, meskipun representai dan rulesnya jelas berbeda. Nah, point point di atas harus dikuasai terlebih dahulu bagi para pemula sehingga nantinya akan mudah untuk programming yang automate. Untuk itu, selamat mencoba!

Sumber:

Penulis: Aprilia Safitri

Illustrasi: Rizaldi Adiputra

--

--

IYKRA
Iykra
Editor for

Crafting Technology Capabilities, IYKRA’s vision is to build an Artificial Intelligence (AI) Talent Ecosystem in Indonesia. www.iykra.com