Yuk, Kenalan Dengan Data Science Dalam Pengolahan Suatu Data

Deby Silvia Agnes
wripolinema
Published in
6 min readOct 12, 2018
Photo by rawpixel on Unsplash

Dalam era Big Data seperti sekarang ini, semua orang selalu membicarakan yang namanya data science. Bahkan telinga kita sudah terlalu terbiasa untuk mendengarkan sebutan ilmu keren yang satu ini. Tapi rasanya sungguh membosankan jika kita hanya mendengar istilah ini, tanpa mengetahui, apa sih sebenarnya Data Science itu.

Sempat juga timbul berbagai pertanyaan, bagaimana bisa google menciptakan mobil tanpa pengemudi? Bagaimana bisa dalam suatu website muncul iklan tentang barang yang sering kita cari? Bagaimana mungkin akun media sosial bisa merekomendasikan artikel, web page ataupun user lain untuk kita ikuti? Dan berbagai pertanyaan bagaimana lainnya. Semua itu merupakan fenomena Big Data. Dengan munculnya banyak platform sebagai tempat kita berbagi cerita, foto, data diri dan sebagainya, menunjukkan bahwa tingkat keamanan data milik kita pribadi sudah tidak menjadi “privasi” lagi. Jumlah data yang tersimpan menjadi luar biasa banyak, bahkan data — data tersebut dapat digunakan untuk kejahatan jika tidak dikelola dengan baik.

Photo by rawpixel on Unsplash

Oleh karena itu, peranan data science sangat penting dalam era Big Data saat ini. Dimana berbagai jenis data baik yang terstruktur maupun tidak terstruktur dapat dianalisa dengan baik. Data science merupakan gabungan dari inferensi data, pengembangan algoritmik, dan teknologi untuk memecahkan masalah analitik yang kompleks. Data science sendiri lebih kepada penggalian atau analisis prediktif suatu data untuk difilter dan ditemukan data yang benar agar menghasilkan suatu data yang akurat sesuai dengan data yang sebenarnya. Dalam Data Science tidak hanya mengandalkan Ilmu Sains saja, akan tetapi ada beberapa ilmu lagi yang harus dimiliki untuk memahami bidang ini.

Diantaranya adalah sebagai berikut :

Photo on https://www.simplilearn.com

Memiliki Pemahaman Tentang SQL, Python, R, SAS, Scala

Photo by Chris Ried on Unsplash

Seorang data scientist harus memiliki kreativitas dan kecerdikan dalam menggunakan keterampilan teknis untuk membangun berbagai hal dan menemukan solusi cerdas untuk suatu masalah. Mengapa hal itu penting?Pada tahap awal, yakni datafication, berbagai data dari aneka sumber harus disiapkan agar bisa dibaca program komputer. Tahap ini membutuhkan keahlian di bidang ilmu komputer. Karena mereka menggunakan teknologi untuk memperebutkan set data yang sangat besar, bekerja dengan algoritma yang rumit, dan itu membutuhkan alat yang jauh lebih canggih daripada Excel.

Para data scientists harus mampu membuat kode untuk solusi cepat prototype, serta mengintegrasikan dengan sistem data yang kompleks. Bahasa inti yang terkait dengan bidang ilmu data termasuk SQL, Algorithm beserta pemrograman dengan Python, R, Scala, SAS, dan lain-lain. Tetapi tidak hanya mengetahui dasar-dasar bahasa, namun mampu secara kreatif menavigasi jalan mereka untuk membuat kode mereka bekerja.

Memiliki Pengalaman Langsung Dalam Pengkodean Basis Data SQL

Photo on https://www.minerra.net/business-analytics/what-data-warehouse-how-deliver-value/data-warehouse/

Mereka harus berpengalaman dalam pengolahan data menggunakan query SQL untuk bisa memahami aliran data yang rumit dan menggunakan logika mereka dengan baik. Beberapa ilmu lain yang harus mereka pahami adalah Advanced Database dan Data Warehouses.

Kemampuan Untuk Bekerja Dengan Data Tidak Terstruktur Dari Berbagai Sumber Seperti Video, Media Sosial, dan Konten Lainnya

“closeup photo of turned on computer monitor” by Markus Spiske on Unsplash

Hal ini berhubungan dengan Big Data. Big Data bisa diartikan dengan suatu cara untuk mengambil, menyimpan, menganalisis data-data yang sebelumnya tidak memungkinkan untuk diambil, disimpan, diproses, dan dianalisa. sehingga memungkinkan ada data yang error dan tidak bisa diproses dengan hal-hal yang biasa. Maka seorang data scientist harus menemukan cara bagaimana nantinya data diproses dan menjadikan data itu bisa disimpan dan diatur dengan cara yang sistematis.

Memahami Beberapa Fungsi Analisis

Analisis cukup populer dalam istilah bisnis populer beberapa tahun terakhir. Analisis dimaksudkan untuk menggambarkan pemikiran kritis yang bersifat kuantitatif. Secara teknis, analitik adalah “ilmu analisis” — dengan cara lain, praktik menganalisis informasi untuk membuat suatu keputusan. Analis dapat berinteraksi dengan data pada tingkat database atau tingkat laporan yang dirangkum.

Photo by Stephen Dawson on Unsplash

Dalam kondisi jika data yang diperlukan sudah siap, tugas berikutnya lebih banyak melibatkan ilmu statistika, optimasi, dan penalaran matematis. Tak heran, seorang Data Scientist harus menguasai Statistics for Data Science, Bayesian Decision Theory, Predictive Analytics, serta Probabilities and Data. Sehingga mereka bisa menganalisis data dengan baik dan benar melalui cara pemrosesan sinyal, model probabilitas, program komputer dan hal yang berkaitan dengan ilmu Sains.

Memahami Machine Learning

Photo on https://www.ie.edu/exponential-learning

Istilah Machine Learning dapat didefinisikan sebagai hasil dari penggunaan algoritma untuk menggunakan data, dipelajari dan kemudian memprediksinya. Software Machine Learning terdiri dari analisis statistik dan analisis prediktif yang digunakan untuk menemukan pola dan menangkap wawasan tersembunyi berdasarkan data yang dirasakan.

Contoh bagus dari implementasi Machine Learning adalah Facebook. Algoritma Machine Learning Facebook mengumpulkan informasi perilaku untuk setiap pengguna di platform sosial. Berdasarkan perilaku sebelumnya, algoritma memprediksi minat dan merekomendasikan artikel dan pemberitahuan di Umpan Berita.

Contoh lainnya adalah pada Google Translate, Google tidak menerjemahkan kata demi kata. Diambil dari konferensi internasional, publikasi ilmiah, dan koleksi perpustakaan, aneka teks disandingkan dengan terjemahannya, lalu disimpan dalam bentuk digital. Tiap frasa dan kalimat dikaitkan dengan terjemahannya, lalu dicari korelasinya.

Intinya dengan algoritma tertentu, data yang satu dikaitkan dengan data lain secara statistik. Ketika jumlah data bertambah, komputer menghasilkan lebih banyak korelasi. Intinya, komputer jadi makin pintar jika disuplai lebih banyak data. Inilah yang disebut Machine Learning.

Beberapa Keampuhan Data Science :

Internet Of Things

Pada era internet of things, banyak alat terkoneksi via internet dan mengirim data. Analisis terhadap machine-generated data ini bisa mengungkap banyak hal baru. Di bidang kesehatan, misalnya, data kondisi ribuan pasien tersaji di komputer lengkap dengan prediksinya. Dokter bisa mengetahui mengapa obat yang satu efektif pada seseorang, tetapi tidak pada pasien lain. Berbagai alat yang terpasang di tubuh pasien akan memasok jutaan data penting yang mustahil dipahami tanpa Data Science.

Komputer Menjadi Semakin Pintar

Seiring waktu, komputer pun makin pintar menghasilkan terjemahan yang lebih baik. Itu sebabnya, Machine Learning termasuk materi pokok perkuliahan data science. Kelak Google bisa menghasilkan terjemahan yang akurat, termasuk menerjemahkan percakapan, dan membuat profesi penerjemah memudar, seperti yang akan menimpa banyak profesi lain akibat teknologi. Dengan Data Science, kita juga bisa lebih dalam memahami perilaku konsumen, seperti Amazon yang sukses mengembangkan sistem rekomendasi pembelian beberapa macam item lain kepada pengunjung situsnya.

Jurusan Data Science di Beberapa Negara

Karena banyak perusahaan raksasa yang memiliki data besar di Amerika seperti Facebook, Google, Amazon, dan LinkedIn, wajar apabila jurusan Data Science banyak ditawarkan di sana, antara lain di Columbia University, New York University, Carnegie Mellon University, Arizona State University, University of Stanford, dan University of California, Berkeley.

Pemerintah Indonesia pun sudah memahami pentingnya penggunaan Big Data. Saat ini, 25 staf dari beberapa kementerian Indonesia ditugaskan belajar di University of South Australia (UniSA). Di sektor pemerintahan, Big Data bisa banyak menghemat belanja operasional, kasus penggelapan keuangan negara bisa ditekan, dan pendapatan dari pajak bisa ditingkatkan.

Peluang Karier

Data Scientist dibutuhkan di semua area yang memerlukan analisis statistik dan melibatkan data yang sangat besar. Bidang aktuaria (asuransi), perbankan, keuangan, konsultan jasa statistik, telekomunikasi, industri pabrik, pemasaran, industri kimia dan farmasi, riset kesehatan, dan pertahanan termasuk yang memerlukan keahlian ini. Posisinya sebagai business analyst, data solutions manager, information systems analyst, market intelligence analyst, dan sejenisnya.

Artikel ini dikutip dari beberapa sumber berikut :

https://datascience.or.id

https://pintaria.com/blog/apa-itu-data-science-yuk-kenalan-dengan-data-analyst-dan-big-data

https://datajobs.com/what-is-data-science

https://www.datasciencecentral.com/profiles/blogs/difference-between-machine-learning-data-science-ai-deep-learning

http://jurusanku.com/data-science2/

https://www.simplilearn.com/data-science-vs-data-analytics-vs-machine-learning-article

--

--

Deby Silvia Agnes
wripolinema

Mengamalkan ilmu dapat menjadikan ilmu dan orang yang berilmu menjadi bermanfaat..