Exploratory Coffee Analysis (Part 2)

Zaky Syihan
Nov 3 · 4 min read

A little step by step exploration on coffee data set

Welcome to Exploratory Coffee Analysis Part 2 !

Artikel ini merupakan lanjutan dari artikel Exploratory Coffee Analysis Part 1. Pada artikel sebelumnya saya membahas secara umum bagaimana kualitas kopi pada tiap negara menggunakan pendekatan Exploratory Data Analysis. Nah pada artikel kali ini kita akan memperkecil cakupan kita hanya pada kualitas kopi Indonesia.

Let’s get this EDA started!

Pada artikel sebelumnya kita sudah melihat peringkat negara dengan kualitas kopi terbaik berdasarkan Total.Cup.Points. Kopi Indonesia berada pada peringkat 15 nih. Not bad lah ya?

Peringkat negara berdasarkan rata-rata Total.Cup.Points

Tapi untuk sekelas Indonesia yang kopi-kopinya terkenal di mancanegara, kenapa ngga masuk ke peringkat 10 besar ya? Nah ini yang perlu kita ulik-ulik!

Oke, pertama kita coba bandingkan Indonesia dengan beberapa negara yang masuk 5 besar dalam data di atas.

Perbandingan Total.Cup.Points kopi Indonesia dengan beberapa negara peringkat 5 besar

Kita dapat menggunakan seaborn boxplot sebagai visualisasi untuk melihat perbandingan Total.Cup.Points tiap negara. Tapi gambar di atas masih tampilan default dari seaborn. Nah coba deh kita bagusin dikit visualisasinya biar lebih gampang untuk diinterpretasikan insight-nya.

Perbandingan Total.Cup.Points kopi Indonesia dengan beberapa negara peringkat 5 besar (Improved)

Nah mending yang mana nih? Yang jelas visualisasinya jadi lebih insightful kan?

Grafik di atas sebenarnya hanya dan di samping visualisasi agar audience lebih mudah dalam memperoleh insight yang didapatkan dari data. Sisanya lebih ke saja, contohnya hanya kita visualisasikan pada sumbu x dan y, tidak pada keseluruhan figure. Lalu menghilangkan judul dan keterangan pada sumbu x untuk mengurangi .

Dari visualisasi di atas kita bisa lihat jelas ternyata . Tapi pasti ada aspek-aspek yang bisa ditingkatkan kopi Indonesia nih biar setidaknya Indonesia masuk 10 besar laaah. Yuk coba kita bandingkan lagi!

Kita fokus saja ke beberapa fitur yang merupakan aspek-aspek penilaian kopinya.

Seleksi fitur sebelum visualisasi

Setelah fitur telah diseleksi, kita akan melakukan group by data kita berdasarkan negara lalu menghitung rata-rata tiap fitur untuk dijadikan ukuran pemusatan data sebagai bahan perbandingan aspek penilaian kopi tiap negara.

Data yang telah dikelompokkan berdasarkan negara

Our data is ready to visualize!

Salah satu jenis grafik yang baik untuk komparasi karakter tiap kopi pada data kita adalah radar(spider) chart. Kita dapat membuat visualisasi dengan menggunakan matplotlib. Dalam visualisasi kali ini saya menggunakan code yang terdapat pada , salah satu referensi yang sering saya kunjungi sebelum membuat visualisasi.

You can check

Perbandingan aspek penilaian kopi Indonesia dengan beberapa negara peringkat 5 besar

Dapat dilihat pada chart di atas,

Ternyata berdasarkan analisis kita masih banyak nih yang perlu ditingkatkan lagi pada kualitas kopi Indonesia.

By the way, speaking about the chart, the information is there, but the chart isn’t quite appealing isn’t it?

Well, what do you guys think about this chart below?

Perbandingan aspek penilaian kopi Indonesia dengan beberapa negara peringkat 5 besar (Improved)

Looks so much better right?

Grafik di atas hanya dibuat menggunakan matplotlib loh. Lebih insightful kan? Walau begitu, pada grafik di atas beberapa informasi harus dihilangkan jika kita lebih mengutamakan estetika dari grafik. Jadi semua tergantung prioritas apa yang ingin teman-teman utamakan dalam membuat visualisasi data.

Semoga artikel ini bisa membantu teman-teman semua yaa dalam membuat visualisasi data yang lebih baik lagi.

Follow dan instagram supaya tidak ketinggalan artikel-artikel terkait data visualisasi dan data science berikutnya.

Tertarik untuk mempelajari Data Science? Kamu bisa mempelajari materi ini lebih lanjut melalui Make-AI Data Science Online Course.

References :

  1. Coffee Beans Reviews by Coffee Quality Institute
  2. Coffee Character
  3. SCAA Cupping
  4. Visualization Reference

Make-AI Data Stories

Inspiration, knowledge, and anything about data science by Make-AI

Zaky Syihan

Written by

Data Science Instructor at Renom Infrastruktur Indonesia

Make-AI Data Stories

Inspiration, knowledge, and anything about data science by Make-AI

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade