Data Visualization for Data Analytics

Prasetyo Bimantoro
6 min readNov 23, 2022

--

Suatu data yang sangat banyak sangatlah tidak berguna jika tidak diolah dengan baik. Pada akhirnya, data-data perusahaan tentu akan dikelola oleh manusia untuk dapat mengembangkan perusahaan lebih lanjut.

Ketika data telah diolah, knowledge terkait fenomena yang menghasilkan data tersebut didapatkan, sehingga akan menghasilkan sebuah cerita data. Ketika sebuah cerita didapatkan, tugas seorang data analis adalah menceritakan temuannya kepada para stakeholder dan pemangku keputusan bisnis. Agar penyampaian temuan tersebut dapat berlangsung dengan lancar, maka dibutuhkan penggambaran data atau data visualization.

Terdapat banyak software yang dapat dipakai dalam membuat sebuah visualisasi data, seperti Tableau, Google Data Studio, Power BI, dan lain-lain. Pada artikel kali ini kita akan memakai Google Data Studio.

Case Study

Pada studi kasus Data Visualization kali ini, kita akan memakai database hotel yang berasal dari:

Antonio, N., de Almeida, A. and Nunes, L. (2019) “Hotel booking demand datasets,” Data in Brief, 22, pp. 41–49. Available at: https://doi.org/10.1016/j.dib.2018.11.126

Downloaded and cleaned data: https://github.com/rfordatascience/tidytuesday/tree/master/data/2020/2020-02-11

Data yang sudah disatukan dengan data country dan akan dipakai di tugas ini adalah Hotel booking demand

1. Berapa total booking yang dibuat di masing-masing jenis hotel? Lebih banyak di hotel jenis yang telah terbooking apa?

Untuk menjawab pertanyaan nomor pertama, data yang diperlukan adalah agregasi count id dan kategori hotel. Saya memakai pie chart agar dapat menentukan komposisi dari jumlah booking dari setiap jenis hotel. Lalu angka jumlah booking nya divisualisasikan dengan scorechart.

Visualisasi Data Jumlah dan Persentase Pemesanan Hotel Berdasarkan Jenis Hotel

Di Portugal, pemesanan City Hotel lebih tinggi daripada Resort Hotel. Pada 2015–2017, terdapat 79,3 ribu pemesanan City Hotel di Portugal, 66% dari total pemesanan hotel secara nasional.

Call of Action

  1. Sebagai travelling agent, kami perlu menjalin kemitraan dengan City Hotel untuk membuat lebih banyak paket promosi sebagai cara untuk memasarkan layanan kami.
  2. Sebagai pengembang dan/atau manajemen properti, kami perlu lebih memfokuskan sumber daya kami untuk mempertahankan layanan City Hotel pada tingkat tinggi.

2. Tunjukkan visualisasi yang membandingkan jumlah booking oleh turis lokal (local market, asal negara Portugal) dan booking oleh turis inbound (inbound tourism, asal dari negara lain). Dari mana booking paling banyak berasal

Untuk menjawab pertanyaan ini, kita perlu mendapatkan data country dari tourist, lalu membuat sebuah kolom agregasi tourism_type yang ketika data dari country adalah “Portugal”, nilai dari tourism_type adalah “Local Tourism” atau turis lokal. Jika country bukan “Portugal”, nilai tourism_type adalah “Inbound Tourism” atau turis mancanegara. Setelah itu, saya memakai pie chart untuk menampilkan komposisi dan scorechart untuk perincian jumlah pemesanan berdasarkan tipe turis.

Visualisasi Data Jumlah dan Persentase Pemesanan Hotel Berdasarkan Jenis Turis

Seperti pada yang tertera pada chart di atas, jumlah turis mancanegara yang memesan hotel di Portugal lebih banyak daripada turis lokal. Sekitar 70,8 ribu pemesanan hotel, 59% dari jumlah keseluruhan, dilakukan oleh turis mancanegara.

Call of Action

  1. Sebagai agen perjalanan, kita harus memfokuskan upaya pemasaran kita pada wisata inbound. Kita perlu membuat paket perjalanan yang fokus pada tujuan wisata internasional.
  2. Sebagai pengembang dan/atau manajemen properti, kita perlu lebih memfokuskan sumber daya kita untuk menyenangkan wisatawan internasional, seperti menyediakan layanan taksi untuk pergi ke bandara.

3. Bagaimana pola ADR di tiap jenis hotel berdasarkan rata-rata ADR di tiap minggu? Apakah di kedua jenis hotel rata-rata ADR naik dan turun di periode (minggu/bulan/musim) yang sama?

Data yang digunakan pada tabel ini adalah data ADR dengan agregasi average dan data tipe hotel. Karena ingin melihat pola ADR, maka line chart dipilih dalam visualisasi kali ini. Dimensi waktu dari arrival_date diganti ke dalam bentuk month. Pada line chart tersebut, diberikan trendline penunjuk nilai maks dan min pada masing-masing rata-rata ADR per mingguan.

Visualisasi Data Rata-Rata ADR per Minggu Berdasarkan Jenis Hotel
Jumlah Minimal dan Maksimal dari Rata-Rata ADR per Minggu Berdasarkan Jenis Hotel

City Hotel memiliki rata-rata ADR mingguan maksimum sebesar 143,86 dan minimum sebesar 65,05. Hotel resor memiliki rata-rata ADR mingguan maksimum sebesar 212,45 dan minimum sebesar 41,25. Seperti pada grafik, kita dapat melihat bahwa puncak ADR pada Resort Hotel terjadi setiap bulan Juli-Agustus dan puncak kedua setiap bulan Desember-Januari. Pada tahun 2015 dan 2016 kita dapat melihat tren serupa dengan ADR rata-rata City Hotel, meskipun perbedaannya jauh lebih kecil dan trennya jauh lebih stabil.

Call of Action

  1. Sebagai agen perjalanan, kami perlu mempromosikan paket hotel resor pada puncak periodenya.
  2. Sebagai manajemen hotel, kami perlu memaksimalkan sumber daya kami untuk mempertahankan standar kualitas layanan yang baik di hotel resort.

4. Bagaimana cancellation rate dari masing-masing jenis hotel di tiap bulan? Hotel jenis apa yang memiliki cancellation rate paling tinggi?

Data cancellation rate didapatkan dengan menghitung persentase count(id) pada saat is_canceled = 1 per keseluruhan count(id). Dengan memakai line chart sebagai media visual, mengganti dimensi waktu ke dalam bentuk month, serta menggunakan filtering, didapatkan data persentase cancellation rate per jenis hotel di setiap bulan. Lalu trendline pada setiap series hotel diberikan untuk menunjukkan nilai maksimum dan minimum setiap tipe hotel.

Visualisasi Data Cancellation Rate per Bulan Berdasarkan Jenis Hotel
Jumlah Minimal dan Maksimal dari Cancellation Rate per Bulan Berdasarkan Jenis Hotel

City Hotel memiliki tingkat pembatalan bulanan maksimum 67% dan minimum 24%. Hotel resor memiliki tingkat pembatalan bulanan maksimum 39% dan minimum 13%. Secara keseluruhan, hotel kota memiliki tingkat pembatalan yang cukup besar yaitu 42%, sedangkan hotel resor memiliki tingkat pembatalan 28%.

Call of Action

Sebagai manajemen hotel, kami perlu menambah atau menaikkan biaya pembatalan City Hotel atau menetapkan uang muka untuk menurunkan tingkat pembatalan.

5. Berapa jumlah cancelled bookings untuk masing-masing jenis market segment? Di market segment mana cancellation rate-nya paling tinggi?

Karena terdapat banyak data yang perlu ditampilkan, digunakan tabel untuk menampilkan jumlah canceled bookings dan cancellation rate. Lalu saya menambahkan percent canceled yang merupakan persentase jumlah pemesanan yang di-cancel pada segmentasi market per jumlah pemesanan yang di-cancel secara keseluruhan. Kemudian penekanan pada data diberikan warna merah.

Tabel Data Jumlah Cancel dan Cancellation Rate Berdasarkan Jenis Segmen Pasar

Segmen Online TA memiliki jumlah pemesanan yang dibatalkan tertinggi di antara semua segmen, tetapi segmen Groups memiliki cancellation rate tertinggi secara keseluruhan. Dengan 47% dari seluruh pemesanan hotel yang dibatalkan, segmen agen perjalanan online memiliki tingkat pembatalan hanya 36,72%. Sedangkan segmen grup yang dengan 27% dari seluruh pembatalan pemesanan memiliki tingkat pembatalan sebesar 61,06%.

Call of Action

Sebagai manajemen hotel dan agen perjalanan, kita perlu menganalisis lebih jauh alasan utama mengapa pelanggan (terutama di segmen grup) membatalkan pemesanan hotel mereka. Kami perlu melakukan survei kepada pelanggan yang membatalkan pemesanan hotel mereka untuk kemudian membantu memberikan keputusan untuk menurunkan tingkat pembatalan.

6. Dari data yang sama buatlah satu buah visualisasi tambahan yang berbeda dari 5 soal di atas

Visualisasi yang akan dibuat adalah mengenai cancellation rate dari Channel Distribution. Hal ini penting untuk menganalisis terjadinya pembatalan pemesanan, karena terdapat kemungkinan bahwa channel distribusi yang memiliki track record yang kurang memadai akan cenderung melakukan pembatalan pemesanan lebih sering. Data yang digunakan adalah Cancellation Rate dan Distribution Channel. Chart yang akan digunakan adalah bar chart karena hanya ingin menampilkan perbandingan dengan sesimpel mungkin.

Data Perbandingan Cancellation Rate terhadap Channel Distribusi

TA/TO memiliki cancellation rate tertinggi sebesar 41%. Jika dibandingkan dengan jalur distribusi yang lain, TA/TO memiliki jarak yang cukup jauh, sehingga dapat dikatakan bahwa TA/TO memiliki andil yang cukup signifikan terhadap pembatalan pemesanan hotel.

Call of Action

  1. Sebagai agen perjalanan (Travel Agent/Tour Operator), kami perlu membebankan biaya pembatalan kepada pelanggan kami untuk meminimalkan tingkat pembatalan. Tingginya tingkat pembatalan pemesanan hotel juga harus dianalisis lebih lanjut terhadap tingkat pembatalan tour oleh turis.
  2. Sebagai manajemen hotel, kami perlu membebankan biaya pembatalan kepada agen perjalanan untuk meminimalkan tingkat pembatalan.

--

--