Visualisasi Data Dengan Google Data Studio — Hotel Booking Demand

Devina Ellysia Alfiany
7 min readMar 15, 2023

--

Mungkin kita merasa tidak asing dengan visualisasi data. Kalau kita biasa membaca laporan keuangan tahunan akan menemukan gambar yang menjelaskan angka dan grafik, gambar tersebut lah yang kita sebut visualisasi data. Secara garis besar memang terlihat seperti infografis yang sering kita lihat di koran maupun artikel. Visualisasi data maupun infografis juga harus dibuat agar pembaca paham pada data-data yang sudah kita informasikan secara visual. Namun ada beberapa hal yang membedakan antara visualisasi data dengan infografis.

Seorang penulis bernama Randy Krum dalam buku yang berjudul “The Cool Infographics” menjelaskan bahwa visualisasi data adalah bentuk visual dari angka atau jumlah, sedangkan infografis adalah penggabungan desain visual dari visualisasi data, ilustrasi, teks, dan gambar dalam bentuk satu cerita. Dari penjelasan tersebut dapat disimpulkan bahwa visualisasi data dibuat lebih sederhana (hanya berdasar angka dan grafik) daripada infografis yang mencakup semua elemen desain visual.

Di sini saya ingin menjelaskan hasil visualisasi data yang sudah dibuat di Looker Studio (Google Data Studio). Data yang digunakan adalah Hotel booking demand (sumber jurnal : Antonio, N., de Almeida, A. and Nunes, L. (2019) “Hotel booking demand datasets,” Data in Brief, 22, pp. 41–49) dimana dataset yang sudah di cleaned dapat diakses di sini. Terdapat 6 pertanyaan bisnis yang akan dijawab di bawah ini.

Berapa total booking yang dibuat di masing-masing jenis hotel? Lebih banyak di hotel jenis yang telah terbooking apa? Jelaskan insight apa yang di dapat dari visualisasi tersebut.

Caranya adalah memilih diagram yang ada di “Tambahkan diagram” kemudian pilih diagram Batang (Bagan kolom). Setelah muncul dan letakkan diagram di dashboard, klik diagram tersebut maka akan muncul penyiapan dan gaya diagram di sebelah kanan dashboard. Bisa disesuaikan seperti di bawah ini.

Bagian dimensi rentang tanggal pilih reservation_status_date. Dimensinya “hotel”. Kemudian di bagian metrik saya ambil “Record Count” dimana bisa diganti nama menjadi Total Booking. Di bagian Urutkan pilih “Record Count”. Sehingga akan menghasilkan diagram seperti ini.

*Catatan : untuk memunculkan angka di batang diagram bisa dengan centangkan “Tampilkan label data” di bagian Gaya Diagram.
Bisa centangkan juga yang “Nomor ringkas” di bawahnya untuk memperingkas angka yang dihasilkan.

Dari hasil diagram tersebut menunjukkan bahwa City Hotel lebih unggul dalam total booking sebesar 79.988 daripada Resort Hotel dengan total booking sebesar 40.277.

Diketahui dataset ini berasal dari resort hotel di daerah Algarve city hotel di kota Lisbon, keduanya di negara Portugal. Tunjukkan visualisasi yang membandingkan jumlah booking oleh turis lokal ( local market, asal negara Portugal) dan jumlah booking oleh turis inbound (inbound tourism, asal dari negara lain). Dari mana booking paling banyak berasal? Jelaskan insight apa yang di dapat dari visualisasi tersebut.

Untuk pertanyaan kedua ini juga menggunakan diagram batang namun dalam bentuk horizontal.

Penyiapan dalam diagram tersebut bisa disesuaikan dengan dibawah ini.

Karena yang dicari hanya perbandingan turis Portugal dan turis mancanegara saja maka di bagian dimensi dibuat formula baru seperti ini.

Sedangkan bagian metriks Total Booking diganti agregasi menjadi Jumlah (untuk pertanyaan no 1 agregasinya Total) dan jenisnya tetap angka.

Bagian urutkan juga mengganti agregasinya menjadi jumlah.

Dan untuk menfilter data yang muncul hanya data yang tidak membatalkan booking, yakni dengan cara di bawah ini. Filter tersebut akan digunakan hingga pertanyaan ke-3 dan pertanyaan ke-6.

Sehingga akan menghasilkan diagram seperti ini.

Dari diagram tersebut menunjukkan bahwa Turis inbound (mancanegara) lebih dominan dibanding dengan turis lokal (Portugal).

Bagaimana pola ADR (Average Daily Rate) di tiap jenis hotel berdasarkan rata-rata ADR di tiap minggu? Apakah kedua jenis hotel rata-rata ADR naik dan turun di periode (minggu/bulan/musim) yang sama? Jelaskan insight apa yang di dapat dari visualisasi tersebut.

Untuk pertanyaan ketiga ini menggunakan diagram rangkaian waktu (deret waktu).

Penyiapan diagram deret waktu dapat disesuaikan dengan dibawah ini. Agar bisa membandingkan city hotel dan resort hotel menjadi satu diagram, saya mengambil kolom hotel di bagian dimensi perincian.

Untuk bagian dimensi dilampirkan berbagai periode, yakni mingguan, bulanan, dan musiman (kuartal).

Periode mingguan:

Mingguan

Periode bulanan :

Bulanan

Periode musiman (kuartal) :

Musiman (kuartal)

Setelah itu bagian metrik dan pengurutan dimensi perincian tersebut mengambil kolom adr dengan agregasi “Rata-rata” seperti ini.

Bagian Metrik
Bagian Pengurutan dimensi perincian

Jangan lupa melampirkan filter “tidak cancel” yang sudah dibuat sebelumnya. Sehingga akan menghasilkan dimensi seperti ini.

Terdapat panah atas dan bawah untuk melihat hasil dari periode bulanan dan musiman

Dari hasil diagram tersebut menunjukkan bahwa selain bulan Juli dan Agustus, Resort hotel memiliki demand yang lebih kecil dibanding dengan City hotel.

Bagaimana cancellation rate dari masing-masing jenis hotel di tiap bulan? Jenis hotel apa yang memiliki cancellation rate paling tinggi? Jelaskan insight apa yang di dapat dari visualisasi tersebut.

Untuk pertanyaan keempat ini menggunakan diagram deret waktu seperti kasus nomor 3, hanya ada perbedaan di beberapa bagian penyiapan. Penyiapan diagramnya bisa disesuaikan seperti di bawah ini.

Untuk kasus ini tidak perlu memfilterkan tidak cancel di bagian filter seperti kasus sebelumnya karena yang ditanyakan adalah perbandingan tingkat pembatalan booking di kedua hotel tersebut. Sehingga cancellation rate di bagian metrik menggunakan formula seperti di bawah ini.

Begitu juga dengan cancellation rate di bagian pengurutan dimensi perincian menggunakan formula seperti di bawah ini.

Akan menghasilkan hasil diagram seperti ini.

Yang menunjukkan bahwa meskipun City hotel memiliki tingkat booking lebih tinggi daripada Resort hotel, City hotel memiliki tingkat pembatalan booking (cancellation rate) lebih tinggi juga.

Berapa jumlah cancelled bookings untuk masing-masing jenis market segment? Di market segment mana cancellation rate-nya paling tinggi? Jelaskan insight apa yang di dapat dari visualisasi tersebut.

Untuk pertanyaan kelima ini menggunakan diagram garis (kombinasi).

Penyiapan diagram dapat disesuaikan seperti di bawah ini.

Bagian metrik dan urutkan menggunakan kolom data is_canceled dengan agregasi Total. Sedangkan cancellation rate di metrik dapat menggunakan formula yang sudah dijelaskan di kasus nomor 4.

Total Cancel di Metrik
Cancellation rate di Metrik
is_canceled di Urutkan

Untuk kasus ini hanya menggunakan data yang bukan berasal dari market segmentUndefined”. Filter “bukan undefined” akan dibuat seperti ini.

Akan menghasilkan diagram seperti ini.

Untuk menampilkan diagram batang dapat dilakukan dengan cara klik Gaya pada Diagram > cari Rangkaian #2 > pilih Sumbu Kanan

Yang menunjukkan bahwa untuk segment Online TA, walaupun total cancelnya lebih tinggi dari segment yang lain, tetapi persentasenya lebih rendah dibanding segment yang lain.

Hitung persentase total pengunjung hotel di benua Eropa! Jelaskan insight apa yang di dapat dari visualisasi tersebut.

Untuk pertanyaan terakhir ini menggunakan diagram geografis untuk melihat persentase total pengunjung hotel dari segi peta dunia.

Penyiapan diagram bisa disesuaikan di bawah ini. Jangan lupa melampirkan filter “tidak cancel” yang sudah dijelaskan sebelumnya.

Karena yang dilihat adalah persentase tiap negara di benua Eropa, untuk bagian metrik Customer menggunakan agregasi “Total”, jenis “Persen”, dan perhitungan perbandingan “Persen dari total” seperti di bawah ini.

Akan menghasilkan diagram seperti ini.

Karena diagram geografis tidak dapat memunculkan angka di berbagai negara seperti diagram batang maka dapat disimpulkan bahwa selain pengunjung negara lokal (Portugal) dengan persentase tertinggi 22,97%, Perancis menjadi negara dengan pengunjung tertinggi kedua dengan persentase 13,99%.

Untuk melihat keseluruhan visualisasi data yang sudah dibuat di Looker Studio (Google Data Studio) bisa dilihat di link ini.

Dengan demikian hasil visualisasi data saya di Google Data Studio. Mohon maaf apabila ada kekurangan dalam penulisan dan penjelasan hasil visualisasi data ini. Semoga bermanfaat bagi kita semua. Aamiin Yaa Robbal’alamiin.

--

--

Devina Ellysia Alfiany
0 Followers

INTP-T | Master of Management student who also Data Analytics Enthusiast