Data Analysis Portfolio part III of III
Visualisasi Data menggunakan Google Data Studio (Hotel Booking Demand Datasets)
Halo teman-teman!
Tulisan ini merupakan part terakhir dari portofolio Data Analysis yang saya susun selama mengikuti Intensive Bootcamp Data Analysis by MySkill. Di sini, saya akan membahas mengenai tugas visualisasi data dengan menggunakan tools Google Data Studio yang selanjutnya akan saya sebut GDS. Pemakaian GDS terbilang cukup mudah dan efisien karena tidak memerlukan instalasi.
Preparation
Pada tugas ini, dataset yang saya gunakan merupakan file Google Spreadsheet dari Hotel Booking Demand. Pertama, dilakukan penambahan spreadsheet dan pemilihan sheet yang digunakan ke laporan GDS. Selanjutnya saya mengecek kolom pada sumber data dan merevisi tipe datanya bila kurang tepat, misal: pada kolom id diberlakukan agregasi default jumlah berbeda.
Sebelum mengerjakan exercise, terdapat fitur-fitur yang menurut saya paling wajib dipahami, yaitu: dimensi rentang tanggal, dimensi, metrik, dan filter. Keempatnya berada di sisi kanan GDS.
- Dimensi Rentang Tanggal mengatur jangka waktu komponen yang dipilih, halaman saat ini, atau laporan secara keseluruhan. Pada tugas ini, seluruhnya akan digunakan arrival_date sebagai dimensi rentang tanggal.
- Dimensi mendeskripsikan atau mengategorikan data Anda. Dimensi berisi data yang tidak diagregasi.
- Metrik mengukur dimensi Anda. Metrik berisi data gabungan.
- Filter menyaring atau mengurangi data yang ditampilkan.
Pembahasan Exercise Visualisasi Data
1 — Berapa total booking yang dibuat di masing-masing jenis hotel? Lebih banyak di hotel jenis yang telah terbooking apa?
Dimensi: hotel
Metrik: id (rename: Total Booking)
City Hotel memiliki total booking lebih besar dibandingkan Resort Hotel, yaitu 79330. Berdasarkan analisis sederhana, hal ini dikarenakan City Hotel bertempat di Lisbon, ibu kota Portugal yang lebih padat penduduk dan turisnya.
2 — Diketahui dataset ini berasal dari Resort Hotel di daerah Algarve dan City Hotel di kota Lisbon, keduanya di negara Portugal. Tunjukkan visualisasi yang membandingkan jumlah booking oleh turis lokal (local market, asal negara Portugal) dan booking oleh turis inbound (inbound tourism, asal dari negara lain). Dari mana booking paling banyak berasal?
Dimensi: country_fullname
Metrik: id
Filter: hanya menyertakan is_canceled = 0
Mayoritas booking(72%) berasal dari Turis Inbound (luar Portugal). Hal ini dikarenakan Resort Hotel terletak di Algarve dan City Hotel terletak di Lisbon di mana kedua daerah tersebut merupakan daerah yang banyak diincar turis.
3 — Bagaimana pola ADR di tiap jenis hotel berdasarkan rata-rata ADR di tiap minggu? Apakah di kedua jenis hotel rata-rata ADR naik dan turun di periode (minggu/bulan/musim) yang sama?
Dimensi: arrival_date (Tahun Minggu ISO)
Dimensi Perincian: hotel
Metrik: adr
Filter: hanya menyertakan is_canceled = 0
Kedua hotel memilki kesamaan pola pada bulan september — juni. Sedangkan saat musim panas (juni — september), terdapat peningkatan pada Resort Hotel dan penurunan pada City Hotel.
4— Bagaimana cancellation rate dari masing-masing jenis hotel di tiap bulan? Hotel jenis apa yang memiliki cancellation rate paling tinggi?
Dimensi: arrival_date (Tahun Bulan)
Dimensi Perincian: hotel
Metrik: Cancellation Rate
Kolom baru “Cancellation Rate” dibentuk menggunakan formula:
COUNT_DISTINCT(Total Canceled Booking)/COUNT_DISTINCT(id)
di mana kolom baru “Total Canceled Booking” juga dibentuk menggunakan formula:
CASE WHEN is_canceled = 1 THEN id
END
Terdapat kesamaan pola Cancellation rate di kedua hotel pada september 2015 — juni 2016.
5 — Berapa jumlah canceled bookings untuk masing-masing jenis market segment? Di market segment mana cancellation rate-nya paling tinggi?
Dimensi: market_segment (rename: Market Segment)
Metrik: Total Canceled Bookings dan Cancellation Rate
Filter: mengecualikan market_segment = undefined
Market segment dengan cancellation rate paling tinggi adalah Group, yaitu sebesar 61,06%.
6 — Bagaimana perbandingan tamu yang mendapatkan ruangan sesuai dengan yang direservasi dengan tidak? Apakah ketidaksesuaian ruangan mempengaruhi pembatalan reservasi?
Dimensi: Is Assigned Room the same as Reserved
Metrik: id
Khusus grafik kanan, Filter: hanya menyertakan is_canceled = 0
Kolom baru “Is Assigned Room the same as Reserved” dibentuk dengan menggunakan formula:
CASE WHEN
reserved_room_type=assigned_room_type THEN 'Same as the Reserved'
ELSE 'Different with the Reserved'
END
Berdasarkan grafik di atas, disimpulkan bahwa ketidaksesuaian ruangan bukan penyebab utama reservasi dibatalkan.
Sekian pembahasan mengenai visualisasi data menggunakan Google Data Studio. Link laporan GDS di atas dapat diklik di sini.
Semoga bermanfaat!
Baca juga: