Analisis Data Kejahatan di Boston Menggunakan Python

Jamaludin Fikri
purwadhikaconnect
Published in
4 min readSep 26, 2019

Data adalah catatan atas kumpulan fakta. Data merupakan bentuk jamak dari datum, berasal dari bahasa Latin yang berarti “sesuatu yang diberikan”. Dalam penggunaan sehari-hari data berarti suatu pernyataan yang diterima secara apa adanya. Pernyataan ini adalah hasil pengukuran atau pengamatan suatu variabel yang bentuknya dapat berupa angka, kata-kata, atau citra. ~ wikipedia

Di era sekarang ini, banyak sekali teknologi yang semakin canggih. Salah satunya adalah database. Teknologi database merupakan kumpulan data yang disimpan di dalam komputer secara sistematik sehingga dapat diperiksa menggunakan program komputer untuk memperoleh informasi dari basis data tersebut.

Kali ini saya akan mencoba mencari insight atau informasi dari data yang saya peroleh di kaggle. Yaitu data Crimes in Boston, atau laporan data kejahatan di kota Boston.

Boston sendiri merupakan ibu kota dan kota terbesar di Massachusetts di Amerika Serikat. Kota ini salah satu kota tertua dan terkaya di A.S dengan luas wilayah sekitar 232,1 km² dan memiliki jumlah penduduk lebih dari 600 ribu jiwa.

Data ini merupakan data resmi yang dicatat oleh Boston Police Department. Kalian bisa mengecek disini. Sedangkan data yang saya coba analisis merupakan data dari tahun 2015 sampai tahun 2018.

Terdapat sekitar 319.000 baris dan 17 kolom dari dataset yang saya dapatkan di kaggle.

Langsung saja kita analisis data ini, saya menggunakan Jupyter Notebook dan beberapa library Python untuk menganalisa data seperti Pandas dan Numpy. Dan juga saya menggunakan Seaborn untuk membuat visualisasi data, sedangkan untuk membuat interactive heatmap di Boston, saya menggunakan Folium.

Daftar Isi

  1. Data Extraction
  2. Cleaning the Data
  3. Exploratory Data Analysis
  4. Conclusion

1.1 Import data dan library yang dibutuhkan

import data dan library

1.2 Melihat informasi dari data

Dari gambar diatas, kita bisa mengetahui bahwa data kita memiliki 319073 baris dan 17 kolom. Beberapa kolom memiliki missing value yang cukup banyak dan juga kita dapat mengetahui tipe data dari tiap tiap kolom.

2. Data cleaning

Beberapa hal yang saya lakukan di dalam data cleaning adalah sebagai berikut :

  • Menghapus kolom yang tidak diperlukan untuk analisis data.
  • Mengganti tipe data kolom occured_on_date menjadi datetime.
  • Mengisi Nan value pada kolom Shooting, karena setelah saya amati, kolom shooting hanyalah berisi 2 unik value, antara Y atau N, maka saya berkesimpulan apabila kolom shooting Nan maka kemungkinan karena tidak ada tembakan saat terjadi kejahatan, maka saya isi dengan N.

3. Exploratory data analysis

3.1 Functions untuk visualisasi data

3.2 Komparasi kejahatan di tiap-tiap district di Boston

Bar plot di atas menunjukan bahwasanya District B2 Merupakan kawasan dengan kejahatan paling banyak di Boston.

3.3 Total kejahatan di tiap tahun

Kita bisa mengetahui bahwasanya di tahun 2018, tingkat kejahatan menurun menjadi 20.6%.

3.4 Komparasi kejahatan di tiap bulan

3.5 Jam-jam yang sering terjadi kejahatan

3.6 Tipe kejahatan paling sering terjadi

3.7 Membuat map tempat paling sering terjadi kejahatan

4. Konklusi

Sebenarnya masih banyak banget insight yang bisa kita dapatkan dari data Crime in Boston, tapi bagi saya beberapa chart di atas sudah bisa menjawab beberapa pertanyaan-pertanyaan penting yang berkaitan dengan data seperti,

  • Apakah ada penurunan tingkat kejahatan tiap tahunnya?
  • Distrik manakah yang seharusnya mendapatkan perhatian khusus dari Departemen Kepolisian di Boston?
  • Pada jam berapa kejahatan biasanya terjadi?
  • Jenis kejahatan apa yang paling sering terjadi di Boston?

Dari analisis di atas juga, polisi dapat menentukan jam-jam patroli yang tepat di daerah tertentu, atau mungkin polisi dapat menentukan untuk menambah pos polisi di daerah yang sering terjadi Kejahatan.

Referensi: 1, 2.

Jika kamu ingin mempelajari python lebih lanjut dapat mempelajarinya di program-program Data Science Purwadhika Startup & Coding School di sini.

--

--