Cara Cleaning Data dengan Menggunakan Python dan Google Collab — Studi Case Laporan Transaksi Penjualan
Bismillah
Pada artikel ini kita akan membahas tentang salah satu cara yang bisa kita lakukan untuk proses cleaning Data.
Cleaning data bermaksud data yang akan kita analisa nantinya sudah clean atau bersih dari berbagai aspek seperti data null, data duplicate, format data dan lainnya sehingga pada proses analisa data akan lebih muda. Cleaning data adalah proses kedua dari serangkaian proses yang akan kita lakukan untuk analisa data. Proses ini kita lakukan setelah kita mendapatkan data (gathering data)
Contoh data laporan yang akan kita gunakan adalah seperti dibawah ini
Baik, untuk proses cleaning data disini kita akan menggunakan python dan juga google collabs.
Step 1 : Import file laporan tersebut agar bisa di baca dan di olah
from google.colab import files
upload = files.upload()
Step 2 : Import library pandas dan membaca file csv
import pandas as pd # import pandas
df = pd.read_csv("P9-OLTP.csv") #read .csv and…