Cara Cleaning Data dengan Menggunakan Python dan Google Collab — Studi Case Laporan Transaksi Penjualan

Rizki Syaputra
Haneul Lab
Published in
4 min readNov 7, 2024

--

Bismillah

Pada artikel ini kita akan membahas tentang salah satu cara yang bisa kita lakukan untuk proses cleaning Data.

Cleaning data bermaksud data yang akan kita analisa nantinya sudah clean atau bersih dari berbagai aspek seperti data null, data duplicate, format data dan lainnya sehingga pada proses analisa data akan lebih muda. Cleaning data adalah proses kedua dari serangkaian proses yang akan kita lakukan untuk analisa data. Proses ini kita lakukan setelah kita mendapatkan data (gathering data)

Contoh data laporan yang akan kita gunakan adalah seperti dibawah ini

Baik, untuk proses cleaning data disini kita akan menggunakan python dan juga google collabs.

Step 1 : Import file laporan tersebut agar bisa di baca dan di olah

from google.colab import files
upload = files.upload()

Step 2 : Import library pandas dan membaca file csv

import pandas as pd             # import pandas
df = pd.read_csv("P9-OLTP.csv") #read .csv and…

--

--

Haneul Lab
Haneul Lab

Published in Haneul Lab

Haneul (하늘) berarti “langit” dalam bahasa Korea, menggambarkan ambisi untuk mengeksplorasi ilmu data seluas langit. Bisa menjadi Haneul Lab atau Haneul Data.

Rizki Syaputra
Rizki Syaputra

Written by Rizki Syaputra

Chief Executive Officer and Founder UDACODING, Senior Software Developer and Trainer at UDACODING

Responses (3)