Python Application for Data Analysis

Jolly
2 min readOct 6, 2023

--

Photo by AltumCode on Unsplash

Melanjutkan sesi sebelumnya. kali ini penerapan python untuk pemakaian Data Analysis.

Pertama-tama kita prepare data dahulu. dengan code dibawah ini:

#1
#Mengimpor Libraries
import pandas as pd
import numpy as np
from google.colab import files #unggah dan unduh file
import io #membaca data

#2
#Mengimpor dataset
URL = 'https://raw.githubusercontent.com/dataskillsboost/FinalProjectDA11/main/tokopaedi.csv'
df = pd.read_csv(URL)
df.head()

sampai disini dataframe df sudah terisi.

#7
#Mengubah tipe kolom Date menjadi Datetime

df['order_date'] = pd.to_datetime(df['order_date'])
df['ship_date'] = pd.to_datetime(df['ship_date'])

#8
#Membuat kolom tambahan untuk day, month, month_num

df['day'] = df['order_date'].dt.day_name() #nama hari
df['month'] = df['order_date'].dt.month_name() #nama bulan
df['month_num'] = df['order_date'].dt.month # bulan dalam angka
df['year'] = df['order_date'].dt.year #tahun
df['ship_delay']= df['ship_date']-df['order_date']
df['ship_delay'] = df['ship_delay'].dt.days

supaya tipe data tanggal benar. untuk tanggal harus di setting sesuai tipe datetime dan tambahkan beberapa kolom lagi untuk keperluan tanggal. dan sekarang kita masuk ke minitask.

Minitask

Tampilkan TOP 5 Category selama 2016 dengan berdasarkan nilai profit yang paling tinggi. Tampilkan juga dengan bar diagram.

jawab :

#buat kondisi
con1 = df['year'] == 2016

#siapkan dataframe. load data.
df1 = df[(con1)][['category','year','profit']] # filter dan tampilkan field tertentu.
df1 = df1.groupby(by=['category','year'])['profit'].sum() #groupby dan agregat.
df1 = pd.DataFrame(df1.reset_index(name='totalprofit')) #dataframe dan penamaan agregat.
df1 = df1.sort_values(by='totalprofit', ascending=[False]) #sortby totalprofit Desc.
display(df1) #tampilkan data frame

dengan code diatas akan menghasilkan tampilan

dari data tersebut kita buat plot ke grafik. dengan code masih di dalam libary pandas ( tanpa import matplotlib ) sbb :


#Membuat grafik
#dengan fungsi plot yang ada di pandas.

df1.plot(x='category',
y=['totalprofit'],
kind='bar',
grid = True,
xlabel = 'Category',
ylabel = 'Total Profit',
figsize=(12,7),
rot = 0, #Rotasi
title = 'Total Profit 2016 Per Category',
table = False,
# sort_columns = False,
secondary_y = False
)

dan hasil plotnya menghasilkan grafik bar seperti berikut.

sekian artikel kali ini. semoga bermanfaat…thank you.

--

--