Merge, join, append, concatenate

Pandas Dataframe

Dadan Dahman W.
Howdy Sysinfo
3 min readFeb 20, 2022

--

Pandas menyediakan berbagai fasilitas untuk menggabungkan Series atau DataFrame dengan berbagai jenis logika yang ditetapkan untuk indeks dan fungsionalitas aljabar relasional dalam kasus operasi tipe join / merge.

Selain itu, pandas juga menyediakan utilitas untuk membandingkan dua Series atau DataFrame dan merangkum perbedaannya.

Concatenating

Method .concat() dapat digunakan pada dataframe yang ditujukan untuk penggabungan baik dalam row-wise (dalam arah) atau column-wise.

Mari kita mulai dengan method .concat() pada row-wise.

Untuk penerapan concat pada column-wise:

Dapat juga menambahkan identifier dari dataframe untuk data yang ditambahkan.

Merge

Method .merge() untuk menggabungkan Series/Dataframe yang bentuknya mirip dengan syntax join di SQL, specify left and right tables, join key, dan how to join (left, right, inner, full outer).

method .merge() yang ekivalen dengan SQL left join.

method .merge() yang ekivalen dengan SQL right join.

method .merge() yang ekivalen dengan SQL inner join.

method .merge() yang ekivalen dengan SQL outer join.

Bagaimana jika salah satu dataframe atau keseluruhan dataframe yang akan digabungkan tersebut memiliki multi index?

Join

Method .join() digunakan pada dataframe untuk menggabungkan kedua data dengan set index pada kedua tabel tersebut sebagai join key, tanpa index, hal ini tidak akan berhasil.

Kita akan menggunakan parameter how = “outer”.

Kita akan menggunakan parameter how = “inner”.

Append

Method .append() dapat digunakan pada dataframe/series yang ditujukan untuk menambah row-nya saja. Jika di SQL memiliki 2 tabel atau lebih maka dapat menggabungkannya secara vertikal dengan Union. Jadi SQL Union ekuivalen dengan method .append() di Pandas.

Method .append() tidak digunakan lagi dan akan dihapus dari pandas di versi mendatang. Gunakan pandas.concat sebagai gantinya.

Sekian bab kali ini, semoga bermanfaat.

--

--