Cara Mudah Crawling Instagram dengan Menggunakan Instalooter

Melakukan crawling hanya dengan satu perintah

Fahmi Salman
Miloo Community
Published in
3 min readAug 22, 2020

--

Instagram merupakan salah satu media sosial paling populer saat ini. Hampir semua orang mempunyai akun Instagram. Banyak orang menggunakan Instagram untuk berbagi foto/video dengan kerabat mereka, serta disediakan juga beberapa filter untuk memperindah foto/video yang akan diunggah.

Sekarang ini, Instagram tidak hanya digunakan untuk keperluan pribadi, banyak juga yang menggunakannya untuk keperluan bisnis, seperti endorsement, marketing, dll. Biasanya dalam melakukan bisnis, pasti perlu melakukan analisis pasar, misalnya dengan menganalisis trend yang ada saat ini.

Salah satu caranya dengan menggunakan media sosial, dan Instagram merupakan salah satu platform yang banyak digunakan, karena orang cenderung memposting apa yang mereka sukai di Instagram. Di postingan kali ini, saya akan sedikit memberikan tips dalam melakukan crawling data di Instagram.

Di postingan kali ini, saya akan melakukan crawling pada akun miloo.project.

miloo.project on Instagram

Pertama-tama kita harus melakukan instalasi terlebih dahulu package instaLooter dengan menggunakan perintah di bawah ini.

$ pip install instaLooter

Untuk dokumentasi dari penggunaan instaLooter sendiri dapat kamu lihat pada tautan ini.

instaLooter documentation

Kita akan mulai dengan command sederhana. Kamu tidak usah menggunakan code editor, cukup dengan menggunakan command prompt (Windows) atau terminal (Linux/macOS). Disini kita akan menggunakan command instaLooter user miloo.project miloo-project, dimana miloo.project merupakan username yang kita crawling, sedangkan miloo-project merupakan directory tempat kita akan menyimpan file tersebut. Jika proses berhasil, akan muncul tampilan seperti ini.

Download process

Jika sudah selesai, kita bisa melihat folder yang kita telah definisikan sebelumnya.

Folder

Di dalam folder tersebut akan berisi gambar-gambar dari postingan yang telah kita crawling.

Image crawling

Selain itu, kita juga bisa menambahkan beberapa parameter, seperti waktu, video, dll. Disini, saya akan mencoba melakukan crawling dari tanggal 12 Agustus 2020 sampai dengan 22 Agustus 2020, dan saya tidak akan melakukan crawling gambar, melainkan hanya metadata nya saja. Maka ini command yang saya gunakan.

instaLooter user miloo.project miloo.project --time 2020-08-12:2020-08-22 -D

Parameter —-time merupakan parameter waktu postingan yang akan kita ambil, sedangkan -D merupakan opsi untuk hanya mengambil metadata saja. Hasilnya merupakan metadata yang terdiri dari 4 file json, dimana setiap file mewakili satu postingan.

instaLooter with parameter

Berikut merupakan contoh isi dari file json tersebut.

{"__typename": "GraphSidecar",
"caption_is_edited": false,
"commenting_disabled_for_viewer": false,
"comments_disabled": false,
"dimensions": {
"height": 1080,
"width": 1080
},
"display_resources": [{
"config_height": 640,
"config_width": 640,
...
}],
...}

File json tersebut berisi caption, comment, like, dll. yang bisa berguna untuk melakukan analisis data.

Selain melakukan crawling dengan username, kamu juga bisa melakukan crawling dengan menggunakan hashtags. Selain itu, kamu juga bisa mencoba beberapa parameter yang disediakan instaLooter untuk melakukan crawling di Instagram.

Untuk melakukan pengolahan data dari metadata yang sudah kita dapat, kamu bisa mengunjungi tautan berikut.

Sekian yang bisa saya sampaikan, semoga bermanfaat!

--

--