Wordcloud Sederhana Menggunakan Python

Tedy Suwega
Miloo Community
Published in
5 min readAug 13, 2020

Wordcloud adalah suatu cara memvisualisasikan atau menggambarkan kata-kata dengan menyoroti frekuensi kata yang muncul dalam suatu teks. Wordcloud juga dapat menjadi suatu cara awal dalam melakukan analisa terhadap topik atau wacana, dalam suatu data teks.

Dengan wordcloud kita bisa mendapatkan visualisasi yang unik dari suatu data teks dengan memperhatikan besar kecilnya kata dalam wordcloud. Besar kecil kata dalam wordcloud merepresentasikan jumlah kemunculan kata, semakin besar kata semakin sering kata tersebuat muncul dalam teks.

Dalam artikel ini kita akan mencoba untuk membuat wordcloud sederhana menggunakan python.

Sebelum itu, kita memerlukan data yang akan kita buatkan wordcloud. Data dapat kita ambil dengan cara scraping menggunakan bantuan library nespaper3kpada python. Untuk penjelasan lebih lengkap tentang newspaper3k dapat dibaca di medium di bawah ini:

https://medium.com/milooproject/web-scraping-berita-dengan-4-baris-kode-menggunakan-python-7fb6a8113a67

Beberapa package python yang diperlukan:

  1. newspaper3k
  2. wordcloud
  3. matplotlib

Mempersiapkan data

Dimulai dengan import library newspaper3k , dengan menambahkan code

from newspaper import Article

Setelah import library, dilanjutkan dengan menambahkan tautan berita yang akan di scrap. Disini saya coba menggunakan data berita dati tirto.id dengan judul “Jokowi Minta Pramuka Lakukan Gerakan Disiplin Protokol COVID-19”

article = Article('https://tirto.id/jokowi-minta-pramuka-lakukan-gerakan-disiplin-protokol-covid-19-fXqw', 'id') # Indonesia

dilanjutkan dengan melakukan parsing

article.download()
article.parse()

dan dilanjutkan dengan mengambil data yang akan digunakan untuk membuat wordcloud. Disini saya coba hanya dengan data berita.

berita = article.text
print('Teks berita:', berita)

Hasil dari scraping kurang lebih akan seperti teks dibawah:

Teks berita: Jokowi meminta agar pramuka peduli terhadap masyarakat, kepentingan bersama, bergotong royong, dan disiplin selama Covid-19.      Ia meminta para pramuka membuat dua gerakan nasional, yakni gerakan kedisiplinan nasional untuk mendorong masyarakat disiplin protokol kesehatan serta gerakan kepedulian nasional sebagai upaya mengajak masyarakat peduli lingkungan.    “Dua gerakan ini bukan hanya untuk membantu penanganan masalah nasional akibat pandemik, tetapi dua gerakan tadi akan semakin mengasah jiwa dan karakter kepemimpinan saudara-saudara dalam memperdalam jiwa pramuka sejati sebagaimana tertuang dalam Dwi Darma, Tri Satya, dan Dasa Dharma Pramuka,” kata Jokowi.    Jokowi juga meminta agar para anggota pramuka untuk mampu menguasai ilmu pengetahuan dan teknologi. Ia mengatakan, pengetahuan dan teknologi sangat penting karena tantangan dunia semakin berat dan kompleks.    Jokowi mengingatkan, dunia saat ini berubah dengan cepat dan penuh ketidakpastian.    “Masa depan akan jauh lebih berbeda jika dibandingkan dengan hari ini. Ketangguhan saudara-saudara juga harus saudara-saudara buktikan dalam mengejar ilmu pengetahuan,” kata Jokowi.    Jokowi menambahkan, “Jadilah generasi masa depan yang mencerahkan, yang terus membangun harapan tentang kejayaan Indonesia, Indonesia maju yang kita cita-citakan Bersama.”    Ketua Kwartir Nasional Pramuka Komjen (purn) Budi Waseso mengatakan perayaan Kwarnas Pramuka sedianya selalu digelar pada 14 Agustus 2020. Namun mereka mengubah jadwal agar presiden bisa tetap memberikan arahan kepada para anggota pramuka.    “Kami mengetahui bahwa Bapak Presiden pada 14 Agustus 2020 ini telah memiliki agenda pidato kenegaraan Presiden di DPR MPR RI. Maka kami menyadari hal itu dan kami mengusulkan acara hari pramuka pada 12 Agustus 2020 sehingga Bapak Presiden dapat hadir serta memberikan pengarahan dengan tidak mengurangi makna dari hari pramuka itu sendiri," kata pria yang karib disapa Buwas itu saat memberikan sambutan secara daring dari Cibubur, Jakarta, Rabu.    Dalam laporan tersebut, ia melaporkan kalau gerakan pramuka memahami dampak pandemi Covid-19 di Indonesia dan dunia. Namun gerakan Pramuka, kata Buwas, akan terus berjalan.    Ia pun melaporkan kalau gerakan pramuka ikut menangani Covid-19 dalam bentuk bakti sosial dan bakti masyarakat seperti membagikan ribuan masker dan hand sanitizer, penyemprotan disinfektan di fasilitas publik donor darah serta ribuan paket sembako bantuan dari Bulog, Bank Mandiri Syariah serta berbagai instansi lain dan perorangan.    Baca juga: Jokowi: Peran Pramuka Penting untuk Hadapi Soal Narkoba Hingga Hoax  Update Corona Indonesia 12 Agustus Bertambah 1.942, DKI Sumbang 529  Uji Klinis Vaksin Corona Indonesia Dimulai: 20 Relawan Disuntik tirto.id - Presiden Joko Widodo menghadiri upacara peringatan HUT Pramuka ke-59 secara daring dari Istana Negara, Jakarta, Rabu (12/8/2020). Jokowi pun meminta agar para pramuka untuk peduli terhadap masyarakat, peduli kepentingan bersama, bergotong royong, dan disiplin selama pandemi Covid-19.Ia meminta para pramuka membuat dua gerakan nasional, yakni gerakan kedisiplinan nasional untuk mendorong masyarakat disiplin protokol kesehatan serta gerakan kepedulian nasional sebagai upaya mengajak masyarakat peduli lingkungan.“Dua gerakan ini bukan hanya untuk membantu penanganan masalah nasional akibat pandemik, tetapi dua gerakan tadi akan semakin mengasah jiwa dan karakter kepemimpinan saudara-saudara dalam memperdalam jiwa pramuka sejati sebagaimana tertuang dalam Dwi Darma, Tri Satya, dan Dasa Dharma Pramuka,” kata Jokowi.Jokowi juga meminta agar para anggota pramuka untuk mampu menguasai ilmu pengetahuan dan teknologi. Ia mengatakan, pengetahuan dan teknologi sangat penting karena tantangan dunia semakin berat dan kompleks.Jokowi mengingatkan, dunia saat ini berubah dengan cepat dan penuh ketidakpastian.“Masa depan akan jauh lebih berbeda jika dibandingkan dengan hari ini. Ketangguhan saudara-saudara juga harus saudara-saudara buktikan dalam mengejar ilmu pengetahuan,” kata Jokowi.Jokowi menambahkan, “Jadilah generasi masa depan yang mencerahkan, yang terus membangun harapan tentang kejayaan Indonesia, Indonesia maju yang kita cita-citakan Bersama.”Ketua Kwartir Nasional Pramuka Komjen (purn) Budi Waseso mengatakan perayaan Kwarnas Pramuka sedianya selalu digelar pada 14 Agustus 2020. Namun mereka mengubah jadwal agar presiden bisa tetap memberikan arahan kepada para anggota pramuka.“Kami mengetahui bahwa Bapak Presiden pada 14 Agustus 2020 ini telah memiliki agenda pidato kenegaraan Presiden di DPR MPR RI. Maka kami menyadari hal itu dan kami mengusulkan acara hari pramuka pada 12 Agustus 2020 sehingga Bapak Presiden dapat hadir serta memberikan pengarahan dengan tidak mengurangi makna dari hari pramuka itu sendiri," kata pria yang karib disapa Buwas itu saat memberikan sambutan secara daring dari Cibubur, Jakarta, Rabu.Dalam laporan tersebut, ia melaporkan kalau gerakan pramuka memahami dampak pandemi Covid-19 di Indonesia dan dunia. Namun gerakan Pramuka, kata Buwas, akan terus berjalan.Ia pun melaporkan kalau gerakan pramuka ikut menangani Covid-19 dalam bentuk bakti sosial dan bakti masyarakat seperti membagikan ribuan masker dan hand sanitizer, penyemprotan disinfektan di fasilitas publik donor darah serta ribuan paket sembako bantuan dari Bulog, Bank Mandiri Syariah serta berbagai instansi lain dan perorangan. 

Dengan melihat hasil dari scraping berita diatas, nampaknya akan sedikit sulit untuk mendapatkan insight tentang topik apa yang diberitakan tanpa membaca keseluruhan berita.

Dengan bantuan wordcloud kita dapat mendapatkan insight awal dari topik yang dibahas dalam berita tanpa membaca keseluruhan berita.

Setelah kita mendapatkan data berita yang akan kita buatkan wordclod, langkah selanjutnya adalah mempersiapkan code untuk menampilkan wordcloud.

Installasi wordcloud

Mari dimulai dengan melakukan installasi package wordcloud, dengan cara mebuka terminal pada computer kita dan menambahkan code berikut:

$pip install wordcloud

Setelah package terinstall dengan sempurna, kita dapat menggukan wordcloud dengan cara menambahkan code seperti dibawah, dengan input teks berita yang telah kita dapat dari hasil scraping.

from wordcloud import WordCloud
from matplotlib import pyplot as plt
wc = WordCloud(max_font_size=1000, max_words=10000, background_color="white")
wc.generate(berita)

Untuk mendapatkan visualisai dari teks beritayang diberikan, dapat ditampilkan dengan bantuan package matplotlib, dengan menambahkan code berikut:

plt.figure()
plt.imshow(wc, interpolation="bilinear")
plt.axis("off")
plt.show()

kurang lebih hasih dari wordcloud akan seperti gambar dibawah ini:

Kesimpulan dari artikel ini adalah bagaimana cara membuat wordcloud untuk visualisasi dan analisa topik dalam suatu teks berita , dengan menggukana wordcloud kita dapat menganalisa dengan memperhatikan kemunculan kata dalam teks.

--

--