MALLET (MAchine Learning for LanguagE Toolkit) — Google Colaboratory Kurulumu

Sezer UĞUZ
Deep Learning Türkiye
3 min readFeb 10, 2020

Herkese merhaba, bu yazımda size MALLET’in Google Colaboratory üzerinden kurulumunu anlatacağım.

MALLET, istatistiksel doğal dil işleme, belge sınıflandırma, kümeleme, konu modelleme, bilgi çıkarma ve metne yapılan diğer makine öğrenimi uygulamaları için Java tabanlı bir pakettir. (Kaynak: http://mallet.cs.umass.edu/index.php)

MALLET, doğal dil işleme sürecinde daha iyi sonuçlar çıkarmamıza yardımcı olur. MALLET’i çalışmalarınıza eklemeye çalışırken çeşitli sorunlarla karşılaşabilirsiniz. MALLET’i yükleme sırasında karşılaşabileceğiniz sorunlara yardımcı olmak için bu yazıyı hazırladım. Faydalı olması dileğiyle…

Google Colaboratory’de Python Notebook Dosyası Oluşturma

Öncelikle Google Colaboratory uygulamasına Google hesabınızdan erişim sağlamanız gerekmektedir.

Şekil 1: Google Colaboratory’de Python Notebook Oluşturma

Daha sonra Welcome to Colaboratory sayfası karşınıza çıkacaktır. Burada başlangıç için bilgiler edinmeniz mümkündür. Şekil 1'de yer alan File (Dosya) kısmından New Python 3 notebook’a (1) tıklayıp yeni bir çalışma ortamı oluşturacağız.

Şekil 2: Python 3 Notebook Yeni Çalışma Dosyası

Yeni çalışma ortamı oluşturduktan sonra Şekil 2'deki gibi IPython Notebook dosyamız açılacaktır. Bu çalışma dosyasını oluşturduğunuzda Google Drive hesabınızda Colab Notebooks (Şekil 3) adlı klasör yer alacaktır.

Şekil 3: Colab Notebooks (Colaboratory Notebooks)

Colab Notebooks adlı klasöre tıkladıktan sonra oluşturduğunuz python notebook dosyasına (Şekil 4) ulaşabiliriz. Bu dosyayı açmak için sağ tıklayıp birlikte aç kısmından Google Laboratory ile açabiliriz.

Şekil 4: Python Notebook Dosyası

MALLET’in Google Colaboratory’e Kurulumu

MALLET’in kurulumu için Windows kurulumunda olduğu gibi Java JDK’ya ihiyaç vardır, çünkü MALLET Java tabanlı bir pakettir.

Google Colaboratory’de Java JDK ve MALLET kurulumu için https://github.com/polsci/colab-gensim-mallet/blob/master/topic-modeling-with-colab-gensim-mallet.ipynb adresinden faydalandım.

Şekil 5: Google Colaboratory’de Java JDK Kurulumu

Şekil 5'te yer alan kod bloğunu çalıştıdıktan sonra Java JDK kurulumunun gerçekleştiğini görebiliriz.

Şekil 6: Google Colaboratory’de MALLET Kurulumu

Şekil 6'daki yer alan kod bloğunu çalıştırdıktan sonra MALLET kurulumu gerçekleşecektir.

Java JDK ve MALLET’in kurulumunu gerçekleştirdikten sonra Python Notebook dosyamız ile Google Drive bağlantısını gerçekleştirelim. Böylelikle Google Drive’da yer alan dosyalarımıza (veri setlerimize) ulaşıp çalışmamıza ekleyebiliriz.

Önemli Not: Java JDK ve MALLET’in kurulumundan önce Google Drive bağlantısını gerçekleştiririp çalışılan dosya yerini değiştirirseniz sorunlarla karşılaşabilirsiniz. Bu nedenle Java JDK ve MALLET kurulumundan sonra Google Drive bağlantısını gerçekleştirmenizi tavsiye ederim.

Şekil 7: Google Drive Dosyasına Bağlantının Gerçekleştirilmesi

Yukarıdaki kod bloğunu yazdıktan sonra Google Drive hesabınıza erişim için bağlantı linkini göreceksiniz. Bu bağlantı linkine tıkladıktan sonra başka bir pencere açılacaktır. Erişim iznini onayladıktan sonra size verilecek erişim kodunu kopyalayıp Şekil 7'de çalıştırılan kod bloğunda belirtilen yere yapıştırınız ve Enter tuşuna basınız.

Veri setlerimizi yükleyip işlemleri gerçekleştirdikten sonra MALLET kısmına geldiğimizde Şekil 8'de yer alan kod bloğunu çalıştırıp MALLET’i çalışmamıza eklemeyi sağlayabiliriz.

Şekil 8: MALLET’in Python Jupyter Notebok Üzerinde Çalıştırılması

Umarım hazırladığım bu yazı, okuyan herkes için faydalı olmuştur. Eğer yazımı faydalı bulduysanız aşağıda yer alan YouTube kanalıma abone olarak destek olabilir, yeni içeriklerden haberdar olabilirsiniz. Bilimle ve sağlıcakla kalın.

--

--

Sezer UĞUZ
Deep Learning Türkiye

I like to research, explore new places and learn new information. My YouTube Channel Link: https://www.youtube.com/c/sezeruguz