MALLET (MAchine Learning for LanguagE Toolkit) - Windows İşletim Sistemine Kurulumu

Sezer UĞUZ
Deep Learning Türkiye
3 min readFeb 9, 2020

Herkese merhaba, bu yazımda size MALLET’in Windows işletim sistemi üzerinden kurulumunu anlatacağım. Hem Windows 7 hem de Windows 10 üzerinde test edilmiştir.

MALLET, istatistiksel doğal dil işleme, belge sınıflandırma, kümeleme, konu modelleme, bilgi çıkarma ve metne yapılan diğer makine öğrenimi uygulamaları için Java tabanlı bir pakettir. (Kaynak: http://mallet.cs.umass.edu/index.php)

MALLET, doğal dil işleme sürecinde daha iyi sonuçlar çıkarmamıza yardımcı olur. MALLET’i çalışmalarınıza eklemeye çalışırken çeşitli sorunlarla karşılaşabilirsiniz. MALLET’i yükleme sırasındakarşılaşabileceğiniz sorunlara yardımcı olmak için bu yazıyı hazırladım. Faydalı olması dileğiyle…

MALLET Dosyası

http://mallet.cs.umass.edu/dist/mallet-2.0.8.zip adresinden MALLET’in sıkıştırılmış dosya halini indirdikten sonra C:/ sürücüsüne çıkartınız. MALLET’i çalıştırmamız için Java JDK ve Apache Ant’a ihtiyacımız vardır.

Java JDK Kurulumu

https://www.oracle.com/technetwork/java/javase/downloads/jdk13-downloads-5672538.html adresinden Java JDK’yı indirip kurabilirsiniz. Bende Java JDK 12.0.2 sürümü mevcut.

Apache Ant Kurulumu

Apache Ant 1.10.7'yi http://ftp.itu.edu.tr/Mirror/Apache//ant/binaries/apache-ant-1.10.7-bin.zip adresinden sıkıştırılmış dosya halini indirdikten sonra C:/Program Files/ içerisine çıkartınız.

Bu işlemleri tamamladıktan sonra bilgisayarınızın Ortam Değişkenleri (Environment Variables) kısmında düzenlemeler yapmanız gerekecektir.

Ortam Değişkenlerinin Düzenlenmesi

Bilgisayar penceresini açtıktan sonra Özellikler’e tıklayıp sol kısımda yer alan Gelişmiş sistem ayarları bölümüne tıklayınız (Şekil 1). Daha sonra açılan pencerede Ortam Değişkenleri… butonuna tıklayınız.

Şekil 1: Ortam Değişkenleri (Environment Variables)

Daha sonra açılan pencereye (Şekil 2) kullanıcı adınız için yer alan değişkenler kısmındaki Yeni… butonuna tıklayınız.

Şekil 2: Ortam Değişkenleri Ekleme

Yukarıdaki 1, 2 ve 3 numaralı satırlar bizim yeni değişkenlerimizi ve değişken değerlerimizi göstermektedir. 1, 2 ve 3 numaradaki değerleri oluşturmak için teker teker Yeni… butonuna tıklayıp oluşturacağız. Açılan pencerede Değişken adı (Variable name) kısmına yukarıdaki gibi ANT_HOME (1) dedikten sonra Değişken değerine (Variable value) ise Apache Ant’ı sıkıştırılmış dosyadan C:/Program Files/ dosya yoluna çıkardığımız şekilde yazacağız. Sıkıştırılmış (zip) dosyadan çıkardığımız dosyanın adı apache-ant-1.10.7 olduğunu varsayalım. O halde dosya yolumuz, diğer bir deyişle değişken değerimiz C:/Program Files/apache-ant-1.10.7 olacaktır.

Aynı şekilde JAVA_HOME (2) ve MALLET_HOME (3) değişken adlarını oluşturup bulundukları dosya yollarını belirtiyoruz.

Daha sonrasında Path (4) kısmına tıklayıp Düzenle… butonuna tıklıyoruz. Değişkenleri ekledikten sonra Path kısmında da düzenleme yapmamız gerekecek.

Şekil 3: Path Kısmına Değişkenleri Ekleme

Açılan pencerede Java JDK (5), MALLET (6) ve Apache ANT (7) dosya yollarını Şekil 3'teki gibi belirtiyoruz.

Son adım ise MALLET’i Apache Ant ile derlemek olacaktır.

Şekil 4: MALLET’in Apache Ant ile Derlenmesi

Komut İstemi’ni (cmd.exe) çalıştırınız, ardından cd C:\mallet-2.0.8 yazıp Enter tuşuna basınız (MALLET’in bulunduğu dosya yoluna ulaştık) ve ardından ant yazıp Enter tuşuna basınız. BUILD SUCCESSFUL yazısını gördükten sonra bir sonraki konsol satırına ant jar yazıp Enter tuşuna basınız, işlem sonrasında bir kez daha BUILD SUCCESSFUL yazısını göreceksiniz. Böylelikle işleminiz başarılı bir şekilde tamamlanmış olacaktır.

MALLET’in Python Jupyter Notebok Üzerinde Çalıştırılması

Şekil 5: MALLET’in Python Jupyter Notebok Üzerinde Çalıştırılması

Şekil 5'teki gibi mallet_path değişkenimizi ilgili dosya yolu olarak (indirdiğiniz MALLET zip dosyasını C:/ sürücüsüne çıkarttıysanız, Şekil 5'teki dosya yolunu değiştirmenize gerek kalmayacaktır) atadıktan sonra LdaMallet içerisinde kullanarak işlemlerimizi gerçekleştirebiliriz.

Umarım hazırladığım bu yazı, okuyan herkes için faydalı olmuştur. Eğer yazımı faydalı bulduysanız aşağıda yer alan YouTube kanalıma abone olarak destek olabilir, yeni içeriklerden haberdar olabilirsiniz. Bilimle ve sağlıcakla kalın.

--

--

Sezer UĞUZ
Deep Learning Türkiye

I like to research, explore new places and learn new information. My YouTube Channel Link: https://www.youtube.com/c/sezeruguz