Word2Vec Nedir ? Ne işe yarar ?

Word2Vec kelimeler arasındaki uzaklığı vektörel olarak hesaplamanızı sağlayan bir algoritma araç kitidir. Bu vektörel yapının üzerine yazılmış araçlar ile bir kelimeye en yakın kelimleri listeletebilirsiniz. Kelimeler arası anoloji kurabilirsiniz.

Bu kısımda ./distance kullandığımıda çay için en yakın kelimeleri buldu mesela

Kelime analojisi için ./word-analogy kullandığımda

Verdiğimiz input dokümanlarına göre bir kelime vectörü oluşturuyor.

Bu kısımda 2 tane algoritmadan CBOW veya Skip-Gram algoritmasından faydalanıyor.

KAYNAKLAR

Word2Vec C’de yazılmış orjinal haline googlecode word2vec linki altından erişebilirsiniz.

Word2vec in Python by Radim Rehurek in gensim(plus tutorial and demo that uses the above model trained on Google News).

Word2vec in Java as part of the deeplearning4jproject. Another Java version from Medallia here.

Word2vec implementation in Spark MLlib.