Vector Space Model Nedir ?

Vector Space Model
  • Aradığınız bir metni bu uzay düzlemindeki yerini bulabilirseniz bu vektöre en yakın dokümanlara erişebilirsiniz.
  • Dokümanlar arası uzaklığı birbiri ile kıyaslayabilirsiniz.
  • k-means clustering uygulayarak belgelerinizi belli gruplara ayırabilirsiniz.

1nci Aşama: Sözlük Oluşturma

  • D1 ve D3 dokümanlarımız
  • W bizim sözlüğümüz
  • V1 ve V2 bu dokümanları oluşturan vektörlerdir. (Not: Vektörleri kelimelerin geçme frekanslarını göre oluşturduğumuzu görebilirsiniz)
topic vector
  • Mesela kelimeleri birim birim almak yerine kelime öbekleri şeklinde ele almamız gerekebilir. Bu durumda NGram yöntemini kullanabilirsiniz.
  • Mesela türeyen bir dilde (göz, gözlük, gözlükçü vb..) kelime kökleri üzerinden sözlük oluşturma ihtiyacı duyabilirsiniz (stemming örneğin zemberek)
  • Bir diğer konuda The, have vb.. stopping words denilen kelimelerin sözlükten elenmesini sağlamak bunun içinde tf-idf yöntemi kullanabilirsiniz.
tf-idf
Vector Normalization

2nci Aşama: Cosine Similarity

Okumaya Devam Et 😃

--

--

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store