K-En Yakın Komşu (KNN) Sınıflandırma

İngilizce olarak K-Nearest Neighbors’un kısaltması KNN olan bu sınıflandırma metodu Türkçe’ye K-En Yakın Komşuluk ismiyle geçmiştir. Evet kendileri bir sınıflandırma metodudur.

Bir örnek üzerinden açıklayacak olursak elimizde aşağıdaki gibi bir veri site olduğunu düşünelim. Bu veriler görüldüğü gibi sarı ve mavi olmak üzere iki sınıfa ayrılmaktadır.

Resim 1 -Veri seti

Bizim elimizde sınıfı bilinmeyen (Resim 1 üzerinde renksiz olan) bir bir veri bulunmaktadır. Bu veriyi yukarıdaki şekle bakarak tahminen bir sınıfa atayın desem bu veriyi tahminen mavi sınıfına atardınız. Peki bilgisayara bu yaptığımız işi nasıl bir yol izleyerek yaptırırız derseniz işte orada KNN sınıflandırma metodu devreye giriyor.

Öncelikle K adet en yakın komşusuna bakacağız. Burada K sizin seçiminize bırakılmıştır. Biz K=3 seçerek en yakın 3 komşuya bakacağız. Evet en yakın 3 komşu. Yani bütün verilerin bizim sınıfını bilmediğimiz veriye olan uzaklığına bakıp bunlardan en küçük olan 3 tanesini seçeceğiz.

Resim 2 -En yakın 3 komşu bulunur.

Bulduğumuz bu en yakın K=3 komşunun sınıflarına bakarak sınıfı bilinmeyen verimizi çoğunluk olan sınıfa atıyoruz. Örnek üzerinde de göründüğü gibi en yakın 3 komşudan 2 tanesi mavi 1 tanesi sarı sınıfına ait olduğu için verimizi çoğunluk olan mavi sınıfına atıyoruz.

Resim 3 -Veri mavi sınıfına atanır.