Sözel ifadelerin makine öğrenmesi veya derin öğrenme algoritmaları için anlamlı bir hale getirilmesi gerekir. Bu sebeple kelimeler, sayısal olarak ifade edilmelidir. One Hot Encoding, TF-IDF, Word2Vec, FastText gibi algoritmalar, bu tarz problemlerin çözümü için kullanılan word embedding teknikleri olarak, kelimelerin matematiksel olarak ifade edilebilmesini sağlar.

Unsplash

Word Embeddings

Sözel ifadelerin matematiksel olarak ifade edilmesi için kullanılan tekniklerdir. One Hot Encoding, TF-IDF, Word2Vec, FastText, yöntemleri sıklıkla kullanılan Word Embedding yöntemleridir. Verilerin durumu, boyutu ve işlenme amacına göre bu tekniklerden birisi (bazı durumlarda birkaçı) tercih edilerek kullanılır.

Verilerin sayısal olarak ifade edilebilmesi için kullanılan en temel tekniklerden birisi One Hot Encoding tekniğidir[1]. Bu yöntemde sözel…


The words need to be made meaningful for machine learning or deep learning algorithms. Therefore, they must be expressed numerically. Algorithms such as One Hot Encoding, TF-IDF, Word2Vec, FastText enable words to be expressed mathematically as word embedding techniques used to solve such problems.

Photo by Camille Orgel on Unsplash

Word Embeddings

The word embedding techniques are used to represent words mathematically. One Hot Encoding, TF-IDF, Word2Vec, FastText are frequently used Word Embedding methods. One of these techniques (in some cases several) is preferred and used according to the status, size and purpose of processing the data.

One of the most basic techniques used to represent data numerically…


*** If you want to read my article in english, please visit Towards Data Science (Understanding A* Path Algorithms and Implementation with Python)

A* algoritması iki nokta arasındaki en kısa yolu bulmak için kullanılan en etkili yol bulma algoritmalarından birisidir. Peter Hart, Nils Nilsson and Bertram Raphael tarafından 1968 yılında ilk olarak yayınlanmıştır [1]. Başlangıçta Dijkstra’s algoritmasının bir eklentisi olarak ortaya çıksada günümüzde en sık kullanılan yol bulma algoritmalarından birisi haline gelmiştir.

A* algoritması, temelde başlangıç düğümüyle bitiş düğümü arasındaki bütün diğer düğümlerin konumlarına göre hesaplama yaparak optimum sonuca ulaşır. …


The A* algorithm is one of the most effective path finding algorithms used to find the shortest path between two points. It was first published in 1968 by Peter Hart, Nils Nilsson and Bertram Raphael [1]. Although it initially can be seen as an extension of Dijkstra’s algorithm, it has become one of the most frequently used pathfinding algorithms today.

Via Pixabay

The A* algorithm basically reaches the optimum result by calculating the positions of all the other nodes between the starting node and the ending node. In addition, it is faster than Dijkstra’s algorithm due to the heuristic function[2].

f(n) =…


*** If you want to read my article in english, please visit Towards Data Science (Practical Image Process with OpenCV)

Görüntü işleme, temel anlamıyla elimizdeki görüntüleri algoritmalar yardımıyla işleyerek bu görüntülerden elde etmek istediğimiz özelliklere doğrudan ulaşmamızı veya bu özellikleri öne çıkartmamızı sağlayan süreçtir. Günümüzde resim veya videoların veri olarak kullanıldığı derin öğrenme yapılarında eğitimin daha başarılı olması için sıkça kullanılan işlemlerdir.

Görüntü İşleme

Görüntü işleme süreci verilerin bilgisayarlar tarafından tanınmasıyla başlar. Görüntü formatındaki veri için öncelikle matris oluşturulur. Resimdeki her bir piksel değeri bu matrise işlenir. Sonuç olarak 200 x 200 boyutundaki bir resim için 200 x 200 boyutunda bir matris…


Image processing is basically the process that provides us to achieve the features from images. Image processing is applied for both images and videos. These are the procedures used frequently in order to make training more successful in deep learning structures.

Image Processing

The image processing begins with the recognition of data by computers. Firstly, a matrix is ​​created for data in image format. Each pixel value in the image is processed into this matrix. For example, a matrix of size 200x200 is created for a picture of size 200x200. If this image is colored, this dimension becomes 200x200x3 (RGB). In fact…


Türkçeye Evrişimsel Sinir Ağları olarak çevrilen Convolutional Neural Network yani kısaca CNN özellikle görüntü tanıma ve işleme problemlerinde kullanılan bir tür yapay sinir ağıdır. Resim ve video formatındaki yapılarda gösterdiği başarı sebebiyle dünyada yaygın olarak kullanılmaktadır. Bu çalışmada ayrıntılı olarak CNN yapısı, nasıl çalıştığı ve bu yapıyı içeren örnek bir python uygulaması yer almaktadır.

Öncelikle yapay sinir ağlarından genel olarak bahsedecek olursak yapay sinir ağları, insan beyninin işleyişini baz alarak oluşturulmuş modellerdir. Bu yapıda öğrenme işleminin gerçekleştirilmesi, bu öğretilerin yorumlanması ve bu yorum sonucunda sistemin otonom bir şekilde karar vermesi amaçlanmıştır. Bu yapı temelde 3 katmandan meydana gelir.

  • Input Layer


Günümüzde yapay zekanın gelişmesiyle birlikte bir çok projede yapay sinir ağları kullanılmaktadır. Bazı durumlarda veriler arasında zamana dayalı ya da ardışık türden ilişkiler mevcut olabilir. Bu tarz durumlarda geleneksel yapay sinir ağları yetersiz kalmaktadır. Yinelenen sinir ağlarının bazı problemleri sebebiye ortaya çıkan ve günümüzde sıkça kullanılan uzun kısa vadeli hafıza ağları (LSTM) bu durumlarda çözüm olmuştur.

RNN (Yinelenen Sinir Ağları), birimler arasındaki bağlantıların yönlendirilmiş bir döngü oluşturduğu yapay sinir ağlarıdır. Bu döngü sayesinde zamana bağlı bir yapıyı veya sıralı, dinamik bir yapıyı modelleyebilmekteyiz. RNN’nin temelleri Jeff Elman tarafından basit tekrarlayan ağ oluşturularak atılmıştır. Elman’ın buradaki amacı cümle içerisinde basit bir…


The used car market is quite active in Turkey. Therefore predicting car prices is highly variable. In this article, machine learning models are compared and chosen the best model for price prediction.

source

The training model was carried out by dividing the models by car brands instead of a single big model training for both effective optimization processes and better use of computer power and time. Approximately 100.000 data with 12 features were used in training. The machine learning models compared are:

  • Linear Regression
  • Ridge
  • Lasso
  • Elastic Net
  • K-Nearest Neighbors
  • Random Forest
  • XGBOOST
  • Gradient Boosting Machine

First of all, the models…


Python — FuzzyWuzzy Kütüphanesi ile String Eşleme

Bazı projelerde elimizdeki string ifadelerin birbirleriyle olan benzerliklerini anlamak bizim için önem arz eder. Bu tarz durumlar için farklı çözüm yöntemleri mevcuttur. Bu yazıda bu çözümlerden birisi olan FuzzyWuzzy kütüphanesi açıklanmıştır.

Öncelikle bu kütüphanenin temel aldığı Levenshtein Mesafe (Levenshtein Distance) Algoritmasını kısaca inceleyelim. Levenshtein algoritması Vladimir Levenshtein tarafından geliştirilmiştir. Kelimeler veya cümleler arasındaki benzerliklerin derecesini elde etmemizi sağlayan bu algoritma günümüzde özellikle doğal dil işleme problemlerinde sıkça kullanılmaktadır.

Levenshtein Algoritmasında 3 temel işlem vardır.

  • Replace (Değiştirme)
  • Insert (Eklemek)
  • Delete (Silmek)

Bu 3 işlem kullanılarak iki kelime arasındaki Levenshtein uzaklığı belirlenir. Örnek olarak “Ocak”…

Adem Akdogan

Software Engineer

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store