Makine Öğrenmesi Dersleri 11: Veri Manipülasyonu

Hakkı Kaan Simsek
Veri Bilimi Türkiye
3 min readAug 18, 2018
kaynak

Bu yazıda günlük hayatta işime yarayan Python fonksiyonlarından bazılarını paylaşacağım. Bunlara ek olarak kullandığınız ve eklemek istediğiniz fonksiyonlar varsa bu seriyi daha da zenginleştirebiliriz.

Konu başlıkları şöyle:

  • Veri tiplerini ve dağılımlarını bulma
  • Eksik veri sayılarını ve veri setindeki oranlarını bulma
  • Eksik sütunları doldurma ve yeni sütun oluşturma (apply)
  • Zamansal değişkeni DateTime’a çevirme ve zenginleştirme
  • Cross ve pivot table oluşturma
  • Veri değerini ve tipini değiştirme (loc)
  • Groupby-nunique ve cumulative sum uygulama
  • Eksik ve tekrarlı verilerle çalışma
  • One-hot encoding ve pd.concat()
  • Satır ve sütun silme-ekleme
  • İki veri setini birleştirme (Alt alta — Yan yana)
  • Filtreleme ve np.where() kullanımı
  • Jupyter notebook’ta yazılmış kodları gizleme (nbextension-hide input all)

Çalışmadaki veri setine ve kodlara buradan ulaşabilirsiniz.

Veri tiplerini ve dağılımlarını bulma

Eksik veri sayılarını ve veri setindeki oranlarını bulma

Eksik sütunları doldurma ve apply fonksiyonuyla yeni sütun oluşturma

Zamansal değişkeni DateTime’a çevirme ve zenginleştirme

Cross ve pivot table oluşturma

Veri değerini ve tipini değiştirme (loc ve apply)

Groupby-nunique ve cumulative sum fonksiyonları

df1 = Seçilmiş bir özniteliğe göre eksik olmayan satırları okuma

df2 = Tekrarlı satırları atma

df3 = Seçilmiş bir özniteliğe ait örnek (birer) kayıt tutma

df4 = Seçilmiş bir özniteliğe göre one-hot encoding yapıp bunu veri setine ekleme

df5 = Seçilmiş bir veri tipine göre one-hot encoding yapıp bunu veri setine ekleme

Satır ve sütun silme

Satır ve sütun ekleme

İki veri setini birleştirme (Alt alta)

İki veri setini birleştirme (Yan yana)

Filtreleme ve np.where() kullanımı

Jupyter notebook’ta yazılan kodları gizleme (veya nbextentions hide input all)

Sorunuz olursa bana Linkedin veya Twitter hesaplarından yazabilirsiniz.

--

--