Makine Öğrenmesi Dersleri 11: Veri Manipülasyonu
Bu yazıda günlük hayatta işime yarayan Python fonksiyonlarından bazılarını paylaşacağım. Bunlara ek olarak kullandığınız ve eklemek istediğiniz fonksiyonlar varsa bu seriyi daha da zenginleştirebiliriz.
Konu başlıkları şöyle:
- Veri tiplerini ve dağılımlarını bulma
- Eksik veri sayılarını ve veri setindeki oranlarını bulma
- Eksik sütunları doldurma ve yeni sütun oluşturma (apply)
- Zamansal değişkeni DateTime’a çevirme ve zenginleştirme
- Cross ve pivot table oluşturma
- Veri değerini ve tipini değiştirme (loc)
- Groupby-nunique ve cumulative sum uygulama
- Eksik ve tekrarlı verilerle çalışma
- One-hot encoding ve pd.concat()
- Satır ve sütun silme-ekleme
- İki veri setini birleştirme (Alt alta — Yan yana)
- Filtreleme ve np.where() kullanımı
- Jupyter notebook’ta yazılmış kodları gizleme (nbextension-hide input all)
Çalışmadaki veri setine ve kodlara buradan ulaşabilirsiniz.
Veri tiplerini ve dağılımlarını bulma
Eksik veri sayılarını ve veri setindeki oranlarını bulma
Eksik sütunları doldurma ve apply fonksiyonuyla yeni sütun oluşturma
Zamansal değişkeni DateTime’a çevirme ve zenginleştirme
Cross ve pivot table oluşturma
Veri değerini ve tipini değiştirme (loc ve apply)
Groupby-nunique ve cumulative sum fonksiyonları
df1 = Seçilmiş bir özniteliğe göre eksik olmayan satırları okuma
df2 = Tekrarlı satırları atma
df3 = Seçilmiş bir özniteliğe ait örnek (birer) kayıt tutma
df4 = Seçilmiş bir özniteliğe göre one-hot encoding yapıp bunu veri setine ekleme
df5 = Seçilmiş bir veri tipine göre one-hot encoding yapıp bunu veri setine ekleme
Satır ve sütun silme
Satır ve sütun ekleme
İki veri setini birleştirme (Alt alta)
İki veri setini birleştirme (Yan yana)
Filtreleme ve np.where() kullanımı
Jupyter notebook’ta yazılan kodları gizleme (veya nbextentions hide input all)