pandasql ile SQL Komutlarını pandas’da Çalıştırma
Pandasql, verilerinizi pandaların veri çerçevesinden sorgulamak için SQL sorguları yazmanıza olanak sağlar. Pandasql ile düzenli SQL sorgunuzu bir işlev çağrısı içine yazabilir ve verilerinizi çalıştırabilirsiniz!
Kurulum
pip install pandasql
Gerçek bir veri kümesiyle çalışmaya başlayalım. seaborn kütüphanesini kullanarak iris çiçekleri veri setini yükleyeceğiz :
import pandasql
import seaborn as snsdata = sns.load_dataset(‘iris’)
Normalde, veri kümemizdeki ilk 20 maddeyi almak isteseydik, böyle bir şeyi pandas’da yapardık.
data.head(20)
Pandasql ile standart SQL sorgunuzu normalde bir SQL veritabanında çalıştırdığımız gibi yazabiliriz.
sub_data = pandasql.sqldf(“SELECT * FROM data LIMIT 20;”, globals())
print(sub_data)
SQL’de WHERE ile yapabileceğimiz düzenli filtreleme işlemleri de uygulanabilir. Önce pandas kullanarak petal_length 5'ten büyük olan tüm verileri alalım :
sub_data = data[data[“petal_length”] > 5.0]
SQL kodu ile aynı işlemi yapalım
sub_data = pandasql.sqldf(“SELECT * FROM data WHERE petal_length > 5.0;”, globals())
sub_data
SQL komutları ile sadece istediğimiz kolonları alalım.
sub_data = pandasql.sqldf(“SELECT petal_width, petal_length FROM data WHERE petal_length > 5.0;”, globals())
sub_data
Faydalı olması dileğiyle
Beni Linkedin’den takip edebilirsiniz.
Tüm kodlara buradan erişebilirsiniz.