pandasql ile SQL Komutlarını pandas’da Çalıştırma

Enes POLAT
Turk Telekom Bulut Teknolojileri
1 min readJun 17, 2019

Pandasql, verilerinizi pandaların veri çerçevesinden sorgulamak için SQL sorguları yazmanıza olanak sağlar. Pandasql ile düzenli SQL sorgunuzu bir işlev çağrısı içine yazabilir ve verilerinizi çalıştırabilirsiniz!

https://www.dataquest.io/blog/pandas-concatenation-tutorial/

Kurulum

pip install pandasql

Gerçek bir veri kümesiyle çalışmaya başlayalım. seaborn kütüphanesini kullanarak iris çiçekleri veri setini yükleyeceğiz :

import pandasql
import seaborn as sns

data = sns.load_dataset(‘iris’)

Normalde, veri kümemizdeki ilk 20 maddeyi almak isteseydik, böyle bir şeyi pandas’da yapardık.

data.head(20)

Pandasql ile standart SQL sorgunuzu normalde bir SQL veritabanında çalıştırdığımız gibi yazabiliriz.

sub_data = pandasql.sqldf(“SELECT * FROM data LIMIT 20;”, globals())
print(sub_data)

SQL’de WHERE ile yapabileceğimiz düzenli filtreleme işlemleri de uygulanabilir. Önce pandas kullanarak petal_length 5'ten büyük olan tüm verileri alalım :

sub_data = data[data[“petal_length”] > 5.0]

SQL kodu ile aynı işlemi yapalım

sub_data = pandasql.sqldf(“SELECT * FROM data WHERE petal_length > 5.0;”, globals())

sub_data

SQL komutları ile sadece istediğimiz kolonları alalım.

sub_data = pandasql.sqldf(“SELECT petal_width, petal_length FROM data WHERE petal_length > 5.0;”, globals())

sub_data

Faydalı olması dileğiyle

Beni Linkedin’den takip edebilirsiniz.

Tüm kodlara buradan erişebilirsiniz.

--

--