Azure Synapse Serverless SQL Pools

Ayşegül Yiğit
BilgeAdam Teknoloji
4 min readApr 25, 2023

Azure Synapse SQL ,kuruluşların ve veri mühendislerinin aşina olduğu standart T-SQL deneyimlerini kullanarak veri ambarı ve veri sanallaştırma senaryolarını uygulamasını sağlayan dağıtılmış bir sorgu sistemidir. Ayrıca makine öğrenimi senaryolarını ele almak için de SQL’in yeteneklerini genişletir.

Azure Synapse SQL, hem sunucusuz hem de özel kaynak modelleri sunarak ihtiyaçlarınıza uygun tüketim ve faturalandırma seçenekleri sunar.

Her Azure Synapse Analytics çalışma alanı, data lakeleri sorgulamak için kullanabileceğiniz yerleşik sunucusuz SQL havuzuyla birlikte gelir.

Sunucusuz SQL havuzu, veri gölünüzdeki verileri sorgulamak için sorgu uç noktası başına ödeme sağlar. Aşağıdaki işlevler aracılığıyla verilerinize erişmenizi sağlar:

· Özel bir mağazaya veri kopyalamaya veya yüklemeye gerek kalmadan verileri yerinde sorgulamak için tanıdık bir T-SQL sözdizimi.

· En popüler sürücüler de dahil olmak üzere çok çeşitli iş zekası ve geçici sorgulama araçları sunan T-SQL arabirimi aracılığıyla entegre bağlantı.

· Sunucusuz SQL havuzu, büyük ölçekli veriler ve hesaplama işlevleri için oluşturulmuş dağıtılmış bir veri işleme sistemidir. Büyük verilerinizi iş yüküne bağlı olarak saniyeler veya dakikalar içinde analiz etmenizi sağlar. Yerleşik sorgu yürütme hata toleransı sayesinde sistem, büyük veri kümelerini içeren uzun süreli sorgular için bile yüksek güvenilirlik ve başarı oranları sağlar.

· Sunucusuz SQL havuzuyla, kurulacak altyapı veya bakımı yapılacak kümeler yoktur. Her Azure Synapse çalışma alanında bu hizmet için yerleşik bir uç nokta sağlanır, böylece çalışma alanı oluşturulur oluşturulmaz verileri sorgulamaya başlayabilirsiniz.

· Ayrılan kaynaklar için ücret alınmaz, yalnızca çalıştırdığınız sorgular tarafından işlenen veriler için ücretlendirilirsiniz, dolayısıyla bu model gerçek bir kullanım başına ödeme modelidir.

Azure Synapse sunucusuz SQL havuzları ne zaman kullanılır?

1. Synapse SQL, hem sunucusuz hem de özel kaynak modelleri sunarak ihtiyaçlarınıza uygun tüketim ve faturalandırma seçenekleri sunar. Öngörülebilir performans ve maliyet için, SQL tablolarında depolanan veriler için işlem gücü ayırmak üzere ayrılmış SQL havuzları oluşturun. Planlanmamış veya ani iş yükleri için her zaman kullanılabilir, sunucusuz SQL uç noktasını kullanın.

2. Maliyetleri izlemek ve ilişkilendirmek için yürütülen her sorgunun tam maliyetini bilmeniz gerekiyorsa, Synapse SQL sunucusuz kaynak modeli harikadır. Ayrıca yönetilecek bir altyapı olmadığı için yönetim yükünü ortadan kaldırır. Siz sadece yürütmek istediğiniz sorguları önemsiyorsanız projenin sunucusuz olarak başlatılması basit ve ucuzdur.

3. Ayrıca sunucusuz SQL havuzu, veri gölünde bulunan verileri sorgulamak için özel olarak tasarlanmıştır, bu nedenle yönetim yükünü ortadan kaldırmanın yanı sıra, verileri sisteme alma endişesini de ortadan kaldırır. Sorguyu zaten gölde bulunan verilere yönlendirin ve çalıştırın.

Azure Synapse sunucusuz SQL havuzları kullanım senaryoları

Sunucusuz SQL havuzu, normal bir SQL Sunucusu gibi davranır. Böylece SQL Server’a bağlanabilen tüm istemciler sunucusuz SQL havuzuna da bağlanabilir. Bu, çok sayıda kullanım durumu sağlar. Genel olarak sunucusuz SQL havuzu bir analiz sistemidir ve OLTP tipi iş yükleri için kullanılması önerilmez. Milisaniyelik yanıt süreleri gerektiren ve bir veri kümesindeki tek bir satırı saptamak isteyen iş yükleri, sunucusuz SQL havuzu için uygun değildir.

Analitik iş yükleri söz konusu olduğunda, üç ana kullanım durumu vardır:

1. Veri keşfi

Veri keşfi, veri gölüne göz atmanıza ve verilerle ilgili ilk öngörüleri almanıza olanak tanır ve Azure Synapse Studio ile kolayca elde edilebilir. Bu aracı kullanarak dosyalara göz atabilir, sağ tıklayabilir ve SQL Server’da bir tabloda yaptığınız gibi İLK 100 satırı seçebilirsiniz. Bir veri kümesine aşina olduğunuzda, veriler normal bir SQL Server tablosundaymış gibi projeksiyonlar, filtreleme, gruplama ve işlemlerin çoğunu veriler üzerinde uygulayabilirsiniz.

2. Veri dönüşümü

Azure Synapse Analytics, Synapse Spark ile harika veri dönüştürme yetenekleri sağlar, ancak SQL konusunda bilginiz varsa veri dönüştürmeyi daha kolay bulabilirsiniz. Sunucusuz SQL havuzu, göldeki veriler üzerinde bir SELECT ifadesi yürütmenize ve sonuçları belirli bir biçimde veri gölüne geri depolamanıza olanak tanır.

3. Mantıksal veri ambarı

İlgilendiğiniz verilere aşina olduğunuzda, data lake üzerinde size bir SQL meta veri katmanı sağlayan nesneler oluşturmaya başlayabilirsiniz. Bu nesneler oluşturulduktan sonra, sunucusuz SQL havuzuna bağlanabilen herhangi bir araç, bu nesneleri normal SQL Server nesneleri olarak görecektir. Müşteriler, temel alınan verilerin veri gölünde olduğunu bile bilmiyorlar. Bu, sunucusuz SQL havuzunu veri gölü ile istemci arasında güçlü ve hafif bir katman haline getirir. Sunucusuz SQL havuzunun büyük ölçüde SQL Server’a dayandığı göz önüne alındığında, çok sayıda istemci desteklenir. Power BI veya Azure Analysis Service gibi BI araçlarından, Synapse Pipelines veya Azure Data Factory gibi tümleştirme araçlarından bağlanabilirsiniz ve ayrıca C# veya Python gibi popüler dillerden herhangi birini kullanarak programlı olarak bağlanabilirsiniz.

Azure Synapse serverless SQL pools Kullanarak Csv Sorgulama

CSV dosyaları, birçok işletmede yaygın olarak kullanılan bir dosya biçimidir ve sunucusuz SQL havuzunu kullanarak tek bir CSV dosyasını sorgulayabilirsiniz. CSV dosyalarının farklı biçimleri olabilir:

· Başlık satırı olan ve olmayan

· Virgül ve sekmeyle ayrılmış değerler

· Windows ve Unix stili satır sonları

· Alıntılanmayan ve alıntılanmayan değerler ve kaçan karakterler

OPENROWSET işlevi, dosyanızın URL’sini sağlayarak CSV dosyasının içeriğini okumanızı sağlar.

Azure Synapse sunucusuz SQL havuzları depolama seçenekleri

Kuruluşlar performansa duyarlı bulutta yerel uygulamaları devreye alırken, farklı performans seviyelerinde uygun maliyetli veri depolama seçeneklerine sahip olmak önemlidir.

Azure blob depolama, iki farklı performans katmanı sunar:

1. Premium: yüksek işlem oranları ve tek basamaklı tutarlı depolama gecikmesi için optimize edilmiştir

2. Standart: yüksek kapasite ve yüksek verim için optimize edilmiştir

Azure Data Lake Storage 2, hiyerarşik ad alanı özelliğini kullanarak nesne depolama ölçeğinde ve fiyatlarında dosya sistemi performansı sağlar. Bu, bir hesaptaki nesnelerin/dosyaların toplanmasının, bilgisayarınızdaki dosya sisteminin düzenlenmesiyle aynı şekilde dizinler ve iç içe alt dizinler hiyerarşisi halinde düzenlenmesine olanak tanır. Hiyerarşik bir ad alanı etkinleştirildiğinde, bir depolama hesabı, analitik motorlarına ve çerçevelerine aşina olan dosya sistemi semantiğiyle, nesne depolamanın ölçeklenebilirliğini ve maliyet etkinliğini sağlama yeteneğine sahip olur.

Not: Pratik olarak konuşursak, Serverless SQL havuzu için en iyi performansı arıyorsanız Azure Data Lake Storage 2. premium katmanına gitmelisiniz. Lütfen bu teklifin en büyük maliyete sahip olduğunu unutmayın.

--

--