SÜRÜKLE — BIRAK ! KARŞINIZDA AZURE MACHİNE LEARNING STUDIO (UYGULAMALI)
AZURE ML STUDIO NEDİR?
Microsoft Azure ML Studio kodlama kullanmadan data cleaning, data process ve machine learning işlemlerini sürükle - bırak yöntemi ile kolaylıkla gerçekleştirmeye yarayan bir çalışma ortamı.
Açıkçası çalışma ortamını ilk incelediğimde ‘Nasıl yani Python’da saatlerce uğraşırken burada işlemler yalnızca bu kadar mı?’ dedim. Ancak kodlama bilgisi olmasa dahi sağlam bir machine learning ve data science bilgisi olması gerektiğini düşünüyorum. Hiç süphesiz her çalışma ortamının kendine göre olumlu ve olumsuz yanları var. Bence Azure ML Studio çalışma ortamının en kullanışlı taraflarından birisi data preprocess adımlarının kolay ve hızlıca gerçekleştirilmesi ve data ile ilk karşılaşmada yaptığımız klasik istatistiksel bilgilere, değişken grafiklerine kolaylıkla ulaşabilmek. Kişisel fikrim ise çalışma ortamı için Python kullanan birisi olarak ML Studio’da proje yaparken Python’da ki ‘Herşey kontrolüm altında’ hissiyatını pek yaşayamadım ama çalışma ortamı puzzle yapmak, bulmaca çözmek kadar eğlendirdi beni.
AZURE ML STUDIO’DA İŞLER NASIL İLERLİYOR?
Aslında nerede çalışırsak çalışalım adımlar her zaman aynı! İlk olarak datayı inceleyip gerekli preprocess adımlarını yaptıktan sonra model oluşturmaya başlıyoruz. Azure öğrenmek için gerçekleştirdiğim projemi basit adımlarla aktarmaya çalışacağım.
- Adım 1: Öncelikle veri setimizi yükleyelim. Bu işlemi local ortamımızdan, web adresinden ya da zip dosyasından yükleyebiliriz. Ben çalışmamda local ortamımda bulunan verisetini kullandım.
- Adım 2: Experiments kısmından kendimize yeni bir proje ortamı açıyoruz.
- Adım 3: Modellemede kullanacağımız değişkenleri seçelim. (Bu aşamadan önce datamızda missing value varsa bunları Clean Missing Data adımı ile gerekli işlemleri yapabiliriz.)
NOT: Ben veri setimi modellerken iki farklı senaryo üzerinden devam ettim. İlk senaryoda verisetine standartlaştırma işlemi uyguladıktan sonra modele verdim, ikinci senaryoda ise veri setine PCA işlemi uygulayıp 12 değişkenden oluşan verisetimi boyut indirgeyerek 5 değişken yapıp modele verdim.
- Adım 4.1: Datamızı standartlaştıralım. (Her çalışmada ve veri setinde bu aşamaya gerek olmayabilir ancak bazı ML algoritmaları standartlaştırılmış veri setinde daha iyi sonuçlar verir ör: neural network, support vector machine.)
- Adım 4.2: Veri setine boyut indirgeme işlemi yapalım.
- Adım 5: Klasik makine öğrenmesi adımlarında yaptığımız train-test split işlemini yapalım.
- Adım 6: Modelimizi kurmaya hazırız.!
- Adım 7: Her iki senaryo için kurduğumuz Train Model’i inceleyelim.
- Modelleme işlemi sonunda model şemasının görünümü.
MODELİ BAŞKA VERİLERE NASIL UYGULAYACAĞIZ?
NOT: Eğer benim projemde olduğu gibi iki farklı model kullandıysanız bu işlemden önce hangi train model sonucunu kullanmak istiyorsanız üzerine tıklayıp onu seçmelisiniz.
Bu aşamaya kadar yazıyı takip ettiyseniz teşekkür ederim. Bence Azure ML Studio arayüz ve kullanım olarak gayet rahat ve anlaşılır. Bu projede dataya uygulamadığım birçok işlem var (Aykırı değer tespiti, hiperparametre ayarlama, kayıp gözlem işlemleri vs.) ancak genel hatlarıyla en sade olacak şekilde bir proje yapmaya çalıştım. Kişisel kanaatim Colab, Jupyter gibi çalışma ortamları ‘kodlamalı’ olsa da bana kendimi daha iyi hissettirdi ama Azure ile bazı preprocess işlemlerini gerçekleştirip temiz datayı istediğimiz çalışma ortamında kullanmak güzel fikir olabilir.
Herkese İyi Çalışmalar :)
Diğer Yazılarımı Okumak İsterseniz;