#MachineLearningWeekend Notlarım

Gülsüm Erarslan
Deep Learning Türkiye
3 min readNov 10, 2019

Türkiye’nin en büyük yapay zeka topluluğu Deep Learning Türkiye ve Google Developers geçtiğimiz hafta ‘ML Weekend’ etkinliği ile İstanbul, Ankara, Bursa ve İzmir’de eş zamanlı yürütülen bolca uygulamalı ve sektörden isimlerin de konuşmacı olduğu bir organizasyona imza attı.

2 tam gün boyunca GCloud Platformu üzerinde Qwiklabları gerçekleştirirken verinin hazırlığı, analiz edilerek anlamlandırılması ve ML algoritmaları ile çıktılar üretilmesine yönelik çalışmalarda bulunduk. Bu tarz çalışmalarda python ve linux komutlarına aşina olmanızda yarar var. Daha önce farklı zamanlarda gcloud üzerindeki labların bir kaçında çalışma fırsatım olmuştu fakat eğitim sırasında uçtan uca tüm labları deneyimlerken verinin yolculuğuna tanık olmak ve tüm aşamaları birlikte uygulayarak gerçekleştirmek güzel bir deneyimdi.

Cloud ML-Engine labı ile buluta giriş yapmış olduk ve hali hazırda AI platform içerisinde yer alan ABD nüfus sayımı veri setini kullanarak açık kaynak kodlu derin öğrenme kütüphanesi Tensorflow ile modelimizi eğitip ardından derin yapay sinir ağları ile kişilerin gelir kategorisini tahminledik.

Modeli tanımlarken Tensorflow içerisindeki DNNCombinedLinearClassifier sınıfını kullandık. Derin sinir ağları (DNN), karmaşık doğrusal olmayan ilişkileri modelleyebilirken gelen çıktıları daha basit özelliklerde gerçekleştirilen doğrusal bir regresyon ile birleştirir, bu durum birçok yapılandırılmış veri probleminde etkili olan güç ve hız arasında bir denge sağlar.

Dataprep adından da anlaşılacağı üzere verinin analiz işlemine girmeden önce hazır hale getirilmesi safhasında imdadımıza yetişiyor. Veri kümesindeki uyuşmazlıkları düzeltirken ihtiyacımız olmayan fazlalıkları temizler ve uygun veri tiplerine dönüştürür ve böylece anlamlı verileri biraraya getirir veri setini analiz için hazırlar.

Dataflow ile bir pipeline kurgulamak mümkün, JSON içerisinde cloud dataflow şablonlarını kullanarak Pub/Sub ( publish/subscribe) yapısı ile girdi alan ve bu veriyi BigQuery tablolarına aktaran bir akış konfigüre ettik. Bunu GCP konsol veya komut satırından yönetmek mümkün. Bu işleyiş sistem performansını etkilemeksizin daha az karmaşık kod ile gerçek zamanlı analiz imkanı sunuyor.

Dataproc büyük hacimli veri işlemlerinde en çok karşılaştığımız zaman maliyetini indirgemeye yönelik bir bulut hizmeti olarak karşımıza çıkıyor. Büyük veri üzerinde paralel işlemler yapabilmek için kullanılan Apache Spark ve Apache Hadoop kümelerini Dataproc ile çok daha basit ve daha düşük maliyetli bir şekilde çalıştırabiliyoruz. Saat/gün süren işlemler yerine saniye/dakika süren işlemlere dönüşüyor.

Cloud Dataproc kümesi oluşturduğumuz bu lab çalışmasında GCP konsolu kullanarak küme içerisinde örnek bir Apache Spark işini çalıştırıp daha sonra tanımlı iş üzerinde değişikliğe giderek dilediğimizde yeniden boyutlandırabileceğimiz uygulamalarda bulunduk.

Cloud Speech API ile sesin analiz edilerek metin çevirisine aktarılmasına yönelik keyifli bir labın ardından günü tamamladık.

Bir sonraki gün de cloud içerisindeki makine öğrenmesi apilerini bir arada kullarak çeşitli projeler yaptık. Görüntü işlemede sıkça kullanılan Optik Karakter Tanıma kütüphanesini (OCR) Cloud Vision API’si ile gerçekleştirdik ve bir görüntüden metin çıktısı aldık, bu metin fransızca idi ve çeviri için Translation API kullandık. Metnin anlamlı parçalanmasına yönelik çözümleme ve analiz için de Natural Language API kullandık. Benzer şekilde yüz tanıma ve chatboot uygulaması ile programı tamamladık, çalışmalara buradan erişebilirsiniz.

Labların oldukça yoğun geçmesi sebebiyle program akışında aralara konan sohbet niteliğindeki ‘Tech Talk’ lar ilaç gibi geldi, sektörden birçok isim ile bu sayede tanışma fırsatımız oldu ve merak edilen konularda birçok soru iletildi. Katılmaktan büyük keyif aldığım bir etkinlikti, gönüllülük esaslı güzel işlerin daha da artmasını diliyorum, haftasonunu bizler için ayıran eğitmenlerimize ve bu organizasyonda emeği geçen herkese teşekkürler..

🌼🌼

--

--