Derin Öğrenme İle Uydu Fotoğrafı Segmentesyonu

Ömer SAVAŞ
Huawei Developers - Türkiye
3 min readSep 14, 2022

--

Merhaba değerli okuyucu. İnciciler için özet geçiyorum: bu yazıda mikroişlemcilerin gelişiminden başlayıp; bu konuda bugünkü ulaşabildiğimiz hızı, multidisiplinel bilgi birikimine borçlu olduğumuzu vurgulayıp; coğrafi bilgi sistemeleri (CBS) konusunda yapay zekanın kullanımına değinip; yapay zeka ile uydu fotoğrafı üzerinden yolların ve tarım alanları gibi bölümlerin tespit edilmesine bağlayacağım. Ayrıca ara ara da BTK ve Huawei ‘yi öveceğim. Direk resim segmentasyonu kaynak koduna erişmek isteyenleri buraya alalım.

Yıllar yıllar önce bir yazı okumuştum. Yazıda; bugün kullandığımız modern işlemcilerin gelişiminden bahsediyordu. Mikroişlemciler temel olarak içerisinde milyarlarca transistör barındırır. Bu elemanların görevi genel anahtarlama işlemidir. Ama -bir mühendislik dehası olarak- bu elemanlar uç uca öyle bağlanır ki; virgüllü bir sayının sinüsünü bir saniye içerisinde milyonlarca hatta milyarlaca kez detay seviyesinde hesaplayabilir.

Her teknolojik keşifte olduğu gibi her yenilik önce yalnızca temel seviyede gerçeklenir sonra veririmlileştirme üzerine ilerler. Örneğin sanallaştırma teknolojisi. İlk başlarda amaç yalnızca izole sanal bir işletim sistemi çıkarmaktı. Şuan serverless mimarilerin zemindeki işletim sisteminin tükettiği kaynaklara bile tahammülü yok. [1] [2]

Direk söyleyemesek de dolaylı olarak şu kabullenimi yapabiliriz: bir işlemcideki transistör sayısı arttıkça işlem gücü de artar. (bkz: moore yasası)

Mikroişlemcilere dönersek; aslında işlemciler de bir seviyeye kadar gelmişti. Ama burada fiziksel bir kısıta takıldılar (şuanki tepkime süresi kısıtı gibi). Çünkü transistör dediğimiz devre elemanı fiziksel bir bileşendi ve bir seviyeye kadar küçültülebiliyordu. Tam burada Jack Kilby imdada yetişti. Silikon atomlarının -tabiri caizse- radyosyon ile kararsız hale getirilerek bir transistör üretilebilceği fikrini ortaya attı ve gerçekledi. Zaten bu icadından dolayı da 2000 yılında nobel fizik ödülüne layık görüldü. Velhasıl elektronikçileri içine düştükleri kuyudan bir fizikçi (biraz da kimyacı) yaklaşımıyla kurtarmıştı. Ve biz bugün 10 nanometre ‘den daha küçük transislör kullanabiliyoruz.

Herneyse. 2011 yılından beri CBS alanında ürünler geliştiriyorum. Son bir kaç senedir de derin öğrenme konusuyla hobi seviyesinde ilgiliniyordum. BTK tarafından gönderilen bir mail ile BTK-Huawei işbirliği ile gerçekleştirilen bir yapay zeka yarışmasından haberim oldu. Yalan söylemiyim aslında beni en çok ödül olarak verilecek Huawei bilgisayar motive etti. Binayenaleyh başvurdum ve ön elemeyi geçtim. Ardından gerçek bir problem verildi ve çözmemiz istendi. Problem yazının başındaki resimde de görüleceği üzere; bir uygu fotoğrafının, tarım alanı, yol, akarsu gibi segmentlere bölünmesini sağlayacak bir yapay zeka uygulaması tasarlamaktı.

Ukala ukala son bir kaç paragraf daha yazıp sizi kaynak koda yönlendireceğim. 15+ yıldır bilişim sektöründeyim ve fırsat buldukça yeni alanları/yaklaşımları/dilleri/frameworkleri denemeye çalışıyorum. Bu bana bir soruna, kalasik yaklaşımların dışında alternatif yönlerden bakabilmemi kolaylaştırıyor. Bu yaklaşımı eleştirenler de var. Bir alanda derinleşmenin ve uzmanlaşmanın daha doğru olduğunu savunan bir görüş. Ben hibrit bir yaklaşımı savunuyorum. Bir alanda derinleşmek tabiki bir gerek ama bunun yanında yan projelerle yeni şeyler deneyimlemeye bir engel yok. Bu, tüm tuşlara aynı anda basmak değil. Zaten bu yazıda yazdıklarımla bunun gerekliliğini ispat ettmeye çalıştım.

Hadi çığır açmak, yeni birşey üretmek konusunu boşverelim. Hayat uzun ve son zamanlarda -tarihte hiç görülmediği kadar- hızlı değişiyor. Sadece frontend tarafında geliştirmeler yapan bir arkadaşı düşünelim. Figma üzerinde yapılan tasarımlar artık direk bir Vue projesi olarak export edilebiliyor. Yada backendciler için konuşalım gpt-3 ve co-pilot çok başarılı sınıflar üretebiliyorlar. Yorum satırları bile ekliyorlar. Örnekleri çoğaltmak mümkün. Fatih Kadir AKIN ve Özgür ÖZTÜRK arasındaki şakalı atışmaları yeniden tetiklemek istemiyorum ama sormak istediğim birşey var. Bu ve benzeri yazılımlar yakın gelecekte çok daha iyi yerlere geldiklerinde bu kadar çok yazılımcıya ihtiyaç olacak mı? Yada biz yalnızca bu bildiklerimizi koruyarak konfor alanımızda kalmaya devam edebilecek miyiz? Bu konuda uzun bir yazı daha yazmak istiyorum. Ehl-i merak motivasyon için yeşillendirsin :)

Evet biraz gevezelik yaptım. Sonuç olarak -Allah onlardan razı olsun- BTK ve Huawei ‘nin motivasyonu ile resim segmentasyonu problemi üzerine bir model geliştirdim ve Türkiye 3. olarak ödülü almaya hak kazandım. Çözüm ve model hakkında türkçe ve ingilizce açıklamalar içeren detaylı bir repo burada. Aklınıza takılan konuları sormaktan çekinmeyin. Sağlıcakla…

--

--