Türkiye Açık Kaynak Platformu
6 min readApr 25, 2022

Türkçe Doğal Dil İşleme için büyük atılım…

Türkçe Doğal Dil İşleme Veri Kütüphanesi ile “Mukayese” uygulaması hayata geçirildi

  • Türkiye Açık Kaynak Platformu, Türkçe Doğal Dil İşleme projesi kapsamında Türkçe Doğal Dil İşleme Veri Kütüphanesi ile makine öğrenme ve doğal dil işleme için model ve yazılımları karşılaştırma olanağı sunan bir platform olan Mukayese uygulamasını yazılım dünyasına tanıttı. Projede yapay zeka, makine öğrenmesi ve veri bilimi alanlarından ülkemizin önde gelen bilim insanları görev aldı.
  • Platform tarafından sunulan Türkçe Doğal Dil İşleme araçları, “Ulusal Yapay Zeka Stratejisi’’ kapsamında 2025 yılına dek “Türkçe Doğal Dil işleme alanında en az bir küresel marka çıkarılması hedefi çerçevesinde önemli adımlardan birini oluşturuyor.
  • Çevrim içi gerçekleştirilen lansmanın açılış konuşmasını yapan Sanayi ve Teknoloji Bakan Yardımcısı Mehmet Fatih Kacır, Türkiye Açık Kaynak Platformu bünyesinde hayata geçirilen projenin sanal asistanlardan, çevrimiçi eğitimlere, KOBİ’lerin dijital dönüşümünden güvenlik sistemlerine kadar birçok sektörün temel ihtiyacını karşılayacak niteliğe sahip olduğunu belirtti.
  • Veri Kütüphanesi ile doğal dil işleme alanında bugüne dek katkı sunulmayan Türkçe Doğal Dil İşleme alanı için bir araştırma temeli sağlanması hedefleniyor. Ayrıca yurtdışı ve yurtiçinden araştırmacıların ve girişimcilerin bu alana katkıda bulunmasının önü açılıyor.

Türkçe Doğal Dil İşleme Veri Kütüphanesi ve Mukayese platformu uygulaması 21 Nisan‘da Türkiye Açık Kaynak Platformu’nun Youtube sayfasında düzenlenen çevrim içi etkinlikle yazılım dünyasına tanıtıldı.

Üç ayrı oturumun yer aldığı etkinlik Sanayi ve Teknoloji Bakan Yardımcısı Mehmet Fatih Kacır’ın açılış konuşması ile başladı. Kacır, konuşmasında Bakanlık bünyesinde üç yıl önce kurulan Türkiye Açık Kaynak Platformu bünyesinde başlatılan ilk proje olan Türkçe Doğal Dil İşleme projesi ile Türkçe metinlerin işlenmesi için gerekli kullanıcı dostu ve yüksek performanslı kütüphanelerin, veri kümelerinin hazırlanması, dağıtım altyapısının kurulması, verilerin ve araçların sağlanmasının amaçlandığını ifade etti.

Açık kaynak temelli Türkçe Dil Deposu herkesin kullanımına açık olacak

Proje kapsamında son kullanıcılar tarafından kolaylıkla erişilebilecek ve kullanılabilecek veri ve araç kütüphaneler oluşturulacağını, yapay zekâ temelli yeni algoritmalar geliştireceğini ekleyen Bakan Yardımcısı, konuşmasını şöyle sürdürdü; ‘’Bu proje telefonumuzdaki sanal asistandan, çevrimiçi eğitimlere, KOBİ’lerin dijital dönüşümünden güvenlik sistemlerine kadar birçok sektörün temel ihtiyacını karşılayacak niteliğe sahip. Biz burada Türkçe dil deposunu herkesin kullanımına açıyoruz. Açık kaynak yazılımların dokümantasyonunu yapıp, herkesin hızla kullanabileceği hale getiriyoruz. TDD bünyesinde “Mukayese uygulaması” oldukça önemli. Dünya genelinde Türkçe Doğal Dil İşleme araştırmacıları için bir referans platformu amaçlıyoruz ve önümüzdeki dönemde bu projelerimizi artırmayı hedefliyoruz’’.

42 Yazılımcı Okulları ile istihdam piyasasına hızla katılacak yazılımcılar yetiştiriyoruz

Konuşmasında Türkiye Açık Kaynak Platformu bünyesinde yürütülen diğer çalışmalar hakkında da bilgi veren Mehmet Fatih Kacır, Pardus işletim sisteminin uygulama alanları ve kullanıcı deneyimini iyileştirmek üzere yürütülen çalışmaların yanı sıra, Açık Kaynak Platformu’nda açık kaynak alt yapılarla geliştirilmekte olan Dijital Rozet Projesi, Kubernetes Orkestrasyonu Sistemi (KOS) Projesi, 42 Yazılım Okulları’nın da paydaşları arasında yer aldığı Kampüste Dijital Sanat Projesi gibi projelerin geldiğini aktardı.

Türkiye Açık Kaynak Platformu’nun yürütücüsü olduğu 42 Okulları’nın 25 ülkedeki 42 kampüsüyle uluslararası bir marka olan Ecole 42’nin küresel ağında yer aldığını ifade eden Kacır; ‘’42 Okulları dünyanın en iyi kodlama okulları arasında yer alıyor. Türkiye’deki iki kampüsümüzün yanı sıra yenileri için de çalışmalarımızı süratle sürdürüyoruz. Bu eğitim kurumlarının dünyadaki muadillerinden mezun olanlar en iyi şirketlerde istihdam ediliyor. Bizim de buradaki hedefimiz salt yazılımcı yetiştirmekten ziyade, hızlıca istihdam piyasasına katılabilecek yazılımcı yetiştirmek olacak. Gençlerimiz gerçek projelerde sektörün değerli firmalarıyla çalışma fırsatı bulacak. Platform üyesi firmalarımız eğitimleri sırasında öğrencilerle tanışabilecek, onları takip edebilecek ve istihdam etme şansına sahip olacak. Böylece herkesin ihtiyacına cevap veren dinamik bir ekosistem oluşturacağız’’ ifadelerini kullandı.

‘’TDD için 25 yıllık hayalimiz gerçekleşti’’

Açılışın ardından düzenlenen ilk panelde söz alan Türkçe Doğal Dil İşleme projesinin danışmanı ve koordinatörü Prof. Dr. Deniz Yuret (Koç Üniversitesi Bilgisayar Bölümü, Koç Üniversitesi-İş Bankası Yapay Zekâ Merkezi -KUIS Direktörü), TDD projesi lle amaçlananın Türkçe doğal dil işleme teknolojileri üzerine hem araştırmacılara hem de sektöre yararlanabilecekleri bir platform sunmak olduğunu belirtti. TDD projesinin yaklaşık 25 yıl boyunca hayalini kurduğu bir proje olduğunu belirten Yuret, bu projede paylaşılan tüm veri ve programların açık kaynaklı olması dolayısıyla üniversitelerden akademisyen ve araştırmacıların, şirketlerin ve ilgili tüm paydaşların TDD’yi kullanılabileceğini ve adı geçen herkesin katkılarına açık bir platform tasarladıklarını sözlerine ekledi.

TÜBİTAK BİLGEM BTE Enstitü Müdür Yardımcısı Mehmet Haklıdır’ın moderatörlüğünde gerçekleştirilen ilk oturumun konuşmacıları arasında Dr. Gözde Gül Şahin (Koç Üniversitesi), Dr.Reyyan Yeniterzi (Sabancı Üniversitesi), Fatih Uysal (Kariyer.net — CEO) ve Dr. Ömer Farukhan Güneş (Oxford Üniversitesi-Oxtractor’da Kurucu ve CEO, DeepZen’de NLP Araştırmacısı) de yer aldı.

Bilişim alanında yetenek ihtiyacı artıyor

Kariyer.net CEO’su Fatih Uysal, etkinlikte yaptığı konuşmada bilişim alanında yetenek arayışının son beş yıldır önemli bir yükseliş kaydettiğini belirterek şirketlerin büyük verinin önemini daha iyi anladıklarını vurguladı. Bilişim ve özellikle doğal dil işleme alanında çalışacak insan kaynağına yönelik talebin özellikle son üç yıldır yükselen bir grafik çizdiğini kaydeden Uysal, ‘’2023 yılına dek 500 bin yazılımcı’’ hedefinin bu çerçevede önem kazandığına dikkat çekti.

Türkçe Doğal Dil İşleme çalışan akademisyenlere uluslararası bilinirlik fırsatı

Dr. Gözde Gül Şahin ise Doğal Dil İşleme alanında son yıllarda büyük bir uyanış olduğunu vurgulayarak, Türkçe doğal dil çalışan araştırmacıların aynı zamanda Türkçe’ye benzer dil yapısındaki diğer diller üzerine de araştırmalar yürütebilme şansına sahip olduğunu ifade etti. Şahin şöyle devam etti: ‘’Doğal dil işleme çalışan akademisyenler olarak önemli bir döneme tanıklık ediyoruz. Bu alanda büyük bir uyanış söz konusu. Kuşkusuz dil bilimcilerin de bu uyanışa katkısı büyük. Bu alanda bugüne dek baskın dil olan İngilizce analitik bir dil, morfolojik yapısı Türkçe’den çok farklı. Türkçe’nin doğal dil işleme alanına girmesiyle, yapısal olarak Türkçe ile benzerlik gösteren diğer dilleri de analiz etmiş ve model geliştirmiş oluyoruz. Dolayısıyla bu alanda çalışacak genç araştırmacılar sadece Türkçe üzerine değil, benzer morfolojideki diller üzerine de çalışmış olup uluslararası bilinirlik elde edebilecekler’’.

Etkinliğin ikinci oturumunda ise Taner Sezer (Mersin Üniversitesi) ve Ali Safaya (Koç Üniversitesi) Türkçe Doğal Dil İşleme çalışmaları hakkında bilgiler verirken ; üçüncü ve son oturumda Türkçe Doğal Dil İşleme projesine model ve veri paylaşan kurumlarından Garanti BBVA Teknoloji Kıdemli Yazılım Uzmanı Enes Bulut’un moderatörlüğünde gerçekleştirildi. Oturuma, Fatih Mehmet Güler (PragmaCraft-Kurucu),Fatih Samet Çetin (Artiwise-Kurucu Ortak ve CTO) ve Türk Hava Yolları’ndan kıdemli veri bilimciler Dr. Nisa Selcan Değer ile Nevcihan Toraman doğal dil işleme konusunda sektörden uygulamaları izleyicilere aktardı.

Lansman videosu için link:

https://www.youtube.com/watch?

Türkçe Doğal Dil İşleme Projesi ve Türkçe Dil Deposu Nedir?

Türkiye Açık Kaynak Platformu’nun temel projelerinden biri olan Türkçe Doğal Dil İşleme projesi, Türkçe metinlerin işlenmesi için ihtiyaç duyulan veri kümelerinin hazırlanması, bu veri kümelerinin dağıtım altyapısının oluşturulması, yüksek performanslı kütüphanelerin oluşturulması, bu kütüphanelere dayanan kullanıcı dostu ve çevrim içi araçların sunulmasını amaçlıyor. Doğal dilin işleme doğası gereği hedef dile uygun olarak üretilen veri setleri kullanılarak yazılım üretilen bir alan olması nedeniyle, İngilizce veya diğer diller için geliştirilen kütüphaneler Türkçe’ye doğrudan uygulanamıyor; söz konusu diller için oluşturulmuş veri kümelerinden faydalanmak mümkün olmuyor.

Türkiye Açık Kaynak Platformu’nun başlıca projelerinden biri olan Türkçe Doğal Dil İşleme ve Türkçe Dil Deposu ile ülkemizde hem akademik çalışmalara katkı sağlanması hem de son kullanıcılar tarafından kolaylıkla erişilebilecek ve kullanılabilecek veri ve araç kütüphaneler oluşturularak alana destek verilmesi hedefleniyor.

Türkçe Dil Deposu projesinin akademik paydaşları arasında Sabancı, Koç, Boğaziçi, İTÜ ve Mersin üniversiteleri yer alıyor. Projenin kamu ve özel sektörden paydaşları arasında ise TC Cumhurbaşkanlığı Dijital Dönüşüm Ofisi, Türk Hava Yolları, Aselsan, TÜBİTAK BİLGEM, TÜBİTAK ULAKBİM, Havelsan, Garanti BBVA, Turkcell, Microsoft, Koç Sistem, OBSS, Kodiks, Profelis, Kariyer.net bulunuyor. https://tdd.ai/

Mukayese Nedir?

Mukayese, Türkçe Veri Deposu üzerinde çalışan Doğal Dil İşleme uzmanlarından oluşan bir ekip tarafından oluşturuldu. Yazım denetiminden doğal dil anlamaya kadar uzanan görevler için kapsamlı bir dizi kıyaslama aracı ve veri kümesi sağlayarak yapay zekâ araştırmalarını tekrarlanabilir ve kolay erişilebilir hale getirmeyi amaçlayan Mukayese uygulaması dünya genelinde Türkçe Doğal Dil İşleme araştırmacıları için bir referans platformu oluşturmayı amaçlıyor. https://mukayese.tdd.ai/

Türkiye Açık Kaynak Platformu Hakkında

Sanayi ve Teknoloji Bakanlığı himayelerinde, Bilişim Vadisi ve TÜBİTAK TÜSSİDE ortaklığında kurulan Türkiye Açık Kaynak Platformu, kamu ve özel sektör şirketleri, STK’lar, üniversiteler, eğitim kurumları ve topluluklardan oluşan paydaşları ile açık kaynak ekosistemini geliştirmek için faaliyetlerini sürdürmektedir. Türkiye Açık Kaynak Platformu, ülkemizde ihraç edilebilir açık kaynak yazılım ürünleri geliştirmeyi, lisanslamadan kaynaklanan kamu ve özel sektör yazılım maliyetlerini azaltmayı, nitelikli yazılım geliştirici sayısını artırmayı ve açık kaynak yazılım destek hizmetlerini sunan şirket ve girişimci sayılarını artırmayı hedeflemektedir.

https://www.turkiyeacikkaynakplatformu.com/