Türkçe Doğal Dil İşleme için büyük atılım…
Türkçe Doğal Dil İşleme Veri Kütüphanesi ile “Mukayese” uygulaması hayata geçirildi
- Türkiye Açık Kaynak Platformu, Türkçe Doğal Dil İşleme projesi kapsamında Türkçe Doğal Dil İşleme Veri Kütüphanesi ile makine öğrenme ve doğal dil işleme için model ve yazılımları karşılaştırma olanağı sunan bir platform olan Mukayese uygulamasını yazılım dünyasına tanıttı. Projede yapay zeka, makine öğrenmesi ve veri bilimi alanlarından ülkemizin önde gelen bilim insanları görev aldı.
- Platform tarafından sunulan Türkçe Doğal Dil İşleme araçları, “Ulusal Yapay Zeka Stratejisi’’ kapsamında 2025 yılına dek “Türkçe Doğal Dil işleme alanında en az bir küresel marka çıkarılması hedefi çerçevesinde önemli adımlardan birini oluşturuyor.
- Çevrim içi gerçekleştirilen lansmanın açılış konuşmasını yapan Sanayi ve Teknoloji Bakan Yardımcısı Mehmet Fatih Kacır, Türkiye Açık Kaynak Platformu bünyesinde hayata geçirilen projenin sanal asistanlardan, çevrimiçi eğitimlere, KOBİ’lerin dijital dönüşümünden güvenlik sistemlerine kadar birçok sektörün temel ihtiyacını karşılayacak niteliğe sahip olduğunu belirtti.
- Veri Kütüphanesi ile doğal dil işleme alanında bugüne dek katkı sunulmayan Türkçe Doğal Dil İşleme alanı için bir araştırma temeli sağlanması hedefleniyor. Ayrıca yurtdışı ve yurtiçinden araştırmacıların ve girişimcilerin bu alana katkıda bulunmasının önü açılıyor.
Türkçe Doğal Dil İşleme Veri Kütüphanesi ve Mukayese platformu uygulaması 21 Nisan‘da ’Türkiye Açık Kaynak Platformu’nun Youtube sayfasında düzenlenen çevrim içi etkinlikle yazılım dünyasına tanıtıldı.
Üç ayrı oturumun yer aldığı etkinlik Sanayi ve Teknoloji Bakan Yardımcısı Mehmet Fatih Kacır’ın açılış konuşması ile başladı. Kacır, konuşmasında Bakanlık bünyesinde üç yıl önce kurulan Türkiye Açık Kaynak Platformu bünyesinde başlatılan ilk proje olan Türkçe Doğal Dil İşleme projesi ile Türkçe metinlerin işlenmesi için gerekli kullanıcı dostu ve yüksek performanslı kütüphanelerin, veri kümelerinin hazırlanması, dağıtım altyapısının kurulması, verilerin ve araçların sağlanmasının amaçlandığını ifade etti.
Açık kaynak temelli Türkçe Dil Deposu herkesin kullanımına açık olacak
Proje kapsamında son kullanıcılar tarafından kolaylıkla erişilebilecek ve kullanılabilecek veri ve araç kütüphaneler oluşturulacağını, yapay zekâ temelli yeni algoritmalar geliştireceğini ekleyen Bakan Yardımcısı, konuşmasını şöyle sürdürdü; ‘’Bu proje telefonumuzdaki sanal asistandan, çevrimiçi eğitimlere, KOBİ’lerin dijital dönüşümünden güvenlik sistemlerine kadar birçok sektörün temel ihtiyacını karşılayacak niteliğe sahip. Biz burada Türkçe dil deposunu herkesin kullanımına açıyoruz. Açık kaynak yazılımların dokümantasyonunu yapıp, herkesin hızla kullanabileceği hale getiriyoruz. TDD bünyesinde “Mukayese uygulaması” oldukça önemli. Dünya genelinde Türkçe Doğal Dil İşleme araştırmacıları için bir referans platformu amaçlıyoruz ve önümüzdeki dönemde bu projelerimizi artırmayı hedefliyoruz’’.
42 Yazılımcı Okulları ile istihdam piyasasına hızla katılacak yazılımcılar yetiştiriyoruz
Konuşmasında Türkiye Açık Kaynak Platformu bünyesinde yürütülen diğer çalışmalar hakkında da bilgi veren Mehmet Fatih Kacır, Pardus işletim sisteminin uygulama alanları ve kullanıcı deneyimini iyileştirmek üzere yürütülen çalışmaların yanı sıra, Açık Kaynak Platformu’nda açık kaynak alt yapılarla geliştirilmekte olan Dijital Rozet Projesi, Kubernetes Orkestrasyonu Sistemi (KOS) Projesi, 42 Yazılım Okulları’nın da paydaşları arasında yer aldığı Kampüste Dijital Sanat Projesi gibi projelerin geldiğini aktardı.
Türkiye Açık Kaynak Platformu’nun yürütücüsü olduğu 42 Okulları’nın 25 ülkedeki 42 kampüsüyle uluslararası bir marka olan Ecole 42’nin küresel ağında yer aldığını ifade eden Kacır; ‘’42 Okulları dünyanın en iyi kodlama okulları arasında yer alıyor. Türkiye’deki iki kampüsümüzün yanı sıra yenileri için de çalışmalarımızı süratle sürdürüyoruz. Bu eğitim kurumlarının dünyadaki muadillerinden mezun olanlar en iyi şirketlerde istihdam ediliyor. Bizim de buradaki hedefimiz salt yazılımcı yetiştirmekten ziyade, hızlıca istihdam piyasasına katılabilecek yazılımcı yetiştirmek olacak. Gençlerimiz gerçek projelerde sektörün değerli firmalarıyla çalışma fırsatı bulacak. Platform üyesi firmalarımız eğitimleri sırasında öğrencilerle tanışabilecek, onları takip edebilecek ve istihdam etme şansına sahip olacak. Böylece herkesin ihtiyacına cevap veren dinamik bir ekosistem oluşturacağız’’ ifadelerini kullandı.
‘’TDD için 25 yıllık hayalimiz gerçekleşti’’
Açılışın ardından düzenlenen ilk panelde söz alan Türkçe Doğal Dil İşleme projesinin danışmanı ve koordinatörü Prof. Dr. Deniz Yuret (Koç Üniversitesi Bilgisayar Bölümü, Koç Üniversitesi-İş Bankası Yapay Zekâ Merkezi -KUIS Direktörü), TDD projesi lle amaçlananın Türkçe doğal dil işleme teknolojileri üzerine hem araştırmacılara hem de sektöre yararlanabilecekleri bir platform sunmak olduğunu belirtti. TDD projesinin yaklaşık 25 yıl boyunca hayalini kurduğu bir proje olduğunu belirten Yuret, bu projede paylaşılan tüm veri ve programların açık kaynaklı olması dolayısıyla üniversitelerden akademisyen ve araştırmacıların, şirketlerin ve ilgili tüm paydaşların TDD’yi kullanılabileceğini ve adı geçen herkesin katkılarına açık bir platform tasarladıklarını sözlerine ekledi.
TÜBİTAK BİLGEM BTE Enstitü Müdür Yardımcısı Mehmet Haklıdır’ın moderatörlüğünde gerçekleştirilen ilk oturumun konuşmacıları arasında Dr. Gözde Gül Şahin (Koç Üniversitesi), Dr.Reyyan Yeniterzi (Sabancı Üniversitesi), Fatih Uysal (Kariyer.net — CEO) ve Dr. Ömer Farukhan Güneş (Oxford Üniversitesi-Oxtractor’da Kurucu ve CEO, DeepZen’de NLP Araştırmacısı) de yer aldı.
Bilişim alanında yetenek ihtiyacı artıyor
Kariyer.net CEO’su Fatih Uysal, etkinlikte yaptığı konuşmada bilişim alanında yetenek arayışının son beş yıldır önemli bir yükseliş kaydettiğini belirterek şirketlerin büyük verinin önemini daha iyi anladıklarını vurguladı. Bilişim ve özellikle doğal dil işleme alanında çalışacak insan kaynağına yönelik talebin özellikle son üç yıldır yükselen bir grafik çizdiğini kaydeden Uysal, ‘’2023 yılına dek 500 bin yazılımcı’’ hedefinin bu çerçevede önem kazandığına dikkat çekti.
Türkçe Doğal Dil İşleme çalışan akademisyenlere uluslararası bilinirlik fırsatı
Dr. Gözde Gül Şahin ise Doğal Dil İşleme alanında son yıllarda büyük bir uyanış olduğunu vurgulayarak, Türkçe doğal dil çalışan araştırmacıların aynı zamanda Türkçe’ye benzer dil yapısındaki diğer diller üzerine de araştırmalar yürütebilme şansına sahip olduğunu ifade etti. Şahin şöyle devam etti: ‘’Doğal dil işleme çalışan akademisyenler olarak önemli bir döneme tanıklık ediyoruz. Bu alanda büyük bir uyanış söz konusu. Kuşkusuz dil bilimcilerin de bu uyanışa katkısı büyük. Bu alanda bugüne dek baskın dil olan İngilizce analitik bir dil, morfolojik yapısı Türkçe’den çok farklı. Türkçe’nin doğal dil işleme alanına girmesiyle, yapısal olarak Türkçe ile benzerlik gösteren diğer dilleri de analiz etmiş ve model geliştirmiş oluyoruz. Dolayısıyla bu alanda çalışacak genç araştırmacılar sadece Türkçe üzerine değil, benzer morfolojideki diller üzerine de çalışmış olup uluslararası bilinirlik elde edebilecekler’’.
Etkinliğin ikinci oturumunda ise Taner Sezer (Mersin Üniversitesi) ve Ali Safaya (Koç Üniversitesi) Türkçe Doğal Dil İşleme çalışmaları hakkında bilgiler verirken ; üçüncü ve son oturumda Türkçe Doğal Dil İşleme projesine model ve veri paylaşan kurumlarından Garanti BBVA Teknoloji Kıdemli Yazılım Uzmanı Enes Bulut’un moderatörlüğünde gerçekleştirildi. Oturuma, Fatih Mehmet Güler (PragmaCraft-Kurucu),Fatih Samet Çetin (Artiwise-Kurucu Ortak ve CTO) ve Türk Hava Yolları’ndan kıdemli veri bilimciler Dr. Nisa Selcan Değer ile Nevcihan Toraman doğal dil işleme konusunda sektörden uygulamaları izleyicilere aktardı.
Lansman videosu için link:
https://www.youtube.com/watch?
Türkçe Doğal Dil İşleme Projesi ve Türkçe Dil Deposu Nedir?