Müziği ‘Duyan’ Makineler Diyorum…

Sümeyra Bedir
Deep Learning Türkiye
7 min readApr 16, 2018

‘Müzik kendince hep akıllıydı, yapay zeka burada işe yaramaz’ ya da ‘Müzik zevk işi, algoritmalarla anlaşılmaz’ diyenler, bu yazının kendi kendine dans edebilen robotlardan bahsetmeyeceğinin farkında olmayabilir.

Akıllı Müzik

Baştan söyleyeyim, tek bir yazıda algoritmaları notalara ya da notaları algoritmalara dökmenin on yolunu duymayı da beklemeyin. Keza bu beste ömürlük, bir solukta bitmez…

Verinin işlenebilirliğinin giderek arttığı günümüzde, yapay öğrenme teknolojileri sanayi dünyasıyla oldukça içli dışlı. Bu teknolojiyi doğru şekilde kullanan şirketlerin endüstride hızla sivrildiğini görmek zor değil.

Sanatın her alanı bulundurduğu veri türüne göre gelişmelerden belirli ölçüde nasibini alıyor. Özellikle online müzik dinleme (streaming) uygulamalarına rağbetin artması sonucu müzik endüstrisinin geleceği bir anlamda yapay zekaya bağlı.

Ama her alanda olduğu gibi burada da, ilgi duyanları bekleyen klasik problemler var; spesifik bir yol belirleyememe, doğru kaynak bulamama, yüzlerce MOOC içinde kaybolup gitme… Elbette hayat boyu öğrenmeyi destekleyen platformlar çoğumuz için ilgi duyduğumuz alanlara yönelmekte ve bu alanlarda gerekli minimum altyapıyı kısa sürede kazanmakta inanılmaz faydalı olabiliyor. Ancak doğru seçim ve sistemli bir yol belirleme önemli. Meseleyi şu noktaya getirmemek lazım;

Oynatmaya az kaldi, doktorum nerde?

O zaman sormaya şöyle​ başlayalım, Güzel Sanatlar eğitimi almadan ya da müzisyen olmadan da bu alanda çalışma yapılabilir mi? Elbette.

Müzik Teknolojisi; Müzik, Bilgisayar Bilimleri, Matematik, İstatistik gibi birçok alan ile ilişkili, disiplinler arası bir çalışma alanı. Bu alanda açılmış ilk akademik eğitim birimi Almanya Paderborn Universitesi bünyesindeki ‘tonmaysterlik’ bölümü olarak biliniyor (1949). İngiltere’de 1970’lerde ‘ses mühendisliği’ olarak başlamış, SAE(Sound and Audio Engineering) adı ile de dünya çapına yayılmış. Dünyanın her yerinde artık akademik olarak bu alanda çalışma yapan birimler bulmak mümkün.

Müzik Bilimlerini Güzel Sanatlar’in sınırlarını aşacak bir altyapıya çekme niyetli Türkiye'deki ilk akademik girişim 2008’de Dokuz Eylül Üniversitesi’nde Müzik Teknolojisi Anabilim Dalı’nın kurulması. Bugün artık birçok üniversite ve akademimizde Müzik Teknolojisi üzerine eğitim veriliyor.

Meselenin Güzel Sanatlar’a bakan yönü özellikle de ülkemizde epeyce baskın gibi gözükse de Bilgisayar Bilimleri, Elektrik-Elektronik ve diğer fen ve mühendislik alanları ile ortak çalışmalara duyulan ihtiyaç giderek artmakta. Basit bir web taramasıyla bu alanda ter dökmüş birçok akademisyenin çalışmalarına ulaşabilirsiniz.

Kısacası, müzikseverseniz, müzisyen olmasanız da bu alanda yapabileceğiniz bir sürü çalışma var. İş dünyasının bu alandan beklentileri, akademik çalışmaların sunduğu mevcut genişlik, giriftlik ve disiplinlerarasılığın çok çok üzerinde.

Music Information Retrieval (Müzik Bilgi Getirimi)

Doğru kaynakları bulmak için doğru terimlerle aramak önemli. Müzik Teknolojilerinin daha fazla bilgisayar bilimleri içeren bir çalışma alanı olarak ‘Müzik Bilgi Getirimi’ (Music Information Retrieval) karşımıza çıkıyor. Bu alan müzik tavsiye sistemleri, müziğin akustik analizi, ton ve tarz belirleme, metin analizi, hatta Türk Müziği için ‘makam analizi’ gibi birçok çalışmayı bünyesinde barındırıyor.

Son derece geniş olan ve bir o kadar da açık araştırma sorusu bulunduran bu alana giriş yapmak isteyenler için hem akademi hem de iş dünyasını başarıyla bir araya getirmiş bir topluluktan bahsetmeden geçmeyelim. ISMIR (International Society of Music Information Retrieval), 2008 yılında Kanada merkezli kurulmuş bir topluluk. 2014 yılından beri de düzenli olarak her yıl uluslararası konferanslar düzenliyor. Ayrıca 2017 ve 2018 yıllarında da WIMIR(Women in Music Information Retrieval) adı altında, bu alandaki kadın istihdamını destekleyen bir mentorluk programı yürütüyor. Programı ve topluluğu özel kılan, aynı platformda teori ve pratiği buluşturması.

https://wimir.wordpress.com/

Nereden Başlayalım?

Müzik Bilgi Getirimi (MIR) alanında yapay öğrenme çalışmak isteyenlere başlangıç için iki yol sunulabilir; (Temel programlama ve yapay öğrenme bilgisi var sayılarak)

  • Ses işleme (signal processing, audio processing)
  • Müzik tavsiye sistemleri (music recommender systems)

Hangisinden başlarsanız başlayın ikisinin sürekli bir araya geldiğini fark edersiniz. Birinci kısmı şimdilik sonraya bırakarak ikinci kısma değinelim.

Müzik Tavsiye Sistemleri

Aslında her şey insanın makineye ‘hadi bana hoşlanabileceğim bir şeyler öner’ demesiyle başlıyor. Bu talep elbette, aynı zamanda ‘beni tanı’, ‘benim tanıdıklarımı da tanı’, ‘ortak zevklerimizi keşfet’ gibi birçok subliminal mesaj içeriyor. Başlı başlına bir çalışma alanı olan tavsiye sistemlerinin kullanım alanları oldukça geniş. Alışveriş siteleri, sosyal ağ platformları, video oynatma uygulamaları bunlardan sadece birkaçı.

Basit bir tavsiye sisteminin çalışmasıyla ilgili biraz kod görmek ve giriş seviyesinde konuyu anlamak isteyenler şu yazıya bakabilir;

Kullanıcının ürünü ‘oyladığı’ sistemlerde bu işi yapmak artık çok da zor değil. Ama biz müzikseverler en derin sanatsal hislerimizin ortasına ‘oylama’ gibi bir davranışı yerleştirmekte güdüsel olarak pek de becerikli sayılmayız. Müzik endüstrisi bunu anlamış olacak ki, kullanıcı hakkında ihtiyaç duyduğu bilgiyi, ‘oylama’ ve sosyal medya platformlarının kullandığı ‘arkadaşlık/takipçilik’ verisi gibi verilerin yani sıra, ‘kaydetme/ müzik kitaplığına ekleme’, ‘çalma/durdurma’, ‘liste oluşturma’ gibi doğal dinleyici tepkileri sonucu oluşan veriden de elde etmeye çalışıyor. Ama müziğin doğası elbette bu kadarla çözülecek kadar sınırları belli, filtrelenebilir ya da yorumlanabilir değil. İşte burada akustik analiz ve metin analizini kültürel analizlerle birleştirecek yapay öğrenme teknolojileri devreye giriyor.

Şarkıların Anatomisi (jazzfeezy)

Günümüzde internet üzerinden ücretsiz olarak dinlenebilen şarkı sayısının 30 milyonun üzerinde olduğu tahmin ediliyor. Size bir şarkı veya şarkıcı önerebilecek kadar ‘zeki’ bir sistem var olduğunda ve bunu müzik ‘zevk’inize hitap edebilecek şekilde başarılı yapabildiğinde, bunun hem sağlayıcı hem müzisyen hem de dinleyici için gerçek bir kazanım olacağını fark eden bir grup bilim adamı, 2005’te, bugun online muzik platformlarının çoğunun altyapısını kullandigi Echo-nest’i kurdular. Müzik tavsiye sistemlerinde ‘zevk’ ve ‘zeka’yı birleştiren bu teknolojinin doğuşuna baktığımızda müzik tavsiye sistemlerinin diğerlerine oranla ne kadar zor ve hala çözülmemiş birçok problemle bizi bekleyen mümbit bir yapay öğrenme alanı olduğunu açıkça görmüş oluruz.*

‘Müzik tavsiye sistemi’ veya ‘yeni müzik keşfi’ dendiğinde akla 3 temel yaklaşım gelir:

  • Şarkıcı veya şarkı benzerliği : Aradığınıza benzer şarkı veya şarkıcıları önerme işlemine dayandığından ve bir kullanıcı modeli kullanmadığından, bir web taraması işlemi sonucu ne kadar tavsiye sayılırsa o kadar tavsiye olarak değerlendirilir.
  • Kişiselleştirilmiş tavsiye : Bir kullanıcı modeli verildiğinde (şarkı çalma, şarkı atlama, değerlendirme, satın alma gibi kullanıcı verilerine dayanarak) kullanıcıyı haberdar olmadığı yeni müziklerle buluşturmayı amaçlar.
  • Şarkı Listesi Oluşturma : Kitaplığa ekleme, atlama, tekrarlı dinleme gibi geri bildirimleri yönetmeye dayalı şarkı listesi oluşturma yöntemi, bir kullanıcı modeli tarafından kişiselleştirilmiş olabileceği gibi, kişiselleştirilmemiş şarkı listeleri halinde de sunulabilir.

Hangi yöntemle olursa olsun şarkı tavsiyelerinin veriyi doğru sınıflandırma becerisinin üzerine kurulduğunu görürüz. Muzikologların, editörlerin ve müzikseverlerin doldurduğu anketlerle kaliteli sınıflandırma elde eden ya da satın alma ve kullanıcı aktivitelerini baz alarak tavsiye sistemlerini besleyen şirketler olduğu gibi, akustik analiz, şarkı sözü analizi ve şarkı-şarkıcı etiketleme gibi veriler kullanarak müzik tavsiye sistemlerini standartların üzerine taşımış şirketler de mevcut.

Spotify Muzik Tavsiye Sistemleri

Akustik analizlere veya şarkı sözlerinden Doğal Dil İşleme(NLP) yoluyla elde edilen analizlere de dayansa dinleyicilerin beklentilerine yaklaşmak için çok daha fazlasına ihtiyaç duyuluyor. Dinleyici, hele de metal müzik dinliyorsa, tavsiyeler en azından ‘bağırmalı metal’i ‘bağırmasız metal’den ayırdetsin istiyor. (Evet, başarıyı belirleyiciliği yüzünden ‘metal müzik’, tavsiye algoritmalarinin test edilmesinde en çok baz alınan tarz 🤙). Zaman-süre bazlı tını yakalama, ritm-tempo izleme, yüksek ses yoğunluğu, canlılık, sözlülük -enstrümantallik, baskın melodinin çözümlenmesi, enstrüman tanıma gibi bir çok çıktı, başarılı bir akustik analizin olmazsa olmazları.

Tavsiye sistemleri üzerine yapılan uluslararası çalışmaların öncüsü sayılan ACM Recommender Systems (RecSys) konferansları, her yıl bu alanda açtığı yarışmalar için, tema olarak bu yıl ‘Müzik Tavsiye Sistemleri’ni seçti. Yarışma için kullanılmak üzere Spotify desteğiyle Million PlayList veriseti araştırmacılara sunuldu. Yarışmada kullanıcıların şarkı listelerine uygun şarkı ekleme tavsiyeleri geliştirilecek.

Uzun lafın kısası, ‘Müziği “duyan” makineler’ diyorum, şimdilik dans etmeseler de olur… Kulağa hoş geliyor…

Son olarak, bu alanda çalışmak isteyenlere başlangıç için birkaç kaynak önerip yazıyı bitirelim

Direkt ilgili Coursera Dersleri;

*Echo-nest’in doğuşu: https://notes.variogr.am/2012/12/11/how-music-recommendation-works-and-doesnt-work/

Diger Kaynaklar

Ö. Çoban ve G. T. Özyer, “Music genre classification from Turkish lyrics,” 2016 24th Signal Processing and Communication Application Conference (SIU), Zonguldak, 2016, 101–104.

C. Isikhan, “ Muzikte teknolojik surec ve surecteki degisimiyle Turkiye’de Muzik Teknolojisi Egitimi”, The Journal of Academic Social Science, 2013, 102–111.

T. Jehan ve D. DesRoches, Echo-nest Analyzer Documentation, V 3.2, 2014.

D. Abidin, Ö. Öztürk ve T. Özacar Öztürk, “Klasik Türk müziğinde makam tanıma için veri madenciliği kullanımı”, Journal of the Faculty of Engineering and Architecture of Gazi University, 32:4 (2017), 1221–1232.

T. Li, M. Ogihara, B. Shao ve D. Wang, “Machine Learning Approaches for Music Information Retrieval”, Theory and Novel Applications of Machine Learning, 2009, I-Tech, Vienna, Austria.

N. Yan Wan, U. Amitabh ve P. Fung, “A Machine Learning based Music Retrieval and Recommendation System”, Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016).

D. Jannach, M. Zanker, A. Felfernig ve G. Friedrich, “Recommender Systems: An Introduction”, Cambridge University Press, 1st edition (September 30, 2010).

--

--

Sümeyra Bedir
Deep Learning Türkiye

PhD in Mathematics. Algebraic Coding Theorist. A mom of twins. Interested in #coding, #music, #datascience, #AI