Büyük Veri, Yapay Zeka(AI) ve Kelebek Etkisi

Aslıhan Reyhanoğlu
Nettsi Bilişim Teknoloji A.Ş.
5 min readJun 7, 2020

Bu yazıda günümüzün popüler teknolojilerinden büyük veri ve yapay zekanın ne olduğuna, aralarındaki ilişkiye ve kelebek etkisi konusuna değineceğim.

Büyük Veri Nedir?

1990’larda ortaya çıkan büyük veri terimi bir işletmenin gelişiminde rol oynayacak önemli bilgiler elde etmek amacıyla biriktirilecek, analiz edilecek ve üzerinde çalışılacak çok fazla miktarda veriyi ifade eder. Büyük ve karmaşık veri kümesini geleneksel istatistiksel yöntemlerle işlemek, anlamlı bilgi elde etmek çok kolay değildir. Büyük veri yapılandırılmış, yapılandırılmamış ve yarı yapılandırılmış olmak üzere üç farklı formda bulunabilir.

Yapılandırılmış: Belli bir formatta saklanabilen, organize edilmiş ve biçimlendirilmiş verilerdir. Genellikle satır ve sütunlardan oluştuğundan bu verilerin içinde arama yapmak, düzenlemek ve analiz etmek kolaydır. Örnek olarak Excel dosyaları ve SQL veritabanı verilebilir.

Yapılandırılmamış: Bu verilerin yapısı önceden belirtilmemiştir. Örneğin; ses, video dosyaları ve No-SQL veritabanları. Yapılandırılmış verilerle kıyaslandığında içerdiği düzensizlikler ve belirsizlikler nedeniyle geleneksel yöntemlerle analiz etmenin zor olduğu bilinmektedir ancak yapılandırılmamış verilerin analizi sonucunda daha ayrıntılı bilgiler elde edilebilir.

Yarı Yapılandırılmış: Yapılandırılmış ve yapılandırılmamış verileri bir arada içeren formdur. Örneğin; bir e-posta mesajı yapılandırılmamış gerçek içerikten ve yapılandırılmış verilerden (gönderenin ve alıcının adı, e-posta adresi, gönderilen zaman vb.) oluşmaktadır.

Hacim, çeşitlilik ve hız büyük verinin karakteristik özelliklerinden bazılarıdır. Hacim, veri miktarını belirtirken çeşitlilik farklı formatlardaki mevcut farklı veri türlerini ifade etmektedir. Büyük veride hız terimi, yeni verilerin düzenli olarak oluşturulma hızı anlamına gelmektedir.

İnternet, kişilerin alışkanlıklarına (beğeni ve beğenmeme ve kişisel tercihler vb.) ilişkin somut bilgiler sağlayan önemli bir veri kaynağıdır. Sosyal medya hesapları(çevrim içi/çevrim dışı profiller), ürün incelemeleri, beğenilen ve paylaşılan içerik, CRM (müşteri ilişkileri yönetimi) sistemlerinin tümü büyük veriye katkıda bulunur.

Yapay Zeka Nedir?

1956'da ortaya çıkan yapay zeka terimi artan veri, gelişen algoritmalar ve depolama alanındaki yenilikler sayesinde günümüzde daha da popülerdir. Bilgisayar biliminin bir alt dalı olan yapay zeka, düşünme, öğrenme ve hareket etme gibi kabiliyetlere sahip olması beklenen sistemleri ifade eder. Yapay zeka sistemleri, insan zekasını taklit eder. Bu sistemlerin elde ettikleri bilgilerle yinelemeli olarak kendilerini iyileştirebilme özelliği vardır.

Yapay Zeka, makine öğrenmesi ve derin öğrenme gibi kavramları içine alan genel teknolojidir. Makine öğrenimi ise istatistiksel yöntemlerle yapay zekayı destekler.

Büyük Veri ve Yapay Zeka İlişkisi

Büyük Veri ve Yapay Zeka(AI) arasında karşılıklı bir ilişki vardır. AI sistemleri oluşturulurken çok miktarda veriye ihtiyaç duyulur. Yani veri olmazsa yapay zeka uygulamalarının bir anlamı da olmaz. Büyük verinin AI sistemlerinde kullanılması yapay zekanın gücünü daha da attırır. Öte yandan yapay zeka da büyük veri kullanıcılarına emek isteyen ve zaman alan analitik işlemleri otomatikleştirme ve geliştirme imkanı sunar. Anomaly Detection ve Pattern Recognition, büyük veri ve yapay zekayı bir arada kullanan teknolojilerden bazılarıdır.

Spotify, İsveç merkezli müzik akışı sağlayıcısı, yapay zeka ve büyük veriyi kullanan şirketlere bir örnek olarak verilebilir. Spotify veri odaklı bir şirkettir ve müşterilerinin deneyimlerini arttırmak amacıyla müşteri bilgilerini(dinledikleri müzik türleri vb.) biriktirir. Toplanan veriler, dinleyicilerin müzik tercihlerini tahmin etmek ve onlara yeni öneriler sunmak için makine öğrenme algoritmalarını eğitmekte kullanılır. Spotify, Haftalık Keşif özelliğiyle kullanıcılara, bu platformda, daha önce duymadıkları kişiselleştirilmiş bir çalma listesi hazırlar. Spotify’ın haftalık keşif listesini oluştururken kullandığı üç farklı model vardır:

1.Collaborative Filtering: Benzer kullanıcıların tercihlerini göz önünde bulundurarak kullanıcıların tercihleri hakkında otomatik tahminler yapmaya çalışır. Algoritma birçok kullanıcıdan gelen bilgileri analiz eder ve benzer olanların örüntülerini belirler. Bu kullanıcıların ne dinlediğini dikkate alarak bir kullanıcının müzik zevkini tahmin etmeye çalışır.

2.Natural Language Processing (NLP): Bu algoritmayı kullanarak her şarkı için bir profil bulmaya çalışır(makaleleri, blog yayınlarını veya müzikle ilgili başka metinleri bulmak için sürekli olarak web’te gezinir).

3.Convolutional Neural Networks(CNN): Spotify’ın öneri sistemini geliştirmek ve doğruluğunu artırmak amacıyla kullanılır. CNN algoritması diğer algoritmalar gibi az bilinen şarkıları ihmal etmez. CNN, çok popüler olmayan şarkıların yanı sıra yeni şarkıların da dikkate alınmasını sağlar.

Kelebek Etkisi

Kaos teorisi, doğrusal olmayan ve rastgele olan olayları mantıklı sebeplere dayandırarak tahmin etmeye çalışan bilimdir. Bir olayın sonucu birden çok farklı değişkene bağlıdır ve değişkenlerin sonucu nasıl etkilediğini her zaman tahmin etmemiz mümkün değildir. Yani her zaman bir hata payı vardır. Kaos teorisinde bir sistemin başlangıç verilerinde küçük değişiklikler yapıldığında öngörülemeyen büyük sonuçların ortaya çıkması durumuna kelebek etkisi denilmektedir.

Kelebek Etkisi Fikrinin Ortaya Çıkışı

MIT Profesörü ve Araştırma Bilimcisi Edward Lorenz (1917–2008) hava durumu tahminini bilgisayar programında modellerken başlangıç verisini 0.506127 yerine 0.506 olarak girince sonucun çok değiştiğini gördü. Lorenz, bu deneyle başlangıç koşullarındaki küçük bir değişikliğin çarpıcı sonuçlar doğurabileceğini ortaya koydu. 1963 yılında yayınladığı “Deterministik Periyodik Olmayan Akış” adlı bir makalesinden bir alıntı aşağıdadır.

Eşsizliğin, sürekliliğin ve sınırlılığın koşullarına bağlı olarak; merkezi bir yörünge, bir anlamda geçici özelliklere sahip olmayan bir yörünge, periyodik değilse sabit de değildir. Merkezi olmayan bir yörünge; eğer periyodik değilse düzgün bir şekilde sabit değildir ve eğer sabit ise, sabitliği zaman ilerledikçe yok olma eğiliminde olan geçici özelliklerinden biridir. Başlangıç koşullarının tam olarak ölçülmesinin imkansızlığı ve dolayısıyla merkezi bir yörünge ile yakındaki merkezi olmayan bir yörünge arasında ayrım yapmanın imkansızlığı göz önüne alındığında, tüm periyodik olmayan yörüngeler pratik tahmin açısından etkin olarak sabit değildir.”

Buna dayanarak bilgisayar programlarının her zaman doğru sonucu garanti edemeyeceği söylenebilir çünkü değerlerdeki küçük farklılıklar sonuçları önemli ölçüde değiştirebilir. Dünya, matematiğin üstesinden gelebileğinden daha karmaşıktır. Bu nedenle AI sistemleri ne kadar gelişirse gelişsin tahmin hedefini kaçırma ihtimali vardır. Onları sonuçları doğrulayabildiğimiz sürece güvenerek kullanabiliriz.

Sonuç olarak yapay zeka ve büyük verinin bir arada kullanılması kurumların müşteri ilgi alanlarını analiz etmesini ve onlara en iyi şekilde optimize edilmiş hizmetleri sunmasını kolaylaştırır.

Referanslar

https://www.researchgate.net/publication/310447985_ARTIFICIAL_INTELLIGENCE_FOR_BIG_DATA_POTENTIAL_AND_RELEVANCE

https://link.springer.com/article/10.1007/s13218-017-0523-7

https://customerthink.com/how-big-data-and-ai-work-together/

https://www.forbes.com/sites/bernardmarr/2019/10/18/whats-the-difference-between-structured-semi-structured-and-unstructured-data/#687f1df62b4d

https://www.guru99.com/what-is-big-data.html

https://www.proschoolonline.com/blog/the-relationship-between-big-data-and-ai

https://outsideinsight.com/insights/how-ai-helps-spotify-win-in-the-music-streaming-world/

https://www.forbes.com/sites/bernardmarr/2017/10/30/the-amazing-ways-spotify-uses-big-data-ai-and-machine-learning-to-drive-business-success/#71f35fa14bd2

https://www.mygreatlearning.com/blog/3-machine-learning-models-spotify-uses-to-recommend-music-youll-like/

https://medium.com/technical-library/veri-bilimi-makine-%C3%B6%C4%9Frenimi-ve-yapay-zeka-nas%C4%B1l-%C3%B6rt%C3%BC%C5%9F%C3%BCr-ve-ayr%C4%B1%C5%9F%C4%B1r-7443f7d27d3a

https://medium.com/ai-in-plain-english/artificial-intelligence-vs-machine-learning-vs-deep-learning-whats-the-difference-dccce18efe7f

https://www.mediaclick.com.tr/blog/yapay-zeka-nedir

https://medium.com/@ymschwartzman/butterfly-effect-chaos-theory-and-ai-classification-57ec1185bbcc#:~:text=Chaos%20theory%20proposes%20that%20there,system%20can%20have%20dramatic%20results.

https://mindmatters.ai/2019/05/does-the-butterfly-effect-sharply-limit-ais-power/

https://evrimagaci.org/kelebek-etkisi-nedir-7747

https://www.bilimgemisi.com/kaos-teorisi-ve-kelebek-etkisi-teorisi-nedir/

--

--