VERİNİN YOLCULUK HİKAYESİ: BÜYÜK VERİ

Enes Çelebi
StartupMEF
Published in
5 min readMay 28, 2022

Big Data ya da Türkçe karşılığı ile büyük veri. Günümüzde gazete, televizyon veya herhangi bir yerde sıklıkla duyduğumuz ama dünyayı değiştirebilecek teknolojiler arasında olmasına rağmen hakkında, sahip olduğu potansiyel ve ifade ettiği anlamın büyüklüğü kadar bilgi sahibi olmadığımız bir terim.

Belirli bir süre kullandığınız telefonda mesaj yazdığınız zaman arkadaki algoritmanın bir sonraki anlamlı kelimeyi tahmin ettiğini veya bir alışveriş sitesinde incelediğiniz ürün ya da türevlerinin çeşitli platformlarda karşınıza çıktığına şahit olmuşsunuzdur. Bu örnekler büyük verinin gündelik hayatımızdaki en basit deneyimlerindendir. Büyük veri, sık kullandığımız bir mesajlaşma uygulamasından en kompleks veri bulutlarına kadar her yerde ve farklı şekillerde kullanılıyor. Bununla beraber büyük kitleleri yönlendirebiliyor ve hatta yönetebiliyor. Peki farkında olmasak da her an hayatımızın içinde olan bu algoritma nasıl çalışıyor? Bunu anlamak için verinin büyük veriye olan yolculuğunu bilmemiz gerekir.

TDK’ye göre veri, “bir araştırmanın, bir tartışmanın, bir muhakemenin temeli olan ana öge, muta, donedir.” Yani temel oluşturması sebebiyle tek başına çok fazla anlam ifade etmez. Büyük veri ise bu tek başına anlam ifade etmeyen ama birleştiğinde dev bir bilgi yığınını oluşturan veriler kümesinin adıdır. Büyük verinin gelişme ve çalışma süreci temel olarak bilgi piramidi sistemi ile açıklanabilir. Bilgi piramidi; veri, bilgi, birikim ve bilgelik adımlarından oluşan bir sistemdir. Örnek vermek gerekirse, yapay zeka ile çalışan bir robotun gözündeki kameranın aldığı görüntü veri, görüntüden araba olduğunu anlaması bilgi, bu arabanın kendisine yaklaştığını fark etmesi birikim ve eğer yoldan çekilmezse kendine çarpacağını öğrenmesi ise bilgeliktir. Özetle algoritmanın zamanla arabadan öğrenerek kaçınması gerektiği sonucunu çıkarabilir.

Büyük veri tanımlanırken 3 ana başlıkta ele alınır. Bunlar:

- Volume (Hacim): Hacim kavramını veri birikimi olarak adlandırabiliriz. Fakat özellikle bu alanda veriler gigabyte boyutunda değil petabyte ya da terabyte boyutunda ifade edilir.

- Velocity (Hız): Herhangi bir alanda verilerin üretilme hızını açıklar. Günümüzde özellikle sosyal medyanın çok yoğun kullanılması sebebiyle çok kısa sürede devasa boyutta veriler büyük veri bulutlarına yüklenir. Örneğin, günümüzde her bir dakikada Instagram’da 695.000 fotoğraf, Twitter’da 194.000 tweet, otuz milyar anlık mesaj ve yüz doksan milyon e-posta gönderiliyor.

- Variety (Çeşitlilik): Bu durumu veri bulutunun farklı kaynaklardan beslenmesi olarak açıklayabiliriz. Bunlar resim, ses ya da metin olabilir.

Peki bu veriler nereden geliyor, nasıl işleniyor ve nasıl kullanılıyor?

İnsanlık tarihte hiç olmadığı kadar hızlı ilerliyor. 2000 yılında dünyadaki tüm verilerin %20’si dijital, geriye kalan %80’i ise kitaplar, dergiler ya da diğer yazılı kaynaklardandı. 2015 itibari ile bu oran dijital kaynaklar için % 98’lere ulaştı. Nesnelerin interneti dediğimiz kavramın hayatımıza girmesi ile her birimiz devasa veri havuzlarını besleyen birer araç haline geldik. Yemek siparişlerimiz, Google aramalarımız, banka işlemlerimiz ve en önemlisi sosyal medya platformlarımız sayesinde her an büyük veri bulutlarına veri iletiyoruz. Yani kısaca yerküremizde gerçekleşen her olay bir veri üretiyor.

Nasıl işleniyor?

Üretilen tüm bu verileri ham bir madene benzetebiliriz. Eğer gerçekten veriyi fonksiyonel bir araç olarak kullanmak istiyorsak işlemek zorundayız. Veri işleme metotları 1950’li yıllarda kullanılmaya başlanan istatistiksel metotlara dayanır. Fakat günümüzdeki verilerin boyutu eski istatistiksel metotlarla işlem yapılamayacak boyutlarda olduğu için programla dillerinden faydalanılır. Bu dillerin en popülerleri ise Python ve R .

Bundan sadece birkaç asır önce insanlar sorularına cevap almak için uzun süren deney ve gözlemler yaparken bugün veri depolarını tarıyorlar. Herhangi bir olay sonucunda üretilen veriyi paralel olarak işleyebilen bilgisayarlar tekrar eden örüntüler yardımıyla veri ve kaynağı arasındaki ilişkiyi çözebiliyor. Belirli bir süre mesaj yazdığınız zaman algoritmanın bir sonraki kelimeyi tahmin etmesi bu duruma örnek olarak verilebilir.

Nasıl ve Nerede Kullanılıyor ?

Büyük verinin bizi en çok ilgilendiren kısmı kullanım alanıdır. Hayatın her alanında kendine yer bulan büyük verinin kullanım alanını sınırlamak çok kolay değil. Tüketici davranışlarını izlemek ve yeni trendler yaratmak isteyen satıcılar, araştırmacılar, girişimciler, büyük şirketler, kurumlar ve devletler olmak üzere her düzeyde büyük veriyi kullanmaktadır. Büyük veriyi kullanan kuruluşlar bunun olumlu sonuçlarını çok kısa sürede görebiliyor. Araştırmalara göre büyük veriyi kullanan şirketler; %50 daha fazla kazanç elde etmiş, pazar çalışmalarında %41 etkili olmuş, reklam harcamaları %37 azalmış ve sosyal medya kullanımında %37 gibi yüksek oranlarla daha başarılı olmuşlardır. Büyük veri, iş dünyası haricinde sağlık hizmetlerinin iyileştirilmesi, organize suçlar ve güvenlik amaçlı istihbarat, doğal afetler ve kaynakların yönetimi gibi konularda da karar vericilere büyük kolaylıklar sağlayarak yardımcı oluyor. Fakat sayısız kaynaktan beslenebilen ve bunun sonucunda farklı alanlarda çıkarımlar üretebilen bir teknoloji ne yazık ki her zaman olumlu şekilde kullanılmıyor. Hedefli reklam çalışmaları ile kitleleri manipüle etme, 2016 ABD seçimleri, İngiltere’nin Brexit sürecinin etkilenmesi ve Facebook davası bize büyük verinin kötü kullanılması durumlarında ne kadar olumsuz sonuçları olacağının uluslararası boyutta birer ispatı.

Büyük veriyi gelecekte neler bekliyor?

“Büyük veri, makine öğrenmesi, yapay zeka gibi teknolojiler nedeniyle gelecekte insan gücüne ihtiyaç o denli azalacak ki insanlar kitleler halinde gereksiz olmaya başlayacak.”

Veriler, farkında olalım ya da olmayalım dünyamızı ve bizleri daha öncesinde hiç görülmediği ölçülerde etkilemektedir. Bu etki mikro ölçeklerde basit bir reklam olabilirken makro düzeylerde bir devletin seçimlerine, dolayısıyla demokrasisine müdahale veya milyonlarca kullanıcısı olan şirketlerin kullanıcılarının verilerini sızdırılmasına kadar gidebilir. Sadece bununla da kalmayarak kimi araştırmacılara göre, kullanım alanı sınırsız olan büyük veriyi kontrol eden şirketler devletlerin yerini alabilir ya da petrol, silah veya toprak yerine devletler bu gücün kontrolü için karşı karşıya gelebilir.

Hızla dijitalleşen dünya, internet sayesinde sürekli veri üreten insanlık ve bunları işleyen sistemler büyük veriyi derin, sonsuz ve kullanılabilir bir bulut haline getiren en önemli sebepler. Bugünün penceresinden baktığımız zaman doğru kullanıldığı durumda büyük verinin getireceği fayda ve kazanç ile istenildiği takdirde dünya için ne denli bir tehdit oluşturabileceği gerçeği arasına sıkışmış durumdayız. Her an büyümeye devam eden ve büyüdükçe bizi daha fazla etkileyen bu teknolojinin geleceğin en önemli konularından birisi olacağı artık tartışılmaz bir gerçek. Öte yandan verilerin gelişen teknoloji ile birlikte doğru işlenmesi, uluslararası kurum ve kuruluşların da veri güvenliğine dair alacağı tedbirler ile büyük veriden gayet olumlu sonuçlar alacağımız ise şüphesiz. Bizler, insanlardan kuruluşlara gerekli güvenlik tedbirlerini alarak ve doğru kullanarak bu dev gücü insanlığın gelişmesine katkı sağlamada kullanabilir veya geleceğimizin, özel hayatımızın, kuruluşlarımızın ve en önemlisi de kendimizin yönlendirilmesine izin veririz. Tercih bizlerin.

Büyük Veriye Dair Film Önerileri:

- Moneyball

- Limitless

- Brexit

Kaynakça:

- Turkey, B. D. (2019, May 12). Big Data (Büyük Veri) Nedir? Medium. Retrieved May 21, 2022, from https://medium.com/dusunenbeyinler/big-data-b%C3%BCy%C3%BCk-veri-analizi-d53d8f8ab52b

- Dincer, A. T. (2018, August 24). İnternette 60 Saniyede Neler Oluyor? euronews. Retrieved May 21, 2022, from https://tr.euronews.com/2018/08/24/60-saniyede-internette-neler-oluyor-

- Harari, Y. N., & Siral, S. (2018). 21. Yüzyıl için 21 Ders. Kolektif Kitap.

- Taylor, D. (2022, March 26). What is big data? introduction, types, characteristics, examples. Guru99. Retrieved May 21, 2022, from https://www.guru99.com/what-is-big-data.html

--

--