Big Data Nedir?

İnternet çağına girmemizle birlikte verilerimiz internet aracılığıyla dünyayla paylaşılıyor. Çeşitli kurumlar ve bireyler bizim verilerimiz üzerinden satış stratejisi belirliyor, hangi ürününü piyasaya sokacaklarına karar veriyor , hatta halkın nabzını ölçüp kana göre şerbet vermeyi bile bu verileri analiz ederek yapabiliyorlar. İnsanlar gün geçtikçe büyük şirketler için bir ürün haline geliyor. Peki bunlar nasıl oluyor? Bu bizi direkt olarak verinin anlamını kavramaya ve büyük veri (Big data) teknolojisine doğru götürüyor.

Veri tek başına anlamsız, hem sayısal hem de değişkenlerden oluşan bir kümedir. Verinin anlamlı hale gelebilmesi için bazı adımlar izlenir. Bunlar aşağıdan yukarı sırasıyla olmak üzere veri, bilgi, birikim ve bilgeliktir.

Bu kavramları örnek vererek açıklamak gerekirse; bir şirket için bir yerden birkaç tane aldığınız ürünler bir veriyken, nereden aldığınız, hangi markayı tercih ettiğiniz, nasıl tür ürünlerden hoşlandığınız bir bilgi, bu bilgilerle hangi satış stratejisini izleyeceğiniz bir birikimken, ileride başarısız stratejilerinizden ders alıp bunları tekrar uygulamamak ise bilgeliğe örnek olarak verilebilir.

Geçmiş zamanlarda insanlar deneyleri için veriler toplarken ve bunları kullanarak sonuçlara ulaşmaya çalışırken, bugün biz verilere sorular sorar olduk. Televizyonda görmüş olduğumuz, seçim zamanı sayılan oyların partiler ve iller bazında dağılımını görmek, oylara göre hangi partilerin şehirlerde söz sahibi olabileceğini aslında verilere sorduğumuz sorularla anlıyoruz. Dünyanın dijitalleşmeye başlamasıyla exabaytlarla ölçülebilecek veri yığınlarına ulaşmaya başladık. Bu veri yığınlarını kontrol edebilmek için de büyük veri adında bir teknolojiye başvuruyoruz. Büyük veri teknolojisi, verilerin yukarıdaki piramitteki yollardan geçerek analiz edilip sınıflandırılmasına ve işlenebilir bir hale dönüştürülmüş haline denir. Aslında bu kavramı internette yürürken bıraktığınız izlerin toplanıp depo edilmesi olarak da düşünebilirsiniz. Büyük veri teknolojisi sayesinde sayısız veriyi sınıflandırıp en sade haline getirebiliyor ve bu verileri kullanışlı hale dönüştürebiliyoruz. Bu teknoloji 3 temel esastan oluşuyor. Bunlar: hacim (volume), çeşitlilik (variety) ve hızdır (velocity). Hacmin big datadaki görevi, verilerin toplanıldıktan sonra hafızasında depolamasıdır. Bu alanların büyüklüğü terabaytlardan petabaytlara kadar uzanan veri aralıklarıdır. Buradan veri kümelerin ne kadar karmaşık bir yapıya sahip olduğunu anlayabiliriz. Çeşitlilik ise insanlardan toplanan verilerin nereden alındığı ve dosya türlerinin belirtildiği bir kavramdır. Buna örnek olarak ise sosyal medyadaki faaliyetler ve internet üzerinden yapmış olduğumuz alışverişlerin veri olarak alınması gösterilebilir. Son olarak ise hız kavramına gelirsek, verilerin belirli zaman aralıklarında elde edilişi ve işlenişi konu alınır. Özellikle sosyal medyada üretilen veri sayıları devasa rakamlara ulaşmaktadır. 2019’daki verilere göre, Instagram’da dakikada 216 bin fotoğraf paylaşılmakta, Twitter’da günde 500 milyon tweet atılmakta ve internet üzerinden 30 milyar anlık mesaj 200 milyon e-posta gönderilmektedir. Unutmayın! Bu veriler sadece sosyal medyalarımızdan toplanmaktadır. Bütün bunlara ek bir örnek olarak hangi fiyat aralığında ürün aldığımızdan hangi tür ürünleri daha çok sevip kullandığımıza kadar bütün her şey büyük veri içinde kaydedilir. Hepimiz almak istediğimiz bir ürünü internetten araştırmışızdır ve belli bir araştırmadan sonra etrafta araştırdığımız ürünle ilgili reklamların çıktığını fark etmişizdir, işte çıkan o reklamlarda büyük veride ki analiz edilen verinin bir ürünüdür. Karşınıza çıkan reklamlar çeşitli algoritmalar sayesinde hızlı bir şekilde analiz edilir, ürünü üreten firmanın ilgili reklamı seçilir ve karşınıza çıkar. Bütün bu olayların inanılmaz derecede hızlı olması sizi de korkuttu mu? Eğer korktuysanız içinizi biraz da olsa rahatlatabilirim. Kredi kartınızı çaldırdığınızı varsayalım ve çalan hırsız kredi kartı üzerinden alışveriş yapmış olsun, eğer alışılmışın dışında bir bölgede yapılmışsa bu alışveriş doğrudan telefonunuza bilgi olarak gelir ve kullandığınız kartın bankası sizin izniniz olmadan yapılan bir alışveriş olduğundan kuşkulanır. Banka size haber verir ve böylelikle kartınızı iptal ettirerek hırsızların elinden sizi kurtarabilir. Büyük veri teknolojisi sayesinde bu kadar hızlı bir şekilde veriye ulaşmak bizi dolandırıcıların elinden bu şekilde kurtarabilir. Büyük verinin bize sağladığı iyi özelliklerini saymakla bitiremeyeceğimiz gibi içindeki verilerin gizliliği ve korunması da ayrı bir problem olarak gün yüzüne çıkmıştır.

Kendi açımdan bakmak gerekirse, çeşitli ortamlardan elde edilen bu veriler bizim için altın değerinde olan bilgilerdir. Bilgi güç demektir, güç insanları yozlaştırabilir, mutlak güç ise daima. Bu yüzden büyük veri teknolojisi şuan yaşamakta olduğumuz modern dünyada ve gelecekte, insanların verilerinin analiz edilmesiyle yeni start-up’ların oluşturulmasını sağlayabilir ama aynı şekilde kötü planlar içinde olan insanlar da büyük verinin eşsiz nimetlerinden yararlanabilir ve kişisel bilgilerinizi ihtiyacı doğrultusunda kullanabilir. Altta paylaşmış olduğum linklerden büyük veri hakkında daha fazla bilgiye sahip olabilirsiniz. Sağlıkla kalın, hoşça kalın.

https://www.youtube.com/watch?v=k8KYCz8bPRs

https://www.oracle.com/tr/big-data/what-is-big-data.html

https://www.sas.com/en_us/insights/big-data/what-is-big-data.html

https://aws.amazon.com/tr/big-data/what-is-big-data/

--

--