Veri Bilimi Zirvesi notlarım

Bekir Arslan
Malumat
Published in
6 min readApr 25, 2019

En başta İTÜ Veri Bilimi Kubülü’ne böyle verimli bir organizasyon düzenledikleri için teşekkür etmeliyim. Kendini veri alanında yetiştirmeye çalışan biri olarak söylemeliyim ki bu iki tam gün boyunca konuşmalardan oldukça faydalandım. Yapay zeka ve makine öğrenmesi konularından çok, sorumlularından iş zekası ve analitik konuşmalarını dinlemek benim için iyi oldu. Yeri geldi kafamdaki bazı sorulara cevap buldum, yeri geldi ufkumun biraz daha genişlediğini hissettim. Katıldığım her seminer ve programda olduğu gibi burada da kendim için notlar tuttum. Bu notları biraz daha okunabilir hale getirdim ki belki hem ilgilisine faydalı olabilir hem de program organizatörlerine emekleri için teşekkür edebilirim. Başlıyorum.

Birinci Gün (24 Nisan)

Alman milli futbol takımının veri analitiği ekibinin son yıllardaki çalışmalarının takım yönetiminde etkisi büyük olmuş. Saha kenarında futbolcuları verilerle yönetebilmek müthiş bir hayal gücü. Spor konusunda veri analitiğinin kullanılır halde olması heyecan verici. En basitinden oyuncu izleme bu yöntemle yapılabilir durumda. Bu konu çok ilginç geldi bana.

Hangi veriyi anlamlandırmayı bilmek meselenin en önemli tarafı. Veri kirliliği çalışmayı boğabilir.

İşin kendisini öğrenmek her şeyden önemli. Programlar, yazılımlar, araçlar her zaman öğrenilebilir ama işin kendisini öğrenmek, veriyi işe göre (business, sektör) işlemeyi ve modellemeyi bilmek zor olan tarafta.

İşe junior çalışan almak

Sertaç Doğanay’ın yönettiği Deniz Bank’ta çalışan iki veri bilimci adayı Gökşen Gültekin ve Emirhan Oruç’un konuştuğu panel çok iyiydi.

Deniz Bank’ın yetiştirme amacıyla insanları işe alması ve kurduğu akademiyle belli bir eğitim sürecinden geçirmesi çok iyiymiş. Böyle bir kurumdan bunu duymayı hiç beklemiyordum açıkçası. Bu işe bir şekilde girmeyi planlayan ama tam olarak nereden başlayacağını bilemeyenler için bulunmaz nimet. Çünkü çoğu şirket belli bir süre tecrübe istiyor. Konuşmacılar halen eğitim sürecindeymiş. İş bulma derdini bir kenara bırakarak kendilerini tamamen yetiştirmeye odakladıklarını belirttiler. 40 kişilik analitik ekibine bu statüden 16 kişi dahil edilmiş. Bu kişiler uzmanlarla birlikte çalışmaya, artık belli başlı projelerde yer almaya başlamış.

Sertaç Doğanay’ın sorularıyla bu arkadaşların anlattığı konular dinleyiciler açısından da çok faydalı oldu. Çünkü dinleyicilerin çoğunluğu mezun olmak üzere olan öğrencilerdi. Bu sorulardan biri mezun oldukları bölümlerdi. Birisi işletme, diğeri yazılım mühendisliği mezunuymuş.

Veri kirliliği meselesi bu oturumda da konuşuldu. Yüzde 80 temizlik ise yüzde 20’si analitiğe kalıyor.

Veri bilimini farklı disiplinlere dokunabilen bir alan olarak görmeleri güzeldi. (Multi tasking, brain storming.)

İş birimlerindeki bilinçsiz ön yargı ve direnç analitik çalışanları zorlayabiliyor.

İkna ve iletişim veri meselesinin kritik noktaları. İş birimleri tarafından dirençle karşılaşmak mümkün.

Analizi yapmak kadar görselleştirmek de çok önemli.

Senden büyük veya üst düzey birinin seni dinlemesi bu işte en büyük motivasyon kaynaklarından. Bunu ben de hissettim.

Veri bilimci her alanda çalışamaz. Verilerle çalışabilir ama iş alanında faydalı olabilmesi için o işi en az o işi yapanlar kadar iyi bilmesi gerekiyor. Bu zamana kadar genel düşünürken bunu duyduktan sonra sektörel düşünmek hem ilginç hem daha odaklı hem de daha az yorucu gibi geldi bana. Farklı disiplinlere dokunduğu için insanın gözü korkabiliyor çünkü çok geniş bir alan. Benim sektörüm şu an insani yardım ekosistemi veya insani (humanitarian) ekosistem mesela. Ama finans, lojistik, satın alma, gönüllülük, fonlama, halka ilişkiler, medya ve iletişim ile de oldukça bağlantılı. Buna bir de müşteri (bağışçı) deneyimi ve kanal deneyimi tasarımı da eklendiğinde başlı başına bir sektör çıkıyor ortaya. (Bu bölümü yıldız ile işaretledim.)

Veri konusunda her zaman şüpheci olmak çok önemli.

Bilgi bombardımanı

Mustafa Acungil’in konuşmasından cımbızladığım şey buydu: Bilgi bombardımanı öğrenmeyi zorlar. Etrafta çok fazla öğrenme aracı var ama odaklanmak güç. Bir de bana göre ilginç olan bir şey söyledi: “Yeni bir tekniği ne kadar bilmenin yanında artık ne kadar hızlı öğrenebildiğin de önemli.”

Akıllı uçuş alternatifleri

Turna.com’un CEO’su Kadir Kırmızı’yı birkaç yerde daha dinlemiştim. Burada kendilerinin seyahatte kullandığı veri uygulamalarını anlattı. Dışarıdan veri almıyorlarmış, kendi ürettikleri veriler üzerinden analitik yapıyorlarmış. Akıllı uçuş alternatifleri adını verdikleri bir algoritma tanıttı. Ucuza bilet bulma adına çalışan bu algoritma aslında insanların birkaç sitede aradığı yolları kendi sitelerinde yapabilmeleri anlamına geliyor. Örneğin Londra’ya İstanbul’dan uçmak isteyen bir kişi daha ucuza bilet aramaya çalışıyor. Burada sistem kullanıcıya İstanbul’dan Dalaman’a uçmayı öneriyor. Dalaman’a turist getiren Londra merkezli küçük bir şirketin boş dönme ihtimali olan uçuşlarına aktarmayı hedefliyor. Böylelikle uçuş daha ucuza mal edilebiliyor.

İkinci Gün (25 Nisan)

Tüketici odaklı veri bilimi uygulamaları

Dünkü konular neredeyse yarı yarıya analitik ve yapay zekayken bugünkü oturumlar analitik ağırlıklıydı. O yüzden daha dikkat kesildiğim bir gün oldu benim için.

P&G şirketinden analist Filiz Güler Çınar, Intertech’ten DWH ve yapay zeka projeleri genel müdür yardımcısı Ayşe Büyükkaya, Yemek Sepeti’nden iş zekası yöneticisi Ferhat İşyapan ve BSH’den veri bilimi alan yöneticisi Seçkin Karabağ’ın konuşmaları en çok faydalandığım konuşmalar oldu.

Filiz Güler Çınar tüketici odaklı veri bilimi uygulamalarını şirket içerisinde nasıl yönettiklerini kendisinin hangi alanda çalıştığından bahsetti. Sonraki oturumlarda Yemek Sepeti örneğinden de dinlediğim gibi P&G’de de veri analitiği ve içgörü (BI) departmanları birbirinden ayrılmış. Hazırladıkları ve 1 milyon kullanıcıya ulaştıklarını söylediği uygulama üzerinden aslında kanalların oluşturduğu kullanıcı verilerinin kendileri için oldukça kullanışlı olduğundan bahsetti Filiz Hanım. Amaç — Model — Veri sıralaması da analitiğin özeti olabilecek kıvamda bir deyimdi.

İyice kulak kabartarak dinlediğim diğer bir konuşmacı Intertech’ten Ayşe Büyükkaya’ydı. Bankacılık üzerinden DWH çözümlerini dinledik kendisinden. Analitik ile birlikte gelen veri odaklı çalışma kültürünün çeşitli iş birimlerini zaman zaman korkutabildiğinden bahsetti. Önceki gün bahsi geçen direnç, ikna ve iletişim konularını destekleyen bir meseleydi. DWH sistemlerin teknik boyutlarından bahsederken aslında analitik iş yapma kültürünün kilit rolde olduğunu anlattı. Öyle ki analitiğin CRM, risk ve operasyonel verimlilik üzerinde doğrudan etkisi oluyor. Veri temizliği diğer konuşmacılarda olduğu gibi Ayşe Hanım’ın da cümleleri arasında geçti. Bir analitik proje için yoğun çalışmanın önemli bir kısmını verinin kullanılabilir hale getirilmesi alıyor dedi. Benim de bu aralar üzerinde çalıştığım bir proje için yaklaşık iki haftadır veri temizliği ile uğraşmam bu cümleye denk gelince gülümsedim. Veri temiz değilse projeye güvenemiyorsunuz hakikaten, öyle önemli bir konu. Modelleme ve segmentasyonun iş birimleri stratejisini belirleyen önemli adımlardan olduğunu söyledi. Bankacılık çözümü olarak belgelerin OCR ve dil işleme algoritmalarıyla dijitalleştirmiş olmaları da önemli bir başarı. Çalıştığım yerde benim de gündemimde olan bir konu bu.

Son birkaç aydır veri bilimi konusunda bana çok yardımcı olan abim Osman Vargeloğlu da Intertech’te çalışmış, ona da buradan selamlarımı ileteyim.

Zeka, iş bitirmek, SQL bilmek

Yemek Sepeti iş zekası yöneticisi Ferhat İşyapan’ın konuşması hem eğlenceli hem de oldukça faydalıydı. P&G’de olduğu gibi analitik ve iş zekası burada da ayrı departmanlar olarak çalışıyormuş. Karar destek sistemi yani iş zekası çalışmaları kurumun kendi verisinden elde edilirken analitik çalışmaların verileri kullanıcılardan geliyor. Bu ayrım net ve anlaşılırdı, o yüzden hoşuma gitti. Yemek Sepeti üzerinden hazırladıkları veriye dayalı projelerle birlikte kullandıkları uygulamalardan da bahsetti Ferhat Bey. Kullandıkları ve hazırladıkları analitik araçları üzerinde çalışan yaklaşık 200 rapor formatı varmış, 300’den fazla da veri aktarım süreci. Qlikview, Tableau ve Microsoft’un bazı uygulamalarını BI tarafında kullanırken analitik tarafta ise Google ve Adobe’nin analitik uygulamalarını kullanıyorlarmış. 800’e yakın çalışanın yaklaşık yarısı çağrı destek çalışanı olarak çalışıyormuş. Bu sayıya çok şaşırsam da günde 400 bin sipariş alan bir uygulama için çok değil. Ne bilmemiz gerekiyor sizinle çalışmak için diye sorulan bir soruya “Üç şey benim için önemli: Zeki, iş bitirici olmak ve SQL” demesi güldürdü. Çünkü bunlar olmadığı sürece hangi aracı kullandığınızın pek önemli yok.

Dikkatle dinlediğim son konuşmacı ev aletleri teknolojisi üzerine çalışan BSH şirketinde veri bilimi alan yöneticisi görevinde bulunan Seçkin Karabağ’dı. 60 kişiden oluşan bir analitik ekibi varmış şirkette. Veri kaynağı tutarlı değilse iş zekası yapamıyoruz dedi. Güzel bir alıntı paylaştı, bu iyiydi:

İstatistikçiden daha iyi yazılım bilmek, yazılımcıdan daha iyi istatistik bilmektir veri bilimi.

Seçkin Bey’in bir başka altını çizdiğim cümlesi şuydu:

Hedef iş değeri üretmek. Kodun ne kadar güzel yazıldığı, hazırlanan görsellerin ne kadar iyi olduğu yeri gelir önemli olmayabilir. Şahsi olarak işe ne türden bir değer katıyorsun, kendinden ne veriyorsun bu önemlidir.

Üniversite eğitiminde bu alanda çalışmamış, “dışarıdan” başlayan kişilerin bu alana giriş yapabilmeleri için ne önerirsiniz diye soruldu. Analiz araçlarını üzerinde biraz duran herkes kullanabilir. Bunlara katılacak artı değer istatistiksel yaklaşımlardır dedi Seçkin Bey. Temel istatistik bilgisinin veri biliminde çok faydası olacağından bahsetti. Ve daha da önemlisi işi öğrenebilmenin en faydalı yolunun somut projelere yönelmekten geçtiğini söyledi. Sonuna kadar katılıyorum.

İTÜ Veri Bilimi Kubülü üyeleri.

Benim kısaca notlarım bunlardı. Tüm konuşmacılarla birlikte program organizatörleri İsa Yaşasın ve Nurdan Beşli, programı sunan Zeynep Hasgül ile kulübün diğer üyelerine tekrar teşekkür ederim. Yolunuz açık olsun.

--

--

Bekir Arslan
Malumat
Editor for

I’m a data and analytics professional who help product teams to use data science to drive better insights and growth.