Finansal Veri Bilimci Nasıl Olunur?[1]

Abdullah Karasan
Datajarlabs
5 min readFeb 12, 2020

--

[1] Bu yazıda İngilizcesi ‘Financial Data Science’ olan kavramı Türkçe literatürde tam bir karşılığı olmadığı için ‘Finans temelli Veri Bilimi’ veya ‘Finansal Veri Bilimi‘ olarak kullanılacaktır.

Finans, yüzyıllık modelleme geleneğine sahip olan bir alandır ve sürekli olarak bu alanda yeni gelişmeler yaşanmaktadır. Bununla birlikte, halen, karmaşık olaylar ve işlemler nedeniyle finansal olayları ele almak kolay bir iş değildir. Dolayısıyla, finansal soruları çözmenin finansın kendisi kadar eski bir geçmişe dayandığını söylemek yanlış olmayabilir.

Doğal olarak, finans, verilere bağımlı bir alandır. Veriler ile birlikte oldukça eski istatistik ve matematiksel analiz geleneği birleşince, finansın veri biliminin ilk uygulayıcılarından biri olması kaçınılmaz olmuştur. Böylece, finans ve veri bilimi birlikte, “Finansal Veri Bilimi” (Financial Data Science) adlı yeni bir alan ortaya çıkarmış ve Finans alanındaki Veri Bilimi uygulamalarının şaşırtıcı yükselişi, “Uygulayıcıların Zaferi” olarak adlandırılmıştır.

Henüz olgunlaşmamış bir alan olarak, finans temelli veri biliminin tanımı konusunda henüz bir fikir birliği yoktur, ancak bu boşluğu doldurmaya yönelik bazı girişimler vardır. Brooks vd. (2019) finans temelli veri bilimini şu şekilde tanımlar:

“Ekonometri, ekonomi biliminde ölçümdür… [ve] finansal ekonometri [sonuç olarak] finansal tekniklerin finanstaki sorunlara uygulanması olarak tanımlanmaktadır” (Brooks 2002, 1). Ekonometri tanımı iyi belirlenmiş olsa da, ölçüm sürecini ve “model tabanlı istatistiksel çıkarsama”yı somutlaştırırken (Campbell, Lo ve MacKinlay 1997, 3), finansal veri biliminin resmi tanımı henüz ortaya çıkmamıştır. Finansal veri biliminin böylesine formal bir şekilde tanımlamakiçin, daha sonra iki alanın tamamlayıcı doğasını tartışmadan önce ekonometri ile karşılaştırıyoruz.”

Uzun lafın kısası, finansal veri bilimi temel olarak finansal konulara veri bilimi tekniklerini uygulamaktadır. Peki bu veri bilimi araçları nelerdir? Bunlar arasında veri temizleme, Makine Öğrenmesi ve Derin Öğrenme yer alır. Dolayısıyla, bu araçlarla finansal sorunların üstesinden gelebilirseniz, Finansal Veri Bilimcisi olarak adlandırılırsınız. Peki bu unvanı kazanmak kolay mı? Şimdi kısaca tartışalım.

Finansal Veri Biliminin Alan Bilgisi

Birinci sınıf bir finansal veri bilimcisi olabilmek için sahip olmanız gereken temel konular aşağıda sıralanmıştır: (Bunlar tüm konuları kapsamamaktadır)

• Finansal Piyasalar

• Risk Yönetimi

• Yatırım

• Sayısal Metodlar

• İstatistiksel çıkarım ve hipotez testi

• Lineer regresyon

• Oynaklık ölçümü

• Zaman serisi analizi

• Simülasyon metodları

• Değerleme

• Veri Temizleme

• Makine Öğrenimi Modelleri

• Derin Öğrenme Modelleri

• Programlama dilleri (tercihen Python ve SQL)

Bunun da ötesinde, orta seviyede lineer cebir bilgisi yukarıdaki konuların temelini oluşturduğu için hareket alanınızı genişletir ve sizi veri bilimi uygulamaları sırasında daha başarılı kılar. Kısaca, finans ve veri biliminin etkileşimi aşağıdaki grafik ile özetlenebilir:

Finans ile Veri Biliminin Etkileşimi

Finansal Veri Biliminin Uygulama Alanları

Bu bölümde finansal veri bilimi uygulama alanlarından bazılarına kısaca değinilmiştir:

• Kredi Tahsisi

• Risk yönetimi

• Sahtekarlık Önleme

• Müşteri segmentasyonu

  • Algoritmik Ticaret

Kredi Tahsisi

Büyük verilerle desteklenen Makine Öğrenimi algoritmaları, yeni faktörler ve müşteri davranışı arasındaki ilişkiyi ortaya çıkarabilir. Yani, büyük veri kümesi araştırmacının kredi tahsisini yeniden düşünmesini sağlayabilir.

Berg vd., (2018) beş basit dijital iz değişkeni ile (insanların sadece bir web sitesine erişerek veya kayıt yaparak çevrimiçi bıraktıkları bir bilgi izi), kimin krediyi geri ödeyeceğini tahmin etmede geleneksel kredi puanı modelinden daha iyi performans gösterebileceğini belirtmektedir. Dolayısıyla, bu bulgu sadece büyük verilerin önemini değil, aynı zamanda veri türlerinin çeşitliliğinin de önemini doğrulamaktadır.

Risk yönetimi

Artan düzenleme ve değişen tüketici beklentileriyle karşı karşıya kalan bankalar, sürekli artan riskleri daha iyi ölçmenin ve yönetmenin yollarını aramaktadır. Bu noktada, 2008 finansal krizi geleneksel risk araçlarının kullanımı için bir kırılma noktası teşkil etmekte ve bu durum da yeni tekniklerin daha fazla benimsenmesine yol açmıştır. Makine Öğrenimi buaraçlardan biridir.

Makine Öğrenimi uygulamaları risk yönetiminde ciddi dönüşüm sağlamaktadır. Yapılandırılmamış verilerin işlenmesi ve değerlendirilmesi gerektiğinde Makine Öğrenimi, risk yönetiminde başarılı sonuçlar verebilir. Finansal kurumların, risk yöneticilerinin, operasyonel süreçlerin doğasında var olan riskleri yönetmek için önemli bir zaman harcamak ve nispeten daha düşük performanslı yöntemler kullanmak yerine, yapay zekaya dayalı uygulamalar aracılığıyla hem performansı artırabileceği hem de zamandan tasarruf sağlayabileceği görülmüştür.

Sahtekarlık Önleme

Geleneksel sahtekarlık tespiti kural tabanlı modellemeye dayanmaktadır. Kural tabanlı modeller halen önemli olsa da, çok sayıda kuralın varlığı çok sayıda yanlış pozitif (false positive) üretme potansiyeli taşımaktadır. Örneğin, kural tabanlı modele dayanarak, banka yasal bir işlemi engelleyebilir ve bu durum hem işlem hem de bankanın itibarı açısından bir maliyet içermektedir.

Ayrıca, günümüz finansal dünyasında kısa sürede milyonlarca farklı işlemin gerçekleştiği kurala dayalı bir modele sahip olmak, potansiyel olarak hileli faaliyetlere ayak uyduramamak anlamına gelir.

Bununla birlikte, Makine Öğrenimi algoritmaları, dolandırıcılığı algılama olasılığını artıran çok çeşitli verileri işleme yeteneğine sahiptir. Dahası, hesaplama verimliliği (computational efficiency) ve etkinliği sayesinde Makine Öğrenimi modelleri, kural tabanlı uygulamanın gecikmeli reaksiyonunun aksine proaktif bir yaklaşım ortaya koyabilir.

Müşteri Segmentasyonu

Müşteri segmentasyonu ve bu segmentasyona dayalı reklam veya hizmet sağlanması, finans sektörünün önemli bir gündem maddesidir. Nedeni oldukça basit; insanların farklı tercihleri ​​ve ihtiyaçları bulunmakta, bunlara ayak uydurabilenler ise günümüzün yoğun rekabet ortamında öne çıkmaktadır. Bu nedenle, müşteri segmentasyonu oldukça önemlidir.

Doğru segmentasyonu uygulayabilmek için çeşitli kaynaklardan toplanan verilerden başka bir şeye ihtiyacımız bulunmamaktadır. Müşterilerin belirli verilerinin (müşterinin davranışı, yaşı, cinsiyeti, medeni durumu ve geliri gibi) toplanmasından sonra, uygun Makine Öğrenimi algoritması neye odaklanılması gerektiğini önerir. Bu verilere dayanarak, Makine Öğrenimi algoritmaları otomatik olarak istatistiksel modeller oluşturabilir. Bu modeller daha sonra hangi ürünün, kampanyanın veya işlemin hangi müşteriyi memnun edeceğini gösterir.

Algoritmik Ticaret

Algoritmik ticaret şu sorulara cevap vermeye çalışmaktadır: Nereye hangi fiyattan ve miktardan yatırım yapmalı? Örneğin bir şirketin 10 adet hissesini satın almayı düşünen bir yatırımcıyı ele alalım. Hisse senedinin 10 günlük hareketli ortalaması, işlem yapılan borsanın 10 günlük hareketli ortalamasının üzerine çıktığında bu şirkete yatırım yapılabilir. Çünkü, kısa vadede bu hisse senedinin getirisinin yönü yukarıdır. Tam tersini düşünelim: Yatırımcı, ilgili hisse senedinin 10 günlük hareketli ortalamasının, borsanın 10 günlük hareketli ortalamasının altına indiğinde, bu şirketin hisselerinin almaktan vazgeçer çünkü, ilgili şirketin getiri trendi burada aşağı yönlüdür.

Bu, algoritmik ticaretin basit bir ifade şeklidir. Bununla birlikte, yatırım seçeneklerini her saniye yeniden gözden geçiren yüksek frekanslı bir algoritması ile saatte 3.600 seçenek söz konusu olacaktır ki bu durum algroritmik ticaretin ta kendisidir.

Anlaşılabileceği gibi, kural tabanlı yaklaşımı algoritmik ticarette uygulamak oldukça zordur ve isabetsiz sonuçlar verme ihtimali yüksektir. Makine Öğrenimi uygulanmasıyla, elde edilen verilerle yatırım yapabilen, herhangi bir algoritmanın bu yatırım işlemlerinin arkasında olup olmadığını görebilen ve ardından piyasanın üzerinde getiri elde edebilen bazı algoritmalar geliştirilebilmektedir. Böylece, Makine Öğrenimi modelleri bir şekilde algoritmik ticaret yapmayı başarabilir. Bununla birlikte, klasik Makine Öğrenimi bazen gözlemleri modellemek için karmaşık ve şeffaf olmayan süreçler önermektedir.Karar verme sürecini iyileştirmek için algoritmik ticaret modeli oluşturmaktan ziyade karar verme sürecine odaklanan Pekiştirmeli (Reinforcement) Öğrenimi adlı yeni bir Makine Öğrenimi dalı kullanılmaya başlanmıştır.

Sonuç

Finans temelli veri bilimi hem veri bilimi hem de finansı birleştiren yeni bir alandır. Bu yazı aracılığıyla, hemveri bilimi hem de finans bilgisi olmayanlar için yeterli finansal veri bilimi bilgisine sahip olmanın uzun soluklu bir yol olacağınıdüşünebilirsiniz. Ancak, finans alanında uzmanlaştıysanız ve veri bilimini öğrenmeye karar verdiyseniz ya da veri bilimi alanında uzmanlaşıp finansal bilginizi arttırmaya karar verdiyseniz , elde edeceğiniz faydalar hesaba katıldığında bir Finansal Veri Bilimcisi olarak kariyerinizi değiştirmek için harcayacağınız sürenin çok da uzun olmadığı kanaatindeyim.

--

--

Abdullah Karasan
Datajarlabs

Data Science Consultant & Instructor at Datajarlabs & Thinkful