Bankacılıkta Veri Madenciliği

Hilal Tahtalı
Vakıf Katılım Ar-Ge Merkezi
8 min readJun 10, 2024

Veri madenciliği nedir?

Veri madenciliği, büyük veri kümelerini işlemek ve keşfetmek üzere analiz alanında kullanılan bilgisayar destekli bir tekniktir. Kuruluşlar, veri madenciliği araçları ve yöntemleriyle, verilerindeki gizli düzenleri ve ilişkileri keşfedebilir. Veri madenciliği, ham verileri pratik bilgilere dönüştürür. Şirketler bu bilgileri problem çözmek, iş kararlarının gelecekteki etkisini analiz etmek ve kâr marjlarını artırmak için kullanır.

Veri madenciliği teknikleri ve araçları, işletmelerin gelecekteki eğilimleri tahmin etmesini ve daha iyi iş kararları almasını sağlar.

Veri Madenciliği Neden Önemlidir?

Etkili veri madenciliği, iş stratejisi planlamasına ve operasyon yönetimine yardımcı olur. Buna pazarlama, reklam, satış ve müşteri desteği gibi müşteriye dönük işlevlerin yanı sıra üretim, tedarik zinciri yönetimi, finans ve İK da dahildir. Veri madenciliği dolandırıcılık tespiti, risk yönetimi, siber güvenlik planlaması ve diğer birçok kritik iş kullanım durumunu destekler. Ayrıca sağlık, hükümet, bilimsel araştırma, matematik, spor vb. alanlarda da önemli bir rol oynar.

Bankacılıkta Veri Madenciliği Kullanım Alanları

Genel bir ifadeyle internet bankacılığı, şubelerde yapılan bankacılık işlemlerinin, internete taşınması olarak tanımlanabilir. İnternet bankacılığı zaman ve yer sınırlaması olmaksızın internet erişimine sahip herhangi bir bilgisayar aracılığıyla dünyanın her yerinde kullanılabilen, bankacılık hizmetlerinin sunulması için hazırlanan alternatif dağıtım kanalıdır.

Bankacılık sektöründe veri madenciliği yoğunlukla kredi sahtekârlıkları tespiti, kredi risklerini değerlendirme, karlılık analizi, trend analizi ve müşteri yönetimi için direkt pazarlama kampanyalarında kullanılmaktadır. Finansal pazarlarda ise portföy yönetimi, varlık fiyatlarının ve hatta finansal krizlerin tahminlenmesi gibi durumlarda karşımıza çıkar.

Kredi geri ödemelerinin tahminleri ve müşteri kredilerinin analizi bir banka için önemli bir konudur. Tahminleme yöntemleri ile kişinin hangi olasılıkla temerrüde düşüp düşmeyeceği veya kredi talep edenlerin kredi verilmeye uygun olup olmadığı araştırılmakta, bunun sonucunda müşteriye özel stratejiler belirlenebilmektedir. Müşteri yönetimi için müşteriler belirli özelliklerine göre kümelenerek ve her bir grup için ayrı öneri oluşturularak pazarlama yapılabilmektedir.

Veri madenciliği sürecinin altı aşaması nedir?

1. İş anlayışı

Veri bilimci veya madencisi, proje hedeflerini ve kapsamını belirleyerek işe başlar. Belirli bilgileri tanımlamak için iş paydaşlarıyla işbirliği yaparlar.

· Ele alınması gereken sorunlar

· Proje kısıtlamaları veya sınırlamaları

· Potansiyel çözümlerin iş üzerindeki etkisi

Daha sonra bu bilgileri veri madenciliği hedeflerini tanımlamak ve bilgi keşfi için gerekli kaynakları belirlemek amacıyla kullanırlar.

2. Veri anlama

Veri bilimciler, iş sorununu anladıktan sonra verilerin ön analizine başlarlar. Çeşitli kaynaklardan veri setleri toplar, erişim haklarını elde eder ve bir veri tanımlama raporu hazırlarlar. Raporda veri türleri, miktarı ve veri işleme için donanım ve yazılım gereksinimleri bulunur. İşletme planlarını onayladıktan sonra, verileri keşfetmeye ve doğrulamaya başlarlar. Temel istatistiksel teknikleri kullanarak verileri yönlendirir, veri kalitesini değerlendirir ve bir sonraki aşama için nihai bir veri seti seçerler.

3. Veri hazırlama

Veri madencileri en fazla zamanı bu aşamada harcarlar çünkü veri madenciliği yazılımı yüksek kaliteli veri gerektirir. İş süreçleri, madencilik dışındaki nedenlerle veri toplayıp depolar ve veri madencileri bu verileri modelleme için kullanmadan önce rafine etmelidir. Veri hazırlama aşağıdaki süreçleri içerir.

Verileri temizleme

Örneğin, eksik verileri, veri hatalarını, varsayılan değerleri ve veri düzeltmelerini ele alma.

Verileri entegre etme

Örneğin, nihai hedef veri setini elde etmeye yönelik iki farklı veri setini birleştirme.

Verileri biçimlendirme

Örneğin, veri türlerini dönüştürme veya kullanılan belirli madencilik teknolojisine yönelik veri yapılandırma.

4. Veri modelleme

Veri madencileri, hazırlanan verileri veri madenciliği yazılımına girer ve sonuçları inceler. Bunu yaparken birden fazla veri madenciliği tekniği ve aracı arasından seçim yapabilirler. Ayrıca veri madenciliği sonuçlarının kalitesini değerlendirmek için testler hazırlamaları gerekir. Veri modellemek için veri bilimciler şunları yapabilir:

· Makine öğrenimi (ML) modellerini bilinen sonuçlara sahip daha küçük veri setleri üzerinde eğitmek

· Bilinmeyen veri setlerini daha fazla analiz etme modelini kullanmak

· Sonuçlar tatmin edici olana kadar veri madenciliği yazılımını ayarlamak ve yeniden yapılandırmak

5. Değerlendirme

Veri madencileri, modelleri oluşturduktan sonra verileri orijinal iş hedeflerine göre ölçmeye başlar. Sonuçları iş analistleriyle paylaşıp geri bildirim toplarlar. Model, orijinal soruya iyi yanıt verebilir veya yeni ve daha önce bilinmeyen modeller gösterebilir. Veri madencileri, iş dünyasından gelen geri bildirimlere bağlı olarak modeli değiştirebilir, iş hedefini ayarlayabilir veya verileri tekrar inceleyebilir. Sürekli değerlendirme, geri bildirim ve değişiklik bilgi keşfi sürecinin bir parçasıdır.

6. Dağıtım

Diğer paydaşlar, dağıtım sırasında iş zekası üretmek için çalışma modelini kullanır. Veri bilimcisi, diğerlerine model işlevlerini öğretmeyi, veri madenciliği uygulamasını sürekli olarak izlemeyi ve çalışmasını sağlamayı içeren dağıtım sürecini planlar. İş analistleri bu uygulamayı; yönetim raporları oluşturmak, sonuçları müşterilerle paylaşmak ve iş süreçlerini iyileştirmek için kullanır.

Veri Madenciliği Modelleri (Data Mining Models)

Veri madenciliğinde kullanılan modeler Tahmin Edici ve Tanımlayıcı olmak üzere ikiye ayrılmaktadır.
Tahmin Edici Modeller (Predictive):
Sonuçları bilinen verilerden hareket ederek bir model oluşturup, sonuçları bilinmeyen veri kümeleri için sonuç değerlerinin tahmin edilmesidir.
— Sınıflama
— Regresyon
— Zaman Serisi Analizi
Tanımlayıcı Modeller (Descriptive): Karar vermeye rehberlik etmede kullanılabilecek verilerdeki örüntülerin tanımlanmasını sağlamaktadır.
— Kümeleme Yöntemi
— Birliktelik Kuralı

Veri Madenciliği Teknikleri

Birliktelik Kuralı Madenciliği

Birliktelik kuralı madenciliği, görünüşte ilgisiz iki farklı veri kümesi arasındaki ilişkileri bulma sürecidir. Örneğin, müşteriler bir ürünü satın aldıklarında genellikle ilgili ikinci bir ürünü de satın alır. Perakendeciler, yeni bir müşterinin ilgisini belirlemek için geçmiş satın alma verileri üzerinde ilişkilendirme madenciliğini kullanabilir. Çevrimiçi mağazaların önerilen bölümlerini doldurmak için veri madenciliği sonuçlarını kullanırlar.

Sınıflandırma

Sınıflandırma, verileri farklı kategorilere ayırmada makine öğrenimi algoritmasını eğiten karmaşık bir veri madenciliği tekniğidir. Kategoriyi belirlemeye yönelik karar ağaçları ve en yakın komşu gibi istatistiksel yöntemler kullanır. Tüm bu yöntemlerde algoritma, yeni bir veri ögesinin türünü tahmin etmek üzere bilinen veri sınıflandırmalarıyla önceden programlanır.

Örneğin, analistler elma ve mangoların etiketli görüntülerini kullanarak veri madenciliği yazılımını eğitebilir. Yazılım daha sonra yeni bir resmin elma mı, mango mu yoksa başka bir meyve mi olduğunu belli bir doğrulukla tahmin edebilir.

Kümeleme

Kümeleme, birden fazla veri noktasını benzerliklerine göre birlikte gruplandırmaktır. Sınıflandırmadan farklıdır çünkü verileri belirli bir kategoriye göre ayıramaz ancak benzerliklerindeki örüntüleri bulabilir. Veri madenciliği sonucu, her koleksiyonun diğer gruplardan farklı olduğu, ancak her kümedeki nesnelerin bir şekilde benzer olduğu bir küme setidir.

Örneğin, anketlerden elde edilen çok değişkenli verilerle çalışırken küme analizi pazar araştırmasına yardımcı olabilir. Pazar araştırmacıları, tüketicileri pazar bölmelerine ayırmak ve farklı gruplar arasındaki ilişkileri daha iyi anlamak adına küme analizini kullanır.

Sıra ve yol analizi

Veri madenciliği yazılımı, belirli bir olay veya değer kümesinin kendisinden sonra gelecek olay veya değer kümelerine yol açtığı kalıpları da arayabilir. Düzenli aralıklarla gerçekleşen verilerdeki bazı değişimleri veya zaman içinde veri noktalarının gelgitlerini tanıyabilir.

Örneğin bir işletme, belirli ürün satışlarının tatillerden hemen önce arttığını görmek veya daha sıcak havalar nedeniyle web sitesini daha fazla kişinin ziyaret ettiğini görmek istediğinde yol analizini kullanabilir.

İnternet Bankacılığı Kullanan Banka Müşterileri İçin Veri Madenciliği Süreci

Aşağıda veri madenciliği ile ilgili yapılan bir çalışmaya yer verilmiştir.

Araştırma kapsamında 14.02.2013 -14.04.2013 tarihleri arasında, 5 ilden seçilen, internet bankacılığı kullanan ve kullanmayan, 18 yaş ve üzeri 1500 bireye anket soruları e-mail ve yüz yüze görüşme yoluyla iletilmiş ve cevaplamaları istenmiştir. Çalışmada Türkiye çapındaki bütün banka müşterilerine anketin uygulanması zaman ve maliyet kısıtları açısından mümkün olmamıştır. Bu nedenle araştırma Türkiye’nin 5 ilinde (İstanbul, Ankara, İzmir, Bursa ve Eskişehir) uygulanmıştır. Bu seçimde Türkiye’nin 5 ilinde internet bankacılığı kullanımının yaygın olması, homojen olmayan demografik ve sosyo-kültürel yapı da etkili olmuştur. Kümeleme Analizi kullanılarak yapılan çalışma sonucunda aşağıdaki dağılımlar elde edilmiştir.

İnternet bankacılığı kullanan banka müşterilerinin:

· %56.14’ü erkek ve %43.86’sı kadındır. İnternet bankacılığı kullanan kadın ve erkek banka müşterilerinin dağılımlarının birbirine yakın olduğu görülmektedir.

· %53.07’si Evli ve %46.93’ü Bekardır. Hem evli hem bekar banka müşterilerinin internet bankacılığını aktif olarak kullandıkları görülmektedir.

· %37.33’ü 26–35 yaşları arasında,%24.95’i 36–45 yaşları arasında; %20.89’u 18–25 yaşları arasında, %14.65’i 46–55 yaşları arasında, %2.18’i ise 56 yaş ve üzeri yaşa sahiptir. İnternet bankacılığı kullanan banka müşterilerinin yaşlarına göre internet bankacılığı kullanımları farklılaşmaktadır. 56 yaş ve üzeri banka müşterilerinin internet bankacılığını çok fazla tercih etmediği, 26- 35 yaş grubu banka müşterilerinin ağırlıklı olarak internet bankacılığı kullandıkları görülmektedir.

· %56.93’ü üniversite, %23.66’sı lise, %14.85’i yüksek lisans ve üzeri, %3.86’sı ortaokul mezunu, %0.69’u ilkokul mezunudur. İnternet bankacılığı kullanan banka müşterilerinin eğitim düzeylerine göre internet bankacılığı kullanımları farklılaşmaktadır. Özellikle üniversite ve lise mezunlarının daha fazla internet bankacılığını tercih ettikleri görülmektedir.

· %46.93’ü 1501- 2500 TL gelire, %26.63’ü 2500 TL ve üzeri gelire sahiptir. Banka müşterilerinin %23.96’sı 751–1500 TL arasında gelire, %2.48’i ise 750 TL„den az gelire sahiptir. Gelir düzeyi düşük olan banka müşterilerinin internet bankacılığı kullanımın daha az olduğu görülmektedir.

· %9.9’unun hizmet, %9.21’inin finans, %8.12’sinin tekstil, %8.12’sinin öğrenci olduğu, %7.92’sinin sağlık, %7.43’ünün eğitim, %7.13’ünün gıda, %6.63’ünün perakende, %5.35’inin bilişim, %5.25’nin otomotiv, %4.75’inin inşaat, %4.75’inin turizm, %4.55’inin akademik, %4.55’inin kimya, %2.48’inin lojistik, %2.48’inin temizlik sektöründe çalıştığı, %1.09’unun emekli olduğu görülmüş, %0,3’ü ise çalışmadığını ifade etmiştir. Dağılımlar incelendiğinde; sektör bakımından hemen hemen her sektördeki banka müşterilerinin internet bankacılığı kullanmakta olduğu görülmektedir.

· %38.61’inin 10–14 yıldır internet kullandığını, %30’unun 5–9 yıl, %23.66’sının 15 yıl ve üzeri, %7.23’ünün 1–4 yıl, %0.5’inin ise 1 yıldan az süredir internet kullandığı belirlenmiştir. Katılımcıların %60’ından fazlası uzun süredir internet kullanmaktadır.

· %47.13’ünün 1–4 yıldır internet bankacılığını kullandığı, %30.4’ünün 5–9 yıl, %12.08’inin 1 yıldan az, %10.4’ünün ise 10 yıldan uzun süredir internet bankacılığını kullandığı belirlenmiştir.

· %42.87’sinin haftada bir kez internete bağlandıkları, %25.74’ünün haftada birkaç kez, %25.54’ünün ayda bir kez, %5.84’ünün ise günde birkaç kez internete bağlandığı belirlenmiştir. Bu durum; internet bankacılığı kullanan banka müşterilerinin; ağırlıklı olarak haftada bir kez internete bağlandıklarını göstermektedir. İnternet bankacılığını kullanan banka müşterilerinin internet bankacılığı erişim noktalarına ilişkin verdikleri cevaplar incelendiğinde şu sonuçlara ulaşılmıştır: Banka müşterilerinin %33.8’inin kişisel PC/ tablet PC aracılığıyla internet bankacılığına bağlandıkları, %19.1’inin işyerindeki PC‟lerden, %18.8’inin ise cep telefonundan internet bankacılığına bağlanmayı tercih ettiği belirlenmiştir. İnternet bankacılığı kullanan banka müşterilerinin %46.83’ü 2 adet internet bankacılığı hesabı olduğunu belirtmiştir. İnternet bankacılığını kullanan banka müşterilerinin %32.57’si 1 adet; %15.84’ü 3 adet, %4.75’i ise 4 ve üzeri internet bankacılığı hesabına sahiptir.

SONUÇ

Banka müşterileri rekabet ortamında çeşitli ürünleri, daha iyi servis ve daha uygun fırsatlarla kullanmak istemektedir. Bu durum sonucunda, bankaların pazarlama tekniklerini geliştirmeleri ve müşteriye farklı alternatifler sunmaları gerekmektedir. Sepet analizi ve kümeleme analizi sonucunda elde edilen sonuçlar, reklam stratejileri belirlemede, CRM, müşteri profillerinin analiz edilerek çapraz satış tahminlerinin yapılması, yeni müşterilere ulaşabilmek için etkili faktörlerin belirlenmesi, hedef pazarın belirlenmesi, müşteri değerleme, müşteri segmentasyonu ve müşteri ilişkileri yönetimi için kullanılabilir. Elde edilen kümelerle hangi müşteri gruplarının hedeflenmesi gerektiği belirlenmiştir. Bu sonuçlar reklam kampanyalarında kullanılabilecektir. Sonuç olarak bankaların sektörde rekabet avantajı sağlayarak uzun süre ayakta kalabilmeleri için müşterilerini doğru bir şekilde tanımaları ve doğru analizler yapmaları gerekmektedir.

KAYNAK

Mehmed Kantardzic, Data Mining Concepts Models Methods and Algorithms, NJ, WileyInterscience 2003, s. 344

BİLGİN, Ş. (2013), Banka Müşterilerinin İnternet Bankacılığına İlişkin Yaklaşımlarının Veri Madenciliği Teknikleri İle İncelenmesi, Yüksek Lisans Tezi, Ġstanbul Üniversitesi Sosyal Bilimler Enstitüsü, Sayısal Yöntemler Anabilim Dalı.

DAĞLI, R.M. (2007), Banka Müşterilerinin İnternet Bankacılığına İlişkin Kanaatlerinin İncelenmesi ve Konu İle İlgili Pilot Bir Araştırma, Yüksek Lisans Tezi, İstanbul Üniversitesi Sosyal Bilimler Enstitüsü, Pazarlama Anabilim Dalı.

ERCİŞLİ, N. (2007), İnternet Bankacılığı Uygulamaları ve İşletme Performansı Üzerine Etkileri: Denizbank Örnek Olay Çalışması, Yüksek Lisans Tezi, Selçuk Üniversitesi Sosyal Bilimler Enstitüsü, Üretim Yönetimi Anabilim Dalı, Konya.

--

--