MAKİNE ÖĞRENMESİ-FRAUD ETKİLEŞİMİ: NEDİR?

Published in

Finartz

6 min readJun 26, 2018

Parasız toplumların hikayesi; Paranın elektronik aygıtlar üzerinde depolanıp işlenmesi ile başlamaktadır[1].

Paranın ve toplumsal alışkanlıkların sayısal sistemlere doğru evrilmesi toplumlara büyük faydalar sağlamakta hem de bir kültür olarak yerleşmektedir. Bu sistemler klasik ödeme sistemlerine göre daha hızlı ve güvenli yöntemler sunduğu için faydalı olduğunu söylemekten çekinmeyiz[14]. Bunun yanında 21. yüzyıldan itibaren ivmesini arttıran teknolojik gelişmeler ve bu teknolojik gelişmelerle beraber büyüyen neslin etkisi ile sanal cüzdan, sanal pazar[2] gibi ödeme ürünlerinin hızlı bir şekilde benimsenmesini sağlamıştır.

Kuşkusuz bu gelişmelerle beraber fiziksel dünyada ödeme öncesinde, sırasında, sonrasında görülen doğrulama, tanımlama gibi problemler dijital dünyada da ortaya çıkmaktadır.

Bu tür problemlerin başında “Fraud detection” olarak literatürde geçen, herhangi bir ödeme işleminin geçerliliğini sorgulayan çalışmalar, ürünler bulunmaktadır. Büyük bir sabır göstererek okumaya devam ettiğiniz bu yazımızda Fraud sistemlerinin üzerinde çalıştığı makine öğrenmesi modellerini inceleyip, bu konuda karşılaşılan temel zorluklardan bahsedeceğiz.

GİRİŞ

Finansal bir deneyimden gelen ve veri işleme, hesaplama teknolojilerini merkezine alan bu ekol ya da daha bilindik ismiyle “Fintech” ürünleri, sağladığı kolaylıkların yanında birçok problemi de çözebilme yeteneğine sahip olmalıdır.

Örnek vermek gerekirse üretilen sanal cüzdan uygulamaları, kullanıcıların üzerinde bakiye veya kredi tutan, harcanabilir özellikteki fiziksel kartları saklayabilme özelliğine sahiptir. Bunun yanında internet üzerinden iletişime geçebilen herhangi bir mobil cihaz ile de bu kartı kullanabilir, istediği yerde ve istediği zamanda para harcayabilir, transfer yapabilir. İşlemlerimizde en az efor ile kısa sürede gerçekleştirebilen bu ürünler büyük bir kolaylığa sebep olduğu gibi saklanan bu kartı güvenli bir şekilde kullanabilme veya kartla yapılan işlemleri geçerli kılabilmesi gibi sorunları da çözmesi beklenmektedir.

Bu sorunlardan en kritik olanlardan biri de şüphesiz kartla yapılmış bir işlemin sahte olup olmadığının sorgulamasıdır. Yani “Fraud” işlemlerin tespitidir.

Bu işin doğası gereği bilindik kurallar üzerinde tam olarak çalışmadığı için güncelliğini her zaman koruyacak bir konu olacaktır. Çünkü burada yapılan iş, kullanıcının sistemi kandırmaya yönelik yaptığı davranışların tespit edilmesi ve olası finansal kayıpların engellenmesidir. Bu davranışlar da gerçek zekanın bir üretimidir.

Resim “Person of Interest” isimli bir diziden alıntıdır. Yapay Zeka konusunu işleyen son zamanların en kaliteli dizi serisidir.

Fraud tespit ürünlerinin geliştirilmesindeki nihai motivasyon, makinelere -ödeme alanında- bu gerçek zeka ile yarışabilecek sistemlerin geliştirmesidir.

KISA KISA FRAUD

Ödeme dünyasında fraud işlemler, bilgisayar sistemlerinin yanında uzmanlık gerektiren kişiler tarafından el yordamıyla, tecrübelerle tespit edilmektedir.

Literatürde fiziksel(Card Present Fraud) ve sanal(Card Not Present Fraud) olarak iki farklı tipte karşımıza çıkmaktadır[3].

Fiziksel dünyadaki fraud durumlarının birçoğu kayıp-çalıntı kartlar üzerinden şifresiz işlemlerde meydana gelmektedir. Bu işlemleri tespit etmek için gereken süre, kullanıcının işlem karşılığında ürünü aldığı zamana kadardır. İşlem şifresiz gerçekleştiği için pos cihazı bu kartın gerçekten ürünü satın alacak kişiye ait olup olmadığını doğrulayacak bir bilgiye sahip değildir. Bu sebeple kişiden bağımsız işlemi doğrulayacaktır. Fiziksel dünyada sonuç olarak kart sahibi bankalar artık kartlarında fiziksel terminallerde yapılan işlemlerde şifre girilmesini zorunlu kılmaktadır.

Fraud işleminin sanal ortamda fiziksel ortamdan daha yüksek bir olasılıkta gerçekleşmesi mümkün. Aidiyeti sorgulamak adına bankalar, “3D Secure” gibi güvenli ödeme mekanizmalarını geliştirmiştir. Hepimizin bildiği gibi doğrulama işlemi burada üç farklı alandan alınan veri bilgisi ile gerçekleşmektedir. Bu alanların herhangi birinde oluşan hata veya bilgilerdeki tutarsızlık kart doğrulama işlemini sonlandıracaktır.

Kart doğrulama işlemi maalesef işlem hareketinin doğruluğunu sorgulamak için yeterli olmamaktadır. Bunun yanında kullanıcının sistem üzerinde oluşturduğu işlem hareketindeki bilgiler, bu hareketin fraud olup olmadığına dair minik ipuçları verebilmektedir. Makine Öğrenmesi sayesinde bu bilgiler kullanılarak bir işlemin fraud sorgulamasını davranışsal olarak tespit edilmektedir.

KISA KISA MAKİNE ÖĞRENMESİ

Makine öğrenmesi; Bir makinenin istatistik ve olasılığı kullanarak kendi kendine karar verebilmesini ve evrilmesini sağlayan bir bilgisayar bilimleri disiplinidir.

Bir makine öğrenmesi modeli, matematiksel altyapısı sayesinde çıktılarını optimize edebilecek yeteneğe sahiptir. Bu optimizasyon yeteneği sayesinde insan zekasının yeterliliğiyle sağlanacak iyileştirmeleri, kendi kendine yapabilecek kapasitededir. Buradaki optimizasyon yeteneğini makine öğrenmesi modelleri iki farklı şekilde oluşturmaktadır. Makine öğrenmesi modelleri, eğitimli(supervised) ve eğitimsiz(unsupervised) olarak iki farklı şekilde oluşturulmaktadır.

İlk resimde iki farklı sınıf söz konusu. “Boundary” denilen kısım ilgili verinin hangi sınıfa ait olduğuna karar vermek için modelin eğitim verilerinin ışığında hesapladığı eşik değerler topluluğu. Fakat sağdaki figürde herhangi bir eğitim verisi kullanılmamıştır. Model, sınıfları ve eşik değerini kendisi belirlemiştir.

Eğitimli, sisteme daha önceden edinmiş tecrübelerin sisteme verilmesiyle oluşturulmaktadır. Geçmiş tecrübelerin bir daha yaşanmaması için bu tipi destekleyen modeller kullanılmaktadır. Eğitimsiz ise sistemde daha önceden tecrübe edilmemiş ama model gereği olası fraud durumlarını algılamaktadır.

“FRAUD” TESPİTİNDE KARŞILAŞILAN TEMEL PROBLEMLER

Finansal veriler, makine öğrenmesi modelleriyle işlenmeye başladığı vakit istediğimiz kalitedeki sonuçları kolay kolay alamayacağiz.

Bu konuda çalışırken çeşitli çalışmalarda[4][5] bahsedilmiş temel problemlerle karşılaşmamız kaçınılmaz olacaktır.

Sınırlı Veri Seti

Makine öğrenmesi problemlerinde çalışmaları kolaylaştıran, kalitesini arttıran büyük bir etken konu hakkındaki veri setlerinin sayısı ve kalitesidir. Çalışılan alan ödeme olunca diğer makine öğrenmesi problemleri gibi bu alanda erişilebilir nicelikte ve nitelikte veri bulmak zorlaşıyor. Bu konu hakkında Kaggle bünyesinde dağıtıma açık ve çalışmalarda çokça kullanılan bir veri seti[6][8] bulunmaktadır.

Özellik Seçimi

Bu problem “Fraud detection” dışında genel bir makine öğrenmesi problemidir. Üzerinde çıkarım yapılacak veride hangi özelliklerin belirleyici unsur olacağının tespitidir. Ödeme dünyasında örnek vermek gerekirse elimizdeki işlem verisinde IP bilgisi ayırt ediciliği yüksek özellikk olabilrken, kart spesifik bir veri olan şema bilgisi “fraud” için ayırt edici olmayabilir. Fraud tespit aracı yapılırken özellik seçimi üzerine de çalışan akademik çözümler mevcuttur.

Sonucun Örtüşmesi

Sistem, modele göre geçerli olabiliecek bir işlemi “fraud” olarak işaretlemesidir. Terminolojide “False-Positive” olarak geçen bu verilerin modeli optimize ederek gerçekte olması gerektiği gibi modelin tanıması sağlanmalıdır. Bu durumlarda ikinci bir kontrol mekanizmasının sağlanması söz konusu olmaktadır. Yaygın çözüm, konuda uzmanlaşmış kişiler bu verileri inceleyerek duruma müdahale etmesidir.

Davranışsal Yenilikler

En kritik problem olarak bahsedilebilir. Güvenlik dünyasında tıpkı istismarcıların(hacker) gelişen güvenlik sistemlerine karşı yeni açıklar bulması gibi fraud tarafında da gün geçtikçe gelişen tespit sistemlerini alt etmeye yönelik yeni fraud hareketleri ortaya çıkmaktadır. Bu tür durumlarda makine öğrenmesinin bir alt konusu olan “anomaly detection” modelleri[9][10] bu tarz problemlere karşı çözüm üretebilir. “Anomaly detection” un temel motivasyonu, kullanıcının mevcut hareketini inceleyip bunun dışında oluşacak hareketleri fraud olarak algılamasıdır.

Verinin Büyüklüğü

Büyük Veri kavramıyla beraber anıldığı gibi son zamanlarda işlenen verinin hacminde artış söz konusudur. Kayıtlara ait özelliklerin büyümesi mevcut makine öğrenmesi modellerinin başarımını etkileyecektir. Fakat birkaç yöntem ile bu problemin üstesinden gelebiliriz. İstatistiksel bir notasyon olan ve sıkça veri madenciliği, makine öğrenmesi uygulamalarında kullanılan “özellik indirgemesi(feature reduction)”[12] yöntemleriyle verinin boyutuyla baş edebilirken yine son zamanlarda popüler olan Derin Öğrenme(Deep Learning)[6][11] tabanlı modeller büyük boyutlu verilerde başarılı sonuçlar üretebilmektedir. Ayrıca bu modellerin insan sinir sistemini baz alarak oluşturduğu için çalışma mekaniği, normal makine öğrenmesi modellerine göre daha başarılı sonuçlar üretebilmektedir. Derin öğrenme modellerinin en büyük maliyeti yüksek işlem gücü gerektiren bilgisayarlarda çalışmasıdır.

SONUÇ

Fraud tespiti güncelliğini koruyacak bir konu olup kurumlar açısından büyük meblağları engelleyen araçlardır. Ayrıca parasız toplumlarda geliştirilen yeni fintech ürünlerinin daha kolay benimsenmesi için gerekli görüldüğünü söyleyebiliriz.

Şirketlerde bu işi yapan birimler olduğunu düşündüğümüzde, bir yazılım üzerine kurgulayıp, otomatize etmek hiç düşünüldüğü gibi kolay olmayacaktır. Bahsetmiş olduğumuz bu zorluklar üzerinde yeni çalışmalar gerçekleştirilmesi daha kaliteli fraud tespit ürünlerini ortaya çıkartacaktır.

Özel olarak fraud birimlerinin en sık karşılaştığı durumları algılayan ve hatta müdahale eden sistemlerin kurulması, daha sonrasında bunların üzerine eğitim verileriyle yeni davranışların tanıtılmasına olanak kılan modellerin kurgulanması ihtiyaçtır. Son olarak ödeme dünyasında radikal bir değişim olan 3D Secure 2.0 protokolünde risk modülünün gelmesi[13] Fraud detection yazılımlarının da gelecekte daha önem kazanacağı aşikar durmaktadır.

Yasin Fırat PAYALAN/Finartz Software Engineer

REFERANSLAR

[1]The Cost of Cash in United States
[2]UK Moves Towards Cashless Society
[3]APATE: A Novel Approach for Automated Credit Card Transaction Fraud
Detection using Network-Based Extensions
[4]A Survey of Credit Card Fraud Detection Techniques: Data and Technique Oriented Perspective
[5]Application of Credit Card Fraud Detection: Based on Bagging Ensemble Classifier
[6]Credit Card Fraud Detection using Deep Learning based on Auto-Encoder and Restricted Boltzmann Machine
[8]Credit Card Fraud Detection Through Logistic Regression, K-Means, and Deep Learning
[9]Credit Card Fraud Detection Using Autoencoders in Keras-Tensorflow for Hackers Part VII
[10]Analysis on Credit Card Fraud Identification Techniques based on KNN and Outlier Detection
[11]ConvNets for Fraud Detection analysis
[12] A Fraud Detection Model Based on Feature Selection and Undersampling Applied to Web Payment Systems
[13]3D Secure 2.0-What the Protocol Means for Merchants ?
[14]The Evolution of Fintech