Hvor mange har ikke inngått et abonnement, bare for innse at det etter kort tid gir deg dårlig økonomi og samvittighet? Selv den mest viljesterke har vel inngått et treningsabonnement i januar for så å bli et passivt støttemedlem, som sørger for at de få som holder ut gjennom året, opplever blanke speil, skinnende vekter og dundrende musikk. Dette er historien om hvordan vi i SpareBank 1 bruker maskinlæring for å hjelpe kundene våre til å få oversikt over abonnementene sine.

Men la oss starte fra begynnelsen. I SpareBank 1 bruker vi maskinlæring for å klassifisere banktransaksjoner. Vi ser på om du f.eks har vært i matbutikken, eller om du har vært på kafé. Tanken er at du med et filter kan få oversikt over hvor mye du bruker på f.eks mat i måneden, eller hvor mye du bruker på moro og fjas. Det vi derimot manglet, var et filter for faste utgifter og abonnement. Mange kunder har større nytte av å kunne kategorisere hva som er faste utgifter og ikke, eller rett og slett få oversikt over hvilke abonnement en har. I tillegg inngikk vi en avtale med en tredjepartsleverandør om abonnementshåndtering. Denne tredjeparten tilbyr kansellering av abonnement og endring av abonnement (f.eks …

Når man starter et maskinlæringsprosjekt er det veldig fristende å gå rett på de forskjellige maskinlæringsalgoritmene. I et forsøk på å profesjonalisere maskinlæringsutviklingsprosessen gjør vi nå alltid en analyse av dataene vi har før vi begynner på algoritmene. Enkle kalkuleringer og plotting kan gi et godt innblikk i hva dataene inneholder som gjør jobben enklere og fremtidige diskusjoner mer relevante.

I dette eksempelet skal vi klassifisere transaksjoner i ulike grupper som mat, bolig osv. Som grunnlag har vi hatt i overkant av 8 millioner anonymiserte transaksjoner. Vi har sett nærmere på feltene alder, nasjonalitet, transaksjonsbeløp og transaksjonstekst.

Alder:

Alder er et numerisk felt som går fra 0 til 115 noe som er ganske interessant siden Norges eldste noensinne er 112 år. Et minimum for numeriske data bør være gjennomsnitt og median, og helst også mode(det mest brukte tallet). Her var median og gjennomsnittsalder ganske like, noe som sier oss at det er ganske jevnt fordelt; det er ingen store verdier som trekker veldig opp. Dette er som forventet på alder der veldig store verdier naturlig nok er svært sjeldne.

About

Inge Johnsen

Machine learning enthusiast @SpareBank1

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store