I tuoi clienti hanno il portafoglio giusto? Fattelo dire dai dati

Raffaele Zenti
Qwafafew-Italy
Published in
6 min readOct 31, 2017

--

Data Science e wealth management: meno chiacchere, più pratica

Le chiacchere su Data Science, Machine Learning, Big Data — per non parlare d’Intelligenza Artificiale — si sprecano, nel mondo del wealth management. Molta è fuffa allo stato cristallino (come la materia oscura nell’universo, la fuffa è assai comune), dato che la tipica azienda di wealth management italiana/europea è sì immersa nei dati — di mercato, legati ai clienti — ma sa nuotare a malapena a cagnolino.

E allora passiamo al lato concreto. Vediamo qualche applicazione reale: roba semplice ma utile. Giusto per avere il senso di ciò che si può fare. Demistifichiamo e mastichiamo (dati). Iniziamo con una robetta di Machine Learning non-supervisionato, un caso concreto che parte, com’è giusto che sia, da una domanda di business.

Domanda di business: i clienti hanno un portafoglio coerente con il loro orizzonte temporale?

Inquadriamo innanzitutto il caso. Si sa, gli italiani hanno in media una dose di liquidità senza senso. Dal 2014 al 2017, mentre Borse e obbligazioni vivevano uno dei più solidi trend rialzisti della storia, gli italiani hanno astutamente ridotto il peso azionario e obbligazionario in portafoglio, aumentando quello della liquidità — dal 43% del 2014 al 62% del 2017 (fonte dati: Consob “Le scelte di investimento delle famiglie italiane” e “Investor Pulse 2017”, BlackRock).

Ora mettiamoci nei panni di un’azienda che si occupa di wealth management. Immedesimiamoci integralmente nell’azienda — un’unica entità che si muove secondo logiche di mercato (anche se di solito le grandi organizzazioni si muovono come se fossero individui sociopatici con gravi disturbi dissociativi). Come azienda di wealth management è ragionevole chiedersi: ho clienti la cui allocazione di portafoglio non è allineata al loro naturale orizzonte d’investimento?

Questa semplice domanda ha enormi implicazioni di business: in caso di disallineamento tra orizzonti temporali, significa che il cliente non è servito come si dovrebbe, o potrebbe. Ciò implica che il cliente potrebbe non essere soddisfatto. O che gli potrei offrire differenti prodotti e servizi. Sui quali magari ho margini migliori. E, last but not least, che potrei passare anche guai di natura regolamentare (dato che, in sostanza, MIFID e IDD spingono affinché ogni cliente abbia il portafoglio per lui più consono).

I dati ci danno una mano

Per rispondere alla domanda e capire la situazione partiamo dai dati (ndr: anonimi, proprietari). In concreto, confrontiamo:

  • l’orizzonte temporale dei clienti (derivato dalle risposte al questionario di profilazione MIFID, dai dato socio-demografici gentilmente lasciati da ciascun cliente, nonché dalle informazioni graziosamente disseminate nel web e sui social), che chiamiamo H1;
  • l’orizzonte temporale dei loro portafogli (esplicito nel caso di obbligazioni e polizze vita, o implicito, nel caso dei fondi comuni ed ETF), che denominiamo H2.

Ci troviamo di fronte a una situazione di questo genere.

Palesemente, in questo stormo di puntini c’è qualcosa di strano: troppi clienti che investono in portafogli con orizzonte temporale troppo corto. Difficile però mettere a fuoco la situazione. Fortunatamente esistono le tecniche di Machine Learning non-supervisionato: sono nostre amiche. Le sguinzagliamo come segugi e le mandiamo a scovare strutture nascoste nei dati. Cose che noi, a occhio nudo, fatichiamo a vedere.

Per provare a raggruppare in modo ragionevole i clienti applichiamo una tecnica di softclustering: un modello GMM. Ovvero una mistura di distribuzioni Gaussiane bivariate (bivariate perché abbiamo due variabili: H1 e H2; se avessimo tre variabili, sarebbero trivariate, e via dicendo).

Il sospetto che un GMM a due componenti basti deriva dall’osservazione congiunta di distribuzioni marginali e dipendenza (guardate l’istogramma a sinistra — è bimodale; l’altro no, è unimodale):

Il modello GMM è piuttosto flessibile, adattandosi a molte situazioni; iniziamo con la versione più semplice possibile: due Gaussiane, cioè due normali. Quindi — state con me che il male passa subito — abbiamo due densità di probabilità normali multivariate, ciascuna con una media (un vettore 2 x 1), una covarianza (matrice 4 x 4), e poi c’è il peso della mistura, che è una probabilità. Più precisamente, la probabilità che un punto appartenga all’una o all’altra Gaussiana.

Applicando il modello con modesta ruminazione statistica (stima con metodo EM — Expectation Maximization, scaltra e potente applicazione del Teorema di Bayes), dall’informe nuvola di punti emergono due cluster, evidenziati dalle “curve di livello” del grafico (le “cime” evidenziate dalle curve di livello corrispondono al centro dei due cluster):

L’algoritmo di clustering ci ha così messo di fronte alla situazione facilmente interpretabile:

  • il primo cluster, che con un gran volo di fantasia chiameremo Cluster 1, è costituito dai clienti che hanno investito su prodotti con scadenze molto più corte del loro orizzonte temporale naturale;
  • il secondo cluster, Cluster 2, include invece i clienti per i quali c’è una certa coerenza tra l’orizzonte naturale e quello degli investimenti — anche se non mancano disallineamenti importanti anche in questo cluster.

Naturalmente non è una scienza esatta, ma è assai meglio della lettura delle viscere di etrusca tradizione. Certo, le fonti d’errore direttamente derivanti dai dati di base possono essere uno sciame. Inoltre, i due gruppi di clienti non sono nettamente distinti, e questo è proprio nelle corde del soft clustering. Il risultato non ha però pretesa di essere preciso, bensì probabilistico: ogni cliente è un punto, cioè una coordinata (H1, H2), e ogni punto ha una probabilità di appartenere a un cluster o all’altro — guardate il grafico in calce (più il punto vira sui colori caldi, più è elevata la probabilità che appartenga al Cluster 1).

Facendo finta d’essere contenti con questo modello (in realtà l’indagine andrebbe approfondita, ma lasciamo stare), a questo punto le azioni possono essere molteplici. Alcune sono ovvie:

  • sollecito i clienti del Cluster 1 con le modalità proprie del mio modello di business (ad esempio gli spedisco un consulente finanziario, oppure gli telefono e lo prego di passare in filiale, o gli mando una newsletter, o gli faccio sbucare una comunicazione sull’area riservata del sito, o una combinazione delle precedenti, ecc) — cerco innanzitutto di capire, poi magari di farlo investire come dovrebbe;
  • vado a fare un’azione di analisi e correzione anche per i clienti più lontani dal centro del Cluster 2, migliorando la qualità del servizio;
  • cerco di capire se i clienti disallineati sono tali per via degli insondabili istinti dei clienti stessi, meravigliosamente incoerenti e illogici, oppure il disallineamento trae origine dalle vaccate asinine di chi ha venduto ai clienti prodotti finanziari in modo avido e confuso, oppure una combinazione convessa dei due precedenti fattori;
  • riconsidero criticamente il questionario di profilazione, spesso di qualità esecrabile perché volto esclusivamente a smazzarsi gli obblighi regolamentari, raccogliendo le informazioni dai clienti con la leggerezza di una clava manovrata da un neanderthaliano, senza nessuna attenzione verso la psicologia del rispondente;
  • avvio azioni, digitali e non, dirette ad arricchire il profilo del cliente, mettendolo a fuoco un po’ meglio — il c.d. smart engagement, che si può attuare in mille modi.

Naturalmente, messa in piedi la baracca, ogni nuovo cliente verrà classificato nell’uno o nell’altro cluster in base all’algoritmo GMM (che s’aggiorna, effettuando del vero statistical learning) — si veda il grafico seguente. L’obiettivo sarà minimizzare il numero di clienti che ricadono nel Cluster 1.

Take home: applicando una tecnica di Machine Learning piuttosto semplice a dati che qualunque azienda di wealth management dovrebbe avere (se non li ha dovrebbe porsi alcune domande esistenziali) si può migliorare il servizio al cliente (includendo e andando oltre i meri aspetti di compliance) e si hanno spunti per fare upselling. Ma questo è solo un caso: ve ne sono molti altri.

--

--

Raffaele Zenti
Qwafafew-Italy

Nato per sbaglio sulla terraferma, sto meglio in mare ma corro sui monti. Dati e Data Science per campare: ideatore e fondatore di Virtualb.it e AdviseOnly.com.