Cosa abbiamo imparato su Piwik

Un resoconto a partire da una sperimentazione con i siti web di alcune pubbliche amministrazioni italiane

di Davide Porrovecchio e Daniela Iozzo

Una dashboard. Photo by Carlos Muza on Unsplash

1. Primo, sperimentare: siti coinvolti e casi d’uso

La prima fase di sperimentazione del progetto Web Analytics per i siti pubblici ha visto la collaborazione di un nucleo di amministrazioni pilota: è stato considerato un panel di circa 40 siti web, selezionati per rispondere all’esigenza di far emergere e categorizzare i bisogni di analisi di traffico web di specifiche categorie di Pubbliche Amministrazioni (PA). Alcuni fra i siti coinvolti sono: governo italiano, MIUR, INPS, siti di agenzie, siti di regioni, siti di comuni e siti di scuole.

Le analisi condotte sulla base dei dati raccolti hanno riguardato casi d’uso quali amministrazioni centrali, regioni, comuni, scuole.

Per approfondire: Il progetto e la lista completa dei siti coinvolti
Leggi anche: Cosa fanno gli utenti sul sito di un Comune? Ce lo dice Piwik
Linee guida per i siti della Pubblica Amministrazione: La guida ai web analytics
Il progetto relativo a Piwik si inserisce in un più ampio programma per favorire l’adozione di pratiche di design basate sui dati e in particolare sulla conoscenza del comportamento degli utenti, secondo un modello di data-driven design.

2. Cos’è Piwik?

Piwik è una piattaforma di web analytics, e in quanto tale consente di raccogliere dati su quanto e come gli utenti utilizzano i siti web. Attraverso Piwik è possibile quindi tracciare e “collezionare” le visite degli utenti su ciascuna pagina di un sito o di una app e memorizzare — per ciascuna di queste visite — informazioni aggiuntive (ad esempio la pagina di provenienza o il tipo di browser utilizzato).

Photo by Piwik

Piwik è la piattaforma di web analytics open source più utilizzata al mondo, con una quota di mercato del 2,1% considerando l’insieme di piattaforme open source e proprietarie (fonte: Usage statistics and market share of Piwik for websites — W3Techs). L’interfaccia di Piwik è disponibile in 54 lingue.

Per approfondire: What is Piwik? [su piwik.org]

3. Perché è uguale e perché è diverso da Google Analytics

Piwik offre funzionalità simili a Google Analytics ma ci sono alcune differenze da considerare.

La più importante riguarda la proprietà dei dati: con Piwik la proprietà e l’accesso ai dati resta sotto l’esclusivo controllo di chi li raccoglie. Con Google Analytics, invece, il dato è sotto la proprietà ed il controllo di Google che lo fornisce nell’ambito di un accordo di licenza.

Ci sono importanti differenze da considerare nel caso di soluzioni di tipo enterprise e a pagamento come, ad esempio, Google Analytics 360, Piwik PRO e Innocraft Cloud

Con Piwik la gestione della piattaforma di raccolta dei dati diventa una responsabilità di chi vuole raccogliere i dati. Su Google Analytics questa responsabilità risulta totalmente esternalizzata.

Un altro elemento di confronto riguarda l’analisi dei dati raccolti perché, oltre determinate soglie, Google Analytics utilizza procedure di campionamento dei dati per generare i report, approssimando quindi alcuni valori. Piwik utilizza delle procedure di archiviazione dei report ma non effettua alcuna approssimazione.

Fra Piwik e Google Analytics esistono poi altre differenze che riguardano alcuni aspetti come il numero di “eventi” (hits) registrabili per mese, il numero di utenti, proprietà web, obiettivi e variabili personalizzabili per singolo account, e infine differenze che riguardano il tempo di conservazione dei dati (data storage) e l’export dei database.

Per approfondire: How is Piwik different to Google Analytics and other web analytics tools? [su piwik.org]

4. Piwik è open source, ma non solo

Il codice sorgente di Piwik è totalmente open source, è sviluppato e mantenuto da una community di developer e l’intero progetto è disponibile in un repository su GitHub. Il nucleo di funzionalità di Piwik è poi estensibile e personalizzabile grazie ad una serie di plugin e temi, gratuiti o a pagamento, disponibili con licenze diverse e per la maggior parte presenti nel Marketplace di Piwik.

Per iniziare ad utilizzare Piwik è necessario un proprio spazio web ed un database. La procedura di installazione è abbastanza semplice, ma richiede alcune competenze tecniche di base.

Per il mondo enterprise (aziende e organizzazioni) sono inoltre disponibili dei prodotti commerciali, sviluppati a partire dal nucleo open source di Piwik, che offrono la piattaforma in modalità SaaS, già pronta per l’utilizzo e senza la necessità di effettuare installazioni. Un esempio di questo tipo di soluzione è l’azienda Piwik PRO con la sua piattaforma proprietaria “Piwik PRO Marketing Suite” che si basa sul core open source di Piwik e offre moduli aggiuntivi (come un sistema di tag management) e altre funzioni utili per il tracciamento soprattutto nell’ambito del marketing online e dell’e-commerce. Un altro esempio è Innocraft Cloud che offre un servizio professionale di cloud hosting per Piwik insieme ad una serie di plugin che includono, tra gli altri, strumenti per A/B testing e heatmaps.

Per approfondire: Piwik is Free Software [su piwik.org]
Funzionalità premium: Drive your revenue with these premium features for Piwik [su innocraft.com] e Compare Piwik Community and Piwik PRO Marketing Suite [su piwik.pro]

5. Vantaggi di un unico sistema per tutti

Una dashboard che mostra i report sul traffico dei siti delle PA permette di avere una visione d’insieme su insiemi di dati che altrimenti sarebbero stati dei silos non comunicanti tra loro. Una analisi più accurata di questi dati è un’importante elemento da tenere in considerazione nel flusso dei processi di decision-making e contribuisce a spostare il centro di gravità verso un approccio centrato sul cittadino.

Da un punto di vista più tecnico, un sistema che raccoglie e aggrega i dati analitici sull’uso dei servizi web da parte dei cittadini, offre grandi vantaggi in termini di:

  • policy centralizzate e coerenti per gestione della privacy;
  • policy centralizzate e coerenti per la conservazione sicura dei dati (data retention);
  • controllo e proprietà dei dati;
  • previsione e controllo della spesa;
  • mantenimento della piattaforma (evoluzione e scaling).

6. La gestione della privacy in Piwik

Per garantire la privacy dei dati degli utenti e in linea con la regolamentazione europea in materia di protezione dei dati personali (GDPR) e di autorizzazione all’uso dei cookie, Piwik consente di:

  • anonimizzare gli indirizzi IP dei visitatori;
  • rispettare la preferenza DoNotTrack trasmessa dai browser;
  • offrire ai visitatori la possibilità di registrare la propria preferenza di non tracciare le proprie visite (opt-out).

L’attivazione di queste opzioni relative al tracciamento delle visite garantisce un alto livello di rispetto della privacy dell’utente e, di conseguenza, non richiede il consenso esplicito del visitatore per la memorizzazione dei cookie*.

Per approfondire:
Protection of personal data [su ec.europa.eu]
Web Analytics Privacy in Piwik [su piwik.org]

Il cookie memorizzato da Piwik sul browser del visitatore si classifica come “cookie analitico di terze parti”. Se sono impostate le opportune opzioni di anonimizzazione e il dato non viene incrociato con altri già disponibili, allora non è necessario il consenso esplicito del visitatore. Uno schema sintetico sulle regole per l’utilizzo dei cookie è pubblicato sul sito del Garante per la protezione dei dati personali.

Linee guida per i siti della Pubblica Amministrazione: La guida ai web analytics

7. Il setup di Piwik: siti e utenti

Subito dopo l’installazione di Piwik, la cosa da fare per iniziare a vedere come funziona, è quella di inserire il primo sito web. Si tratta di una procedura abbastanza semplice alla fine della quale viene visualizzato un frammento di codice JavaScript che andrà poi inserito all’interno delle pagine del sito web che si intende tracciare.

Se il sito in questione è gestito tramite un CMS (come ad esempio WordPress, Joomla o Drupal), l’integrazione del codice JavaScript è resa ancora più semplice perché sono disponibili molti plugin gratuiti che permettono di effettuare la procedura senza la necessità di modificare manualmente il codice sorgente del sito.

Piwik può essere inserito anche se il sito web è già configurato con Google Analytics oppure se è già presente un tracciamento di un altro server Piwik. In quest’ultimo caso, affrontato più di una volta durante la sperimentazione, sarà necessario apportare delle piccole modifiche al frammento JavaScript da inserire nelle pagine.

Photo by Abigail Keenan on Unsplash

Piwik supporta la creazione di nuovi utenti e l’assegnazione di permessi sui singoli siti web tracciati. Esistono tre livelli di permessi:

  • SuperUser: può aggiungere siti, creare utenti e gestire i plugin. Può anche modificare tutte le impostazioni dei siti tracciati e modificare i permessi degli altri utenti. Questo profilo non è legato a nessun sito web e ha permessi relativi a tutta la piattaforma analytics.
  • Admin: può gestire le impostazioni di un sito e amministrare altri elementi ad esso associati (eventi, obiettivi, funnels, etc.). Inoltre può dare ad altri utenti il permesso visualizzare o amministrare il sito che gestisce. Questo profilo è legato ad uno specifico sito web.
  • View: può solo leggere i dati delle visite relative ad un sito e visualizzare tutti i report. Anche questo profilo è legato ad uno specifico sito web.

In fase di installazione Piwik crea inizialmente un utente che ha i permessi di tipo SuperUser, sarò quindi poi cura di quest’ultimo inserire i siti web, aggiungere gli ulteriori utenti e assegnare loro i permessi corretti.

La possibilità di creare utenze e impostare permessi relativi ai siti tracciati rende Piwik una piattaforma adatta a gestire anche grandi insiemi di siti web. In questo caso, però, vanno adottate opportune soluzioni tecniche per evitare cali di performance della piattaforma.

Per approfondire: Manage Websites [su piwik.org] e Manage Users [su piwik.org]

8. Creare dashboard e report per un sito web

In Piwik è possibile creare delle dashboard customizzate per personalizzare le analisi e velocizzare l’estrapolazione dei dati. Una dashboard personalizzata (custom dashboard) è costituita da un insieme di widget, ognuno dei quali può mostrare delle metriche o degli incroci fra metriche e dimensioni.

Un esempio di dashboard sulla demo di Piwik

Oltre alle dashboard personalizzate (che possono essere condivise con altri membri del gruppo di lavoro), in Piwik è possibile generare report in formato PDF o CSV da condividere via mail.

Per sperimentare un po’ con le dashboard di Piwik è possibile usare l’installazione demo accessibile con permessi di tipo “View” senza autenticazione.

Durante la sperimentazione con Piwik sono emersi alcuni punti deboli relativi alle funzioni di report, in particolare:

  • assenza di secondary dimension picker: occorre necessariamente creare segmenti per aggiungere una dimensione secondaria ad un rapporto. Ad esempio, per filtrare una tabella per “utenti di sesso femminile”, con Piwik si deve necessariamente creare un segmento “utenza sesso femminile”, mentre con Google Analytics questa e altre dimensioni sono presenti come filtri pre-impostati e attivabili nel report;
  • assenza di una funzionalità per la comparazione di intervalli di date differenti dal selettore presente nella dashboard o nella funzionalità compare segments;
  • assenza di una gallery di soluzioni importabili (segmenti, report personalizzati, dashboard personalizzate, etc.).
Per approfondire: Dashboard & Widgets [su piwik.org], Manage Email Reports [su piwik.org], Google Analytics Solutions Gallery [su google.com] e Aggiunta di una dimensione secondaria al rapporto [su google.com]

9. Analizzare il motore di ricerca interno a un sito web

Molti siti web hanno un motore di ricerca interno che permette agli utenti di effettuare ricerche tra i contenuti presenti sul sito. Così come per i motori di ricerca esterni (Google, Bing, Yahoo, etc.), anche per la ricerca interna è molto importante analizzare quali sono le parole chiave utilizzate dai visitatori. Attraverso l’analisi di questi dati è possibile, ad esempio, scoprire quali sono i contenuti più ricercati oppure quelli più difficili da raggiungere perché abbinati a parole-chiave (o altre meta-informazioni) non precise.

Attraverso Piwik è possibile tenere traccia di tutte le ricerche effettuate dai visitatori del proprio sito web e generare interessanti report utili per migliorare continuamente l’architettura della informazioni del proprio sito web.

A seconda delle caratteristiche tecniche della funzionalità di ricerca del sito, può essere necessaria una configurazione più avanzata. Se si utilizza un CMS è possibile che il tracciamento delle parole chiave sia integrato nel plugin di integrazione di Piwik (è questo il caso del plugin per Drupal).

Per approfondire: Site Search Tracking and Reporting [su piwik.org]

10. Analizzare network di siti web

Quando parliamo di analisi dei dati web di siti della Pubblica Amministrazione più correttamente dovremmo fare riferimento a veri e propri network di siti web, ovvero considerare lo user-journey del cittadino che naviga più domini (o sottodomini) di una stessa realtà locale nel corso del suo viaggio verso un’informazione o la finalizzazione di una transazione.

Per identificare l’utente attraverso le visite su domini differenti e riuscire quindi ad analizzare il suo user-journey, Piwik offre la funzionalità cross-domain tracking, che permette il passaggio, da un dominio all’altro, delle informazioni associate alla visita. Per usare questa funzionalità sono necessari due passaggi:

  • inserimento di tutti i domini del sito come alias;
  • modifica del frammento JavaScript per abilitare l’opzione (si può fare manualmente o dall’interfaccia di Piwik).

Un altro possibile scenario è quello relativo ad insiemi più ampi di siti web per i quali potrebbe essere interessante analizzare le metriche in forma aggregata. Un esempio immediato è quello delle aggregazioni territoriali (tutti i siti web di una regione), un altro potrebbe riferirsi ad aggregazioni categoriali (i siti web di tutti i comuni).

Per aggregare i dati provenienti da siti web differenti non ci sono soluzioni gratuite e open source a disposizione. Sia Piwik PRO sia Innocraft offrono però dei plugin premium che permettono di organizzare gruppi di siti per sommare le metriche fare analisi tra i dati così aggregati.

Plugin premium per analisi aggregate: Roll-Up Reporting [su piwik.org] e Metasites [su piwik.pro]

11. Analisi dei funnel

Come tutte le maggiori piattaforme di web analytics anche Piwik permette l’analisi dei “funnel”, cioè di alcuni dei percorsi canonici dei visitatori sul sito, verso un’azione specifica identificata come obiettivo. Piwik consente quindi di impostare un determinato percorso di navigazione e analizzare la sequenza di step che il visitatore attraversa per il completamento dell’azione impostata. Se, ad esempio, l’obiettivo fosse quello di sottoscrivere un servizio offerto da una pubblica amministrazione, si potrebbe immaginare un funnel composto da 4 step:

  • autenticazione del cittadino;
  • scelta del servizio da richiedere;
  • scelta delle opzioni relative all’erogazione del servizio;
  • richiesta del servizio.

Come per le analisi aggregate dei siti web, anche in questo caso non sono disponibili soluzioni open source e gratuite, ma solo plugin premium.

Soluzioni proprietarie per analisi dei funnel: Funnels [su piwik.org] e Funnel Analytics [su piwik.pro]

Per concludere

L’esperienza di sperimentazione condotta con Piwik sui siti web di alcune pubbliche amministrazioni italiane ci ha convinto dell’affidabilità di questa piattaforma open source. La community di sviluppatori che contribuisce al progetto è abbastanza attiva e nuove funzionalità sono costantemente richieste o in fase di sviluppo.

Si tratta di una valida alternativa rispetto a Google Analytics, soprattutto se gli aspetti relativi alla privacy e alla proprietà dei dati raccolti rivestono un ruolo importante nella scelta delle soluzioni tecnologiche da adottare.

Durante la sperimentazione non sono emerse criticità rilevanti se non alcuni rallentamenti, dovuti al sovraccarico dei server, durante la generazione di report relativi a siti web con altissimi livelli di traffico. Per questo tipo di difficoltà, tuttavia, è necessario considerare soprattutto l’infrastruttura che ospita Piwik piuttosto che il software.

Altre criticità minori riguardano alcune funzionalità mancanti e che potrebbero risultare utili. In particolare sarebbe stato comodo:

  • avere una dashboard per la navigazione tra tutti i siti tracciati;
  • avere una dashboard per confrontare, side-by-side, la stessa metrica per siti differenti;
  • avere uno strumento per confrontare le metriche di gruppi arbitrari di siti su una o più dimensioni;
  • avere una funzionalità di benchmarking di intervalli di date più flessibile.

Alcune di queste funzionalità sono in parte disponibili con plugin di tipo premium, ma la community degli sviluppatori non smette mai di stupire con soluzioni open source di ottima qualità.