Quali indicazioni trarre dal fenomeno #chatgpt?

Published in

PA digitale

12 min readJan 5, 2023

Inutile nasconderlo, il 2022 si è chiuso con un enorme interesse attorno all’Intelligenza Artificiale, per lo meno quella legata ai fenomeni di ChatGpt per la parte testuale e poi i vari Vana Portrait, Lensa, Dall-E2 o Midjourney per la parte visuale. L’utilizzo massiccio di questi servizi da parte di un utenza non professionale ha creato un incredibile #hype che sembra trascinare il 2023 verso nuovi scenari, del tutto inimmaginabili fino a pochi anni fa.

Ma andiamo con ordine, cercando di comprendere meglio cosa ci viene offerto e che sviluppi si possono immaginare anche per il settore istituzionale e pubblico.

Di cosa stiamo parlando?

Stiamo parlando di Intelligenza Artificiale, ovviamente, ma per essere più precisi dobbiamo anche specificare che questi fenomeni riguardano solo uno dei possibili campi di applicazione (quello della creatività) e in particolare di alcune tecnologie generative della AI (elaborazione del linguaggio e generatori di arte) che offrono possibilità di sfruttamento in ambito di produzione artistica, ma non solo.

ChatGpt è un servizio web che utilizza algoritmi avanzati di apprendimento automatico per generare risposte molto simili a quelle umane definite all’interno di un discorso compiuto.
Esso sfrutta l’apprendimento continuo derivante dall’enorme mole di dati a cui attinge (Wikipedia, Google Books e Common Crawl in primis) e riesce a migliorare di continuo le sue prestazioni, aumentando la precisione dei risultati. Facendo ciò si rende sempre più utile agli utenti che vogliono sfruttarlo come base informativa da cui attingere per argomentazioni, tesi e creazioni letterarie. E lo fa abbastanza bene, adattandosi anche a cambiare in base alle mutate esigenze degli utenti stessi.

Di fatto ChatGpt è un servizio già PRE ADDESTRATO per sfruttare le basi dati da cui attinge ma, è importante sottolinearlo da subito, non è in grado di validare il testo in uscita come originale, copiato, vero, falso, plagiato, ecc. Lo eroga con la formula del ‘prendere o lasciare’, a nostro rischio e pericolo.

Le raccomandazioni esposte, sembrano chiarissime e, soprattutto per il settore pubblico a cui facciamo riferimento in questo articolo, vanno prese in considerazione prima di farne qualsiasi uso istituzionale e/o di servizio nei confronti dell’utenza.

Può occasionalmente generare informazioni errate
Potrebbe occasionalmente produrre istruzioni dannose o contenuti difformi dalla realtà
Conoscenza limitata del mondo e degli eventi dopo il 2021

Vana portrait, Lensa, Dall-E 2, Midjourney e servizi similari, usano diverse tecnologie derivanti dalle reti neurali (GAN, CNN, NST) per generare o rigenerare immagini e video:

Rete generativa avversaria (GAN). Sistema a due componenti. Il primo, detto generatore, cerca di produrre delle immagini originali, mentre il secondo, detto discriminatore, sfrutta una qualsiasi base dati di immagini già raccolte per verificare (ovvero confrontare e poi discriminare) il risultato del generatore in modo da verificarne la totale originalità.
Rete neurale convoluzionale (CNN). Caratterizzata da una serie di strumenti di Deep learning che si ispirano all’organizzazione della corteccia visiva. In pratica essi emulano ciò che il cervello a volte elabora senza sfruttare il senso visivo (come in un sogno al buio). Questi algoritmi sono molto utilizzati per produrre immagini fantasy, futuristiche e psichedeliche.
Trasferimento di stile neurale (NST). Serie di algoritmi che manipolano immagini e video digitali per crearne di nuove (o derivazioni delle stesse) con aspetto e stile di altre immagini o video. In pratica una nostra foto potrebbe determinare una nuova elaborazione nello di stile di Leonardo o Salvador Dalì.

Anche in questo caso l’utilizzo nell’ambito pubblico deve fare riferimento agli avvertimenti che i gestori pubblicano per incentivarne un uso strettamente personale e porre molta attenzione a un eventuale uso ai fini di business, piuttosto che istituzionali.
Una lista interessante sui molteplici ‘Risks and Limitations’ è disponibile sul profilo Github di DALL-E2.

L’efficacia del grattare il web (scraping) per istruire le Intelligenze Artificiali).

Possiamo tranquillamente affermare che per raggiungere i risultati che oggi abbiamo di fronte, e che abbiamo iniziamo ad apprezzare, tutti questi servizi hanno dovuto letteralmente far grattare il web dai loro algoritmi, con l’obiettivo di raccogliere una quantità indescrivibile di dati, difficile persino da misurare.

Già Google aveva iniziato questa avventura con la tecnologia di Deep-Learning BERT. Un set di algoritmi che prendono in considerazione ogni parola nel contesto in cui si trova inserita, dunque in relazione alle altre parole che la precedono e la seguono e non più trattandola come keyword singola. Tutto ciò al fine di rendere più naturale e avanzato il linguaggio delle ricerche nel suo motore.
Google per fare ciò non ha avuto difficoltà a grattare tutto il web passando poi i dati a Bert che, per elaborare i risultati, basa la sua tecnologia su circa 300 milioni di parametri (o più semplicemente criteri).

GPT-3 (tecnologia usata da ChatGPT) oggi è già in grado di basare il suo operato su ben 175 miliardi di parametri avendo, inoltre, già grattato tutta Wikipedia che, comunque, rappresenta meno dell’1% di tutto quello che ha grattato sul web fino ad oggi (per la precisione fino al 2021). Numeri impressionanti, non c’è che dire.

Gli sviluppatori di Lensa, poi, hanno fatto fare ai loro algoritmi la stessa cosa per le immagini, catturando quante più fotografie possibili fra tutte quelle che vengono veicolate giornalmente, compresi i cosiddetti USER GENERATED CONTENT.

Dunque, la prima riflessione che siamo portati a fare potrebbe essere: di quanti dati deve disporre una AI per avvicinarsi alle potenzialità del cervello umano?

La risposta più intuitiva potrebbe essere: INFINITI!

Che uso ne viene fatto, ad oggi?

ChatGpt viene principalmente utilizzato per scrivere testi o per rispondere (far rispondere) a domande. Banale vero?
No, non è banale, perchè possiamo chiedere al servizio lo scopo, l’audience, la lunghezza, il contesto, il servizio da utilizzare per la diffusione del testo, ecc.

ChatGpt, inoltre, è in grado di comprendere e dare le giuste risposte a quesiti molto complessi e di adeguarsi a una molteplicità di stili di comunicazione. Ciò ne garantisce l’efficacia anche in situazioni e contesti molto diversi fra loro.

Ecco un esempio, semplicissimo, dove gli ho chiesto un aiuto per accompagnare la pubblicazione di alcune foto su Instagram:

Questo apre sicuramente prospettive nuove per i copywriter pubblici, ad esempio i gestori dei Social Media nella PA che giornalmente si trovano a dover preparare testi diversi per i vari canali gestiti (Twitter, Facebook, Youtube, Instagram, ecc.).

Ovviamente i campi di applicazione sono molteplici e per assurdo avrei potuto chiedere proprio a ChatGpt di scrivere l’articolo che state leggendo.

Rileggendo la risposta che mi ha offerto, però, mi è sorto il dubbio di avergli fornito pochi parametri. Dunque ho riprovato con una serie di aggiustamenti, riformulando la domanda e aggiungendo alcuni elementi di precisione che circoscrivano il tema e ne vincolino alcuni output, come ad esempio la lunghezza:

Il risultato, purtroppo, ricalca più o meno il precedente con la sola aggiunta di un paio di frasi poco rilevanti per il valore dell’articolo, soprattutto in ordine alle fonti regolatorie (indispensabili per la PA) o all’utilità di certi assunti in merito ai temi di privacy e copyright, solamente attenzionati e dunque poco utili allo scopo.

Volendo spingermi oltre e provando a immaginare che, grazie alla raccolta di fonti web (ricordo che il crawling principale a cui attinge GPT-3 è quello, per ora, di Common Crawl) sia in grado di elaborare un testo di legge confrontandolo con testi precedentemente emanati, ho formulato questa richiesta:

Ho volutamente tagliato l’immagine di output perchè il testo generato si è dimostrato particolarmente lungo e articolato (potete riformularla voi stessi per misurarne l’ampiezza e la profondità). Resta interessante, al netto dell’endemica mancanza di fonti e richiami legislativi, la struttura narrativa, probabilmente desunta da articoli web e documenti pdf sul tema delle competenze digitali e della formazione.

E qui viene subito stimolato l’appetito: possiamo usarlo per redigere, delibere, determine, circolari, ecc.? Si, forse, insomma! Direi che può essere di aiuto, ma il richiamo alle normative, la forma narrativa (spesso anch’essa regolata da documenti ufficiali) e la struttura dell’articolazione dell’atto, sono sempre a carico e sotto la responsabilità del civil servant.

Sul tema multimedia (immagini, filmati e suoni), restando sempre nell’ambito istituzionale, possiamo immaginare il contributo di queste tecnologie come una specie di aiuto, o ispirazione, per la parte creativa. Ad esempio per l’ideazione di loghi, sfondi, brochure, volantini, oppure video tutorial piuttosto che racconti e/o intere narrazioni (strumenti come Synthesia, riescono a fare tutto ciò partendo da un semplice script testuale elaborato da ChatGpt).

Il set di loghi che segue, l’ho richiesto a Midjourney semplicemente digitando una frase del tipo: ‘Create a simple technical company logo name called “BLA BLA XYZ”, make the color white, blue, predominantly, and a little green, and use (laptop and tablet) in the design of the logo’, ovvero ‘Crea un logo tecnologico molto semplice, con un nome di fantasia nei colori bianco, blue e verde e accompagnato da simbologia di laptop o tablet’.

Niente di che, ovvio. Ma l’esperimento offre spunti che, per chi è poco propenso alla creatività, possono risultare utili. In pratica sblocca chi è a corto di idee, offrendogli mockup e primarie suggestioni che stentano ad emergere.

Nell’ambito privato alcuni brand stanno già utilizzando queste potenzialità per rappresentare prodotti piuttosto che servizi. Come nel caso di Mulino Bianco Barilla che proprio in questi giorni sta lanciando la sua nuova campagna utilizzando immagini create con Midjourney.

Pubblica Amministrazione e Intelligenza Artificiale

L’apporto che l’AI può dare in concreto per accelerare l’innovazione e la semplificazione nella PA, è oggetto di studio da anni. Si son susseguite nel tempo, task force, strategie e progetti (pochi) che hanno provato a sistematizzare il tema, senza comprendere appieno che l’AI non ha bisogno di essere pianificata in quanto già operativa negli strumenti tecnologici (HW) e soprattutto in quasi tutti i nuovi servizi applicativi (SW) che già si avvalgono di ingenti quantità di dati e tecnologie elaborative (con grande utilizzo di algoritmi AI) sul cloud.

Sul tema che affrontiamo, ovvero le AI generative, val la pena soffermarsi su alcuni aspetti opportunistici ed etici per capire se i vantaggi offerti come ausilio alla creatività e/o alla curiosità necessitano di una contropartita o di più contropartite a carico della Pubblica Amministrazione.

I dati. Per poter nutrire questi algoritmi è necessario liberare più dati pubblici possibile. Come abbiamo visto il nutrimento è offerto dallo scraping sul web e dunque è sul web che i dati pubblici aperti dovrebbero stare. Ma qui torniamo alla grande scommessa persa (o incompiuta) degli Open Data in possesso della PA e quasi mai utilizzati per questi scopi a causa della scarsa qualità e utilità che essi offrono.
Il rapporto uomo macchina che tende a pre-configurare un mercato del lavoro dove, negli anni a venire, si potrebbe assistere a una cooperazione fra uomo e AI, piuttosto che a una resistenza o una guerra fra i due soggetti. Anche se i film di fantascienza ci hanno già rappresentato un punto di vista piuttosto drammatico su questo scenario. Ahinoi.
E’ indubbio infatti che certe cose vengono fatte ‘quasi’ meglio dalla AI che da un umano con scarse competenze. Ma non può essere questo il motivo per sostituire lo stesso umano con degli algoritmi. Piuttosto, è necessario introdurre figure che siano in grado di gestire queste dinamiche e indirizzarle. Ergo grande opportunità di #upskilling anche nel settore pubblico.
Chi detiene le redini e detta le regole del gioco? Chi sceglie quali dati possono alimentare l’intelligenza e quali no? Chi decide quali risposte della macchina sono buone e quali no? Scenario già visto con i Social Media.
Son sempre aziende tech d’oltre oceano che decidono il da farsi, secondo la loro convenienza. E quando la PA decide di affrontare questi rischi sa (o dovrebbe sapere) che deve adeguarsi, aspettando nuove regole e indirizzi che spesso arrivano dopo anni, se non decenni.
La EU si è mossa da tempo con una proposta di regolamento ma si sa che le tecnologie son molto più veloci dei tempi che impiegano le istituzioni per decidere.
Rispetto all’etica, si narra che molte istituzioni scolastiche, di fronte a questo travolgente fenomeno, stiano pensando a limitazioni, controlli e/o nuove regolamenti.
Un interessante articolo di The Atlantic del mese scorso analizza molti risvolti legati agli elaborati che gli studenti stanno consegnando ai loro docenti dopo aver utilizzato ChatGpt. Il bivio, descritto nell’articolo, è molto semplice: queste tecnologie potrebbero diventare un dono per gli studenti imbroglioni, o un potente assistente didattico e/o uno strumento per la creatività.
Gli insegnanti intanto son preoccupati perchè notano negli studenti una tendenza che li induce ad accettare il minimo sindacale come risultato delle loro richieste all’AI di turno. Per dirla in anglosassone, preferiscono l’approccio Quick&Dirty, rinunciando ad utilizzare le caratteristiche e le doti che l’intelligenza umana, nella sua crescita ed evoluzione secolare, ci ha offerto.
Cito da Wikipedia, the Free Encyclopedia: ‘capacità di astrazione, logica, comprensione, autoconsapevolezza, apprendimento, conoscenza emotiva, ragionamento, pianificazione, creatività, pensiero critico e risoluzione dei problemi’ e aggiungerei: intuizione, passione, invenzione, ecc.
Rinunciare a tutto ciò per risparmiare tempo e fatica può essere utile anche in ambito lavorativo? Dipende, ovviamente dalla complessità dei contesti e dall’importanza degli stessi. Il dibattito è solo agli inizi.
Rispetto al diritto di autore va rilevato che questi servizi di AI si nutrono e poi imparano da opere altrui. Infatti non creano nulla di nuovo. Esse creano dei derivati attingendo dalla creatività, pre-esistente, espressa da una moltitudine variegata di autori che non sappiamo se protetti o no da diritti. E’ quasi impossibile sapere se un derivato abbia attinto da opere rilasciate sotto licenza Creative Commons o protette legalmente. Chi può saperlo? Chi ce lo certifica?
Diciamo che c’è lavoro per avvocati. As usual.
Privacy e Sicurezza: Ho trovato il mio reale dentro una AI! Oppure ho trovato mie foto, i loghi della mia azienda, ma anche documenti o atti pubblici dentro una AI. Come è possibile?
In effetti, queste tecnologie grattano tutto ciò che è pubblico. Spesso tendiamo a dimenticare quanti elaborati abbiamo lasciato nei vecchi siti web ancora visibili, su pagine non aggiornate o intere sezioni del sito dimenticate. Tutta roba vecchia che non dovrebbe essere li.
E intanto le AI grattano le immagini e i testi sui social. E poi grattano i testi e le immagini degli amministratori pubblici (ministri, onorevoli, sindaci e assessori), un vero tritacarne.
Poi usano il tutto per imparare, per apprendere e allenarsi. Si le AI non fanno altro che nutrirsi di tutto ciò che è più o meno pubblico, senza distinguere lecito da illecito, buono da cattivo, etico da non etico. Per adesso.
Con un po’ di pazienza e con gli strumenti più idonei possiamo anche vedere se noi o la nostra organizzazione siamo stati utilizzati allo scopo. Basta dare un’occhiata al sito: Have I been trained? (sono stato usato per allenarsi?). Terribile, vero?

Conclusioni finali

Forse è presto per trarre conclusioni definitive.
L’innovazione va veloce e sfruttarla per ottenere vantaggi è sicuramente un ottimo esercizio di saggezza e lungimiranza.
Per fortuna nella Pubblica Amministrazione si tende alla prudenza e quasi sempre ad aspettare regolazioni e linee guida, prima di lanciarsi in voli pindarici.
Ma poi ci sono gli impazienti, gli ansiosi, gli entusiasti, quelli che vogliono stupire e mostrare da subito le opportunità offerte dal progresso. E per fortuna direi. La sperimentazione nella PA è necessaria per rompere indugi e dogmi cristallizzati.
Va però tenuto conto che questi scenari sono irti di incognite e perciò han bisogno di essere provati e riprovati per verificarne non solo l’efficacia, ma soprattutto la bontà e l’utilità del loro operato.

Una piccola proposta finale sull’uso di Chat-Gpt nella PA. Proposta rivolta agli smanettoni informatici, nerd incalliti, che ancora non hanno ceduto al procurement e agli affidamenti esterni. Provare a fargli scrivere del codice informatico in qualsiasi linguaggio e confrontarlo con quello che avete scritto voi. In questa attività Chat-Gpt da il meglio di sé.
Potremmo farne uso come rinforzo formativo e di consolidamento delle nostre competenze informatiche. Insomma, un modo come un’altro per valutarne l’efficacia.

Come è successo circa 20 anni fa per le reti sociali, con l’esplosione di nuovi servizi e tecnologie, oggi assistiamo a un fenomeno analogo, e siamo solo agli inizi. Le Generative AI sono qui per restare e forse per cambiare i nostri approcci lavorativi e sociali.

La lista dei player che offrono soluzioni e servizi si allunga ogni giorno di più. Prepariamoci a cambiare, a reinventarci e ad evolvere. Per l’ennesima volta.