AI per insegnanti e prof 10: le Reti Neurali

Il funzionamento delle Reti Neurali: il Cervello dell’AI

Francesca Cavazzoni
storIAzine
6 min readMar 16, 2024

--

Si rende necessario, prima di continuare nelle nostre sperimentazioni didattiche, creare un momento di riflessione sulla tecnologia che rende possibile l’esercizio delle varie proposte innovative presentate. Maneggiamo strumenti che funzionano grazie ad un motore interno rivoluzionario. Senza avere la pretesa di essere esaustiva ritengo ugualmente doveroso, per ragioni di completezza ed uso critico, focalizzare l’attenzione di questo nuovo articolo sulla spiegazione, semplice ma intuitiva, del modo in cui gli strumenti impiegati funzionano dall’interno. Le reti neurali rappresentano l’essenza stessa dell’Intelligenza Artificiale, un mondo intricato e affascinante che si sviluppa grazie a modelli computazionali ispirati al funzionamento del cervello umano. Queste strutture, capaci di apprendere, adattarsi e risolvere problemi complessi, costituiscono infatti il fondamento su cui poggiano molte delle più avanzate tecnologie emergenti.

L’Architettura delle Reti Neurali: Neuroni Artificiali e Connessioni Sinaptiche

Immagina di poter scomporre una rete neurale fino alla sua componente fondamentale: il neurone artificiale. Queste unità di elaborazione basilari, analoghe ai neuroni biologici, costituiscono il fulcro della struttura neurale. Ogni neurone riceve input da fonti esterne o da altri neuroni, ponderati in base alla loro importanza attraverso connessioni sinaptiche. L’elaborazione di questi input avviene attraverso funzioni di attivazione, che determinano se e quanto il neurone deve attivarsi, producendo così un output che viene trasmesso ad altri neuroni. Volendo proporre una rappresentazione visiva di tale funzionamento, si potrebbe immaginare un cerchio dal quale partono e arrivano una serie di frecce che rappresentano gli input pesati e l’output. In una simile raffigurazione geometrica vanno inserite anche le connessioni con l’esterno o con altri neuroni, ovvero le sinapsi. Questo intricato sistema di interconnessioni e elaborazione dei dati forma la base su cui si costruiscono le reti neurali, sia fisiche, tramite circuiti, che immateriali, sotto forma di software eseguiti su computer di varie dimensioni e potenze.

Dalla Teoria alla Pratica: Architetture delle Reti Neurali

Le reti neurali possono assumere diverse forme e configurazioni, in base alle esigenze specifiche dell’applicazione. Dalle reti neurali feed-forward, in cui i dati scorrono in una sola direzione, passando attraverso uno o più strati nascosti fino a raggiungere uno strato di output, alle più complesse reti neurali convoluzionali (CNN), utilizzate per l’elaborazione delle immagini, e reti neurali ricorrenti (RNN), in cui le connessioni possono andare avanti e indietro tra gli strati e all’interno dello stesso strato. Queste ultime, utilizzate per l’elaborazione del linguaggio naturale, ampliano ulteriormente le potenzialità delle reti neurali, consentendo una maggiore flessibilità nell’analisi e nell’interpretazione dei dati.

L’Innovazione Continua: Dalle Reti Neurali alle Tecnologie Transformer

Negli ultimi anni, l’avvento delle tecnologie Transformer ha rappresentato una svolta significativa nel campo dell’Intelligenza Artificiale. A differenza delle tradizionali reti neurali, i Transformer non elaborano i dati in modo sequenziale, ma utilizzano un meccanismo noto come “attenzione” per concentrarsi su parti specifiche dell’input, determinando l’importanza di ciascun elemento del contesto. I Large Language Model (LLM) e le Text to Image (TTI) sono esempi di reti neurali Trasformer. Ma le reti neurali non funzionano da sole come se fossero strumenti pensanti autogenerate, e non è sufficiente neppure pensare di limitarsi a saperle programmare. C’è bisogno di un addestramento che si realizza mediante dei dati proposti come input e dati in pasto alla macchina che li deve processare per restituire un output valutato a sua volta da un essere umano o da un’altra macchina.

Il Ciclo Vitale dell’Apprendimento: Un’Esplorazione Continua

L’addestramento delle reti neurali è un processo dinamico e iterativo, che richiede l’esposizione a un vasto set di dati di addestramento per acquisire la capacità di generalizzare a nuovi esempi. Questo processo, supervisionato da esperti di machine learning, prevede la costante regolazione dei parametri del modello per garantire un apprendimento efficace e preciso. Una volta addestrato, il modello può essere testato su un nuovo set di dati, valutandone la capacità di generalizzare e adattarsi a situazioni diverse da quelle di addestramento. Per esempio, se si volesse creare un modello in grado di riconoscere se una foto raffigura un bambino o un panino si dovrà dare in pasto alla macchina una serie di immagini raffiguranti panini e bambini e ciascuna di queste è etichettata in modo che la macchina riceva per ciascun immagine l’etichetta associata bambino o panino. Una volta addestrato, il modello dovrebbe essere in grado di riconoscere immagini di entrambe le figure, siano esse bambini o panini, anche quando vengono presentate situazioni mai viste prima nel dataset di addestramento. Arrivati a quel punto occorre valutare l’output e verificare se le previsioni del modello corrispondono all’effettiva etichetta delle immagini. Se viene mostrato al modello la foto di un bambino che non ha mai visto prima, l’aspettativa si determina nella capacità del modello di compiere un’inferenza e restituire come output l’etichetta bambino. Se così non fosse, allora il modello ha commesso un errore e dovrà essere ulteriormente addestrato. Tale processo di addestramento prima e valutazione poi si ripete per un gran numero di volte con il modello che gradualmente raffina la propria capacità di distinguere tra bambini e panini. Operativamente, si può dire che il modello impari modificando i pesi associati alle connessioni neurali in modo da migliorare progressivamente la sua precisione. Qualora si decidesse, invece, di realizzare un modello di apprendimento non supervisionato, fornendo al sistema solo dati di input, l’obiettivo non è pretendere il riconoscimento dell’etichetta panino o bambino quando viene fornita un’immagine di un bambino o di un panino, quanto trovare tra i dati di input dei pattern ricorrenti. Ciò implica l’aggregazione dei dati in cluster sulla base della loro somiglianza, compiendo il cosiddetto clustering, oppure trovare delle regole che descrivano e ipotizzino relazioni tra vari elementi (regole di associazioni). Nulla di nuovo per chi è cliente Amazon, Netflix, o usufruisce dei social consultando i feed, in quanto questi strumenti agiscono con sistemi di raccomandazione basati su regole di associazione. In parole povere, il fantomatico algoritmo, ostracizzato da tutti e fruito inconsapevolmente da tutti, analizza i comportamenti di acquisto o di visualizzazione dei clienti ed è in grado di rintracciare associazioni tra diversi prodotti, libri, serie tv o film.

Arrivando a Chatgpt

La complessità della funzione svolta da ChatGPT, il quale rappresenta la StoriIa più rilevante nel campo dell’intelligenza artificiale, risiede nel suo approccio all’apprendimento dei pattern linguistici, che si discosta dall’utilizzo puramente probabilistico. Questo modus operandi rispecchia in modo sorprendente il processo creativo umano: proprio come noi esseri umani, ChatGPT genera testi basandosi su una distribuzione probabile delle parole, applicando regole grammaticali, sintattiche, stilistiche e semantiche. Tale parallelismo evidenzia la complessità intrinseca dell’elaborazione linguistica, che coinvolge una serie di processi cognitivi e interpretativi anche nella mente artificiale. Tuttavia, mentre l’essere umano si basa su un bagaglio culturale e cognitivo accumulato nel corso della vita, ChatGPT sfrutta una serie di algoritmi sofisticati che gli consentono di comprendere e generare linguaggio in modo simile, seppur differente, a noi. Una delle peculiarità distintive di ChatGPT risiede nella sua capacità di utilizzare distanze vettoriali tra le parole per creare una rappresentazione complessa del linguaggio. In sostanza, attraverso questo meccanismo, ChatGPT crea una rete intricata di connessioni semantiche tra le parole stesse, il che gli consente di comprendere e generare testi in tutte le lingue del mondo, comprese quelle inventate.

È fondamentale sottolineare che ChatGPT e tecnologie simili non sono da considerarsi come sostituti dell’intelletto umano, ma piuttosto come collaboratori. Loro ruolo primario è quello di assistere nell’elaborazione e nella rifinitura delle risposte umane, nonché nell’apporto di idee e suggerimenti per migliorare il processo creativo. Queste tecnologie agiscono come veri e propri collaboratori nell’atto della scrittura, producendo materiali di supporto anziché contenuti finiti. Pertanto, l’interazione tra l’utente umano e ChatGPT si traduce in un processo sinergico, in cui entrambe le parti contribuiscono al raggiungimento di risultati soddisfacenti e innovativi.

--

--