Chatbots, chatbots, chatbots… Parte 5

The Holy Hyperparameters…

Cosimo Iaia
3 min readMar 4, 2019

Grazie alle puntate precedenti (se ve le siete perse potete iniziare da qui): ora abbiamo il nostro cervello speziato con pizzichi di quelle variabili, sconosciute ai più, che chiamiamo hyperparameters.

Andiamo ora a vedere in dettaglio di cosa sono fatte e a cosa servono.

Una rete neurale, come abbiamo visto, è fatta di strati, layers, di variabili, celle ed operazioni matematiche che le permettono di funzionare a dovere. Tuttavia non tutte le reti neurali nascono uguali e non tutte imparano in fretta allo stesso modo ed altrettanto bene.

A differenziarle sono appunto, gli Hyperparameters: parametri numerici che definiscono come la nostra rete è fatta in dettaglio e come si comporterà nell'apprendimento.

In particolare, e nel caso specifico del nostro chatbot, queste variabili definiscono le dimensioni della rete stessa, degli input che può digerire, la sua ‘velocità’ nell'imparare, il tempo che spenderà a studiare i nostri esempi e quanto “alla lettera” dovrà impararli.

--

--

Cosimo Iaia

Creatore di Loquace, una famiglia di Large Language Model Italiani. Fondatore di ExMentisLab, il Laboratorio di Intelligenza Artificiale. www.exmentislab.it