L’intelligenza artificiale diventa bilingue, e senza dizionario
Due metodi di apprendimento non supervisionato sono riusciti a creare un dizionario bilingue senza alcun intervento umano
La traduzione automatica del linguaggio ha fatto molta strada, grazie alle reti neurali — algoritmi computerizzati che traggono ispirazione dal cervello umano. Ma l’ ‘allenamento’ di tali reti richiede un’enorme quantità di dati: milioni di traduzioni frase per frase per dimostrare in che modo un essere umano svolga lo stesso compito. Ora, due nuovi documenti mostrano che le reti neurali possono imparare a tradurre senza testi paralleli, un’evoluzione sorprendente che potrebbe rendere i documenti scritti in diverse lingue più accessibili.
“Immaginate di dare ad una persona un sacco di libri cinesi e arabi — nessuno dei quali si sovrappone — e la persona deve imparare a tradurre il cinese in arabo. Sembra impossibile, giusto?” dice il primo autore di uno dei due studi, Mikel Artetxe, informatico dell’Università dei Paesi Baschi (UPV) di San Sebastiàn, Spagna. “Ma noi mostriamo che un computer può farlo.”
La maggior parte dei processi di machine learning, in cui le reti neurali e gli altri algoritmi di calcolo imparano dall’esperienza, è “supervisionata”: un computer immagina la soluzione, riceve la risposta giusta e regola il suo processo di conseguenza. Questo funziona bene quando si insegna al computer a tradurre tra inglese e francese, perché molti documenti esistono in entrambe le lingue. Non funziona così bene per le lingue rare, o per quelle diffuse ma senza molti testi paralleli.
I due nuovi paper di ricerca, entrambi inviati alla Conferenza Internazionale delle Rappresentanze dell’Apprendimento del prossimo anno, ma che non sono stati oggetto di revisione paritetica, si concentrano su un altro metodo: l’apprendimento automatico senza supervisione. Per cominciare, ciascuno costruisce dizionari bilingue senza l’aiuto di un insegnante umano che dice loro quando hanno ragione. Questo è possibile perché le lingue hanno forti somiglianze nei modi in cui le parole si raggruppano l’una intorno all’altra. Le parole per tavolo e sedia, ad esempio, sono spesso usate insieme in tutte le lingue. Quindi, se un computer mappa queste co-occorrenze come un gigantesco atlante stradale vedendo le parole come delle città, le mappe per le diverse lingue si somiglieranno, ma avranno nomi diversi. Un computer può quindi capire il modo migliore per sovrapporre un atlante su un altro. Voilà! Ecco un dizionario bilingue.
Le due nuove ricerche, che utilizzano metodi notevolmente simili, possono anche tradurre al livello delle frasi. Entrambi utilizzano due strategie di formazione, chiamate traduzione a ritroso e denoising. Nella traduzione a ritroso, una frase in una lingua viene grosso modo tradotta nell’altra, poi tradotta nuovamente nella lingua originale. Se la frase ri-tradotta non è identica all’originale, le reti neurali vengono regolate in modo che la prossima volta siano più simili. Il denoising è simile alla traduzione a ritroso, ma invece di passare da una lingua all’altra e viceversa, aggiunge rumore a una frase (riordinando o rimuovendo le parole) e cerca di tradurla nuovamente nell’originale. Insieme, questi metodi insegnano alle reti la struttura più profonda del linguaggio.
Ci sono lievi differenze tra le tecniche. Il sistema ideato da UPV traduce più frequentemente durante l’allenamento. L’altro sistema, creato dallo scienziato informatico di Facebook Guillaume Lample, con sede a Parigi, e dai suoi collaboratori, aggiunge un ulteriore passo avanti durante la traduzione. Entrambi i sistemi codificano una frase da una lingua in una rappresentazione più astratta prima di decodificarla nell’altra lingua, ma il sistema di Facebook verifica che il “linguaggio” intermedio sia veramente astratto. Artetxe e Lample dicono entrambi di poter migliorare i loro risultati applicando l’uno le tecniche descritte dall’altro.
Nell’unico risultato direttamente confrontabile tra i due paper — la traduzione tra inglese e francese del testo ricavato dalla stessa serie di circa 30 milioni di frasi — entrambi hanno ottenuto un punteggio di sottovalutazione bilingue (usato per misurare l’accuratezza delle traduzioni) di circa 15 in entrambe le direzioni. Questo non è così alto come Google Translate, un metodo supervisionato che ha un punteggio di circa 40, o gli esseri umani, che possono ottenere più di 50 punti, ma è meglio della traduzione parola per parola. Gli autori dicono che i sistemi potrebbero essere facilmente migliorati diventando semisupervisonati — ovvero, aggiungendo qualche migliaio di frasi parallele alla loro formazione.
Oltre alla traduzione tra le lingue senza molti testi paralleli, sia Artetxe che Lample dicono che i loro sistemi potrebbero aiutare negli abbinamenti comuni come l’inglese e il francese se i testi paralleli sono tutti dello stesso tipo, come i reportage dei giornali, ma si vuole tradurre in un nuovo registro come lo slang di strada o il gergo medico. “Ma siamo appena all’inizio,” avverte il co-autore di Artetxe Eneko Agirre. “Abbiamo appena aperto una nuova via di ricerca, quindi non sappiamo dove vada.”
“È scioccante sapere che il computer potrebbe imparare a tradurre anche senza la supervisione umana,” dice Di He, un informatico di Microsoft a Pechino il cui lavoro ha influenzato entrambi i documenti. Artetxe dice che il suo metodo e quello di Lample, caricati su arXiv un giorno dopo l’altro, siano così simili è sorprendente. Ma allo stesso tempo, è fantastico. “Significa che l’approccio è veramente nella giusta direzione.”
Tradotto in Italiano. Articolo originale: Science
VISIONARI è un network di imprenditori, scienziati, artisti, scrittori e changemakers che pensano e agiscono al di fuori degli schemi.
Puoi fare domanda per entrare qui: https://bit.ly/visionari-entra
Seguici sulla nostra pagina Facebook per scoprire nuovi progetti innovativi:
Visionari