in

Modelli di linguaggio: cosa sono, perché se ne parla tanto e che futuro avranno


I modelli di linguaggio di grandi dimensioni (Substantial Language Product, LLM) sono oggi al centro del dibattito soprattutto grazie a ChatGPT, che ha contribuito alla democratizzazione delle IA, rendendone disponibile l’uso a tutti e quindi anche a chi è completamente digiuno di conoscenze specifiche.

Tuttavia, la loro storia inizia ufficialmente durante gli anni Sessanta del secolo scorso quando, dai laboratori del Massachusetts Institute of Technological know-how (MIT) è uscito Eliza, quello che può essere considerato il primo chatbot al mondo, ha dato forma all’elaborazione del linguaggio naturale che oggi sta vivendo un’ennesima giovinezza, conquistando un’ampia platea di utilizzatori e vaste declinazioni d’uso.

Per capire meglio qual è il futuro dei modelli di linguaggio di grandi dimensioni ci siamo avvalsi dell’esperienza di Alessio Pomaro, ingegnere e Head of Synthetic Intelligence di Search On Media Group.

Numeri

Da 6 a 180 miliardi di dollari l’anno: gli investimenti nelle IA cresciuti di 30 volte dal 2013


Cosa sono i modelli di linguaggio

I modelli di linguaggio di grandi dimensioni (LLM) costituiscono una costola dell’apprendimento automatico capace di comprendere e generare linguaggio umano. For every farlo sfrutta le reti neurali profonde, tecniche in grado di elaborare grandi moli di dati e di emulare il cervello umano. Al riparo dai tecnicismi: un modello di linguaggio è un computer software che simula il linguaggio umano usando calcoli statistici e algoritmi e che, analizzando grandi quantità di dati, impara a prevedere la parola successiva in una frase tenendo conto del contesto.

In quali ambiti sono usati

La risposta breve è “in ogni ambito” e questo accade proprio perché, usando un dizionario specifico for every addestrarli, i modelli di linguaggio si muovono con una certa disinvoltura in domini circoscritti come il diritto, la medicina, il turismo, l’agricoltura e molti altri ancora considerando anche che, il loro uso declinato alla creazione di Chatbot, consente di rispondere a domande specifiche entrando così a buon diritto nel mondo dell’assistenza ai clienti, contesto nel quale, tuttavia, c’è ancora molto da fare for each aumentare la qualità. Non di meno, sono usati per generare testo, immagini, audio, movie e anche codice di programmazione. Factotum digitali che stanno aprendo nuove porte, stanno suscitando nuove domande e risollevando vecchi problemi.

Forse, più che parlare di ambiti, è meglio parlare di logiche che permettono la diffusione dei LLM, appear spiega Alessio Pomaro: “Stiamo osservando arrive application, CMS, piattaforme, sistemi operativi stanno integrando questa tipologia di modelli, facendoli diventare delle funzionalità avanzate o degli assistenti evoluti che ormai gli utenti si aspettano. Google, per esempio, sta facendo evolvere Duet AI all’interno di Workspace, Microsoft sta integrando Copilot su Windows e in ogni software program della sua suite, Amazon ha creato Q, un assistente all’interno di AWS, Adobe ha dotato Photoshop di strumenti avanzati for each l’editing delle immagini e ha anticipato un lavoro sbalorditivo nell’editing video, e così by using, fino advert arrivare all’integrazione dei modelli di linguaggio nel futuro della ricerca on-line (for every esempio Copilot su Bing, Search Generative Encounter di Google, Perplexity). Dal punto di vista delle aziende, i modelli generativi offriranno strumenti sempre più avanzati integrati nei flussi operativi for every la ricerca e l’elaborazione dei dati, e for each ottenere automazioni sempre più profonde. Oggi si parla sempre più spesso del concetto di RAG (Retrieval Augmented Generation), ovvero di sistemi in grado di interfacciare raccolte di dati di grandi dimensioni (potenzialmente la expertise aziendale) a un modello di linguaggio for each facilitarne l’estrazione, l’elaborazione e la trasformazione in diversi output. Stanno anche nascendo delle strutture dati dedicate a questi sistemi per renderli estremamente performanti e sicuri, for each esempio Infinity, The AI-indigenous database”.

Modelli personalizzati

I LLM possono essere personalizzati al good di usare dati di cui un’azienda dispone, pratica attuale che in futuro sarà sempre più diffusa: “La personalizzazione su larga scala è un altro effetto che deriverà dai modelli generativi, che permetteranno alle aziende di estendere operazioni oggi irrealizzabili a causa dell’elevato sforzo che comporterebbero. Uber India, in occasione del decimo anniversario del model, ha inviato un video personalizzato a tutti i dipendenti in cui l’attore Sonu Sood saluta ognuno for each nome. Questo è stato possibile con un’unica ripresa e grazie ad algoritmi generativi in grado di modificare il video clip clonando la voce, inserendo delle parti dinamiche e attuando la sincronizzazione labiale (lip sync), il tutto in indiano e inglese”, spiega Pomaro.

https://www.youtube.com/look at?v=4pB5zIQvU_U

C’è ancora molto da fare

A ognuno è capitato di usare una Chatbot, tipicamente nel tentativo di interfacciarsi con il servizio clienti di un fornitore. Per lo più si tratta di esperienze a tratti persino irritanti che restituiscono la sensazione di dialogare con qualcosa di stupido. “Di certo abbiamo sperimentato un’era di assistenti virtuali abbastanza ‘triste’ – spiega Pomaro – che ci ha reso vittime di risposte della serie ‘scusa, non ho capito’, e che ha stimolato un’inevitabile diffidenza nei confronti di questi sistemi. Tutto questo è stato causato da una tecnologia acerba. Successivamente abbiamo visto cos’è successo: i modelli di linguaggio si sono evoluti con un’accelerazione impressionante, grazie al miglioramento strutturale e alla scala dei dati di teaching. Mi sento di dire che oggi, la parentesi triste nello sviluppo degli assistenti virtuali è stata chiusa for every aprirne una caratterizzata da una grande flessibilità, che produrrà sistemi in grado di interagire con gli utenti in modo multimodale, non solo attraverso chat testuali, ma anche attraverso scambi di immagini, documenti, audio, e in più lingue. I LLM ci permetteranno di facilitare l’abbattimento della barriera linguistica”.

Con l’evolvere dei LLM e delle tecnologie a questi correlate, ci si deve confrontare anche con problemi non inediti ma amplificati.

I problemi da risolvere

Ogni forma di progresso porta con sé dei problemi e i LLM non fanno eccezione. I modelli linguistici lavorano sui dati (input) e, nonostante le fasi di addestramento, possono sortire effetti indesiderati: “L’altra faccia della medaglia è rappresentata dai rischi e dalle sfide a cui i LLM ci mettono di fronte, e che possiamo sintetizzare in various aree. L’affidabilità, specialmente in situazioni advert alto rischio. I modelli possono funzionare bene nei benchmark ma fallire in modi inaspettati quando affrontano dati reali o enter leggermente modificati. La privateness: i LLM presentano significativi rischi for each la privacy poiché aggregano enormi quantità di dati, che possono includere informazioni sensibili”.

C’è poi la questione del copyright che rimanda alla cronaca recente: alla great del 2023 Il New York Times ha fatto causa a OpenAI e a Microsoft perché le rispettive Intelligenze artificiali sfruttano e riproducono porzioni di testo coperte dai diritti d’autore. “Stiamo anche osservando numerose denunce da parte di utenti che stanno generando immagini che con tutta probabilità derivano da un coaching su dati coperti da copyright”, aggiunge Pomaro che cita anche i bias derivanti dai dati con i quali i modelli vengono addestrati.

Lo studio

L’intelligenza artificiale e la politica: ChatGPT è di sinistra, Google di destra



L’Open resource e i LLM

Ci sono progetti Open up source che, di fatto, rendono più facile l’accesso e l’uso dei LLM (un esempio è The Cheshire Cat) e questo può amplificare la gittata dei rischi così appear quella dei vantaggi. Come si regolamenta l’uso dei modelli Open? C’è il rischio di perdere il controllo delle implicazioni etiche dei LLM? Sono due domande lecite che meritano una risposta: “Ci sono correnti di pensiero secondo le quali i modelli Open source potrebbero aumentare i rischi derivanti dall’AI Generativa. Tuttavia, credo che gli open basis design possano essere importanti in termini di sicurezza for each diversi motivi”, spiega Pomaro.

“In primo luogo, i modelli aperti consentono un’enorme quantità di ricerche sulla sicurezza estremamente necessarie, in secondo luogo i modelli aperti offrono trasparenza e verificabilità. Gran parte dell’ecosistema di Web, for every esempio, si basa su software program Open supply (Linux, Apache, MySQL, eccetera) e questo l’ha reso più sicuro. Info la facilità di jailbreak, ovvero di azioni che mirano ad aggirare i controlli di sicurezza, è chiaro che abbiamo scarsa comprensione e controllo sui modelli attuali, e i modelli aperti espongono a questo rischio. Questo aspetto va risolto attraverso la ricerca, prima di basare un’intera infrastruttura critica su sistemi instabili”.

I modelli Open up supply possono essere usati in modo non opportuno, ma a prevalere sono gli atteggiamenti delle comunità che li sostengono e contribuiscono a regolarne lo sviluppo e l’impiego. “Di fatto, i principi dell’Open supply sono gli stessi, che si tratti di Intelligenza artificiale o di altre tecnologie”.

Cosa serve per superare i problemi

Si parla spesso di una cultura necessaria ad accettare e a gestire il cambiamento in corso. Cosa certamente vera che, però, merita una migliore inquadratura: cosa favorisce lo sviluppo di questa cultura? “L’evoluzione tecnologica per rendere questi sistemi sempre più affidabili e trasparenti sulle correlazioni tra le fonti e gli output. I nuovi sistemi di governance per regolamentare il schooling e l’utilizzo. Questo non per limitare la ricerca e lo sviluppo, ma for each aumentare la comprensione e per capire quali sono le direzioni percorribili”, conclude Pomaro.

 

Futuro

Comportamenti emergenti, quando l’intelligenza artificiale sorprende anche i suoi creatori



 



Leggi di più su repubblica.it

Written by bourbiza mohamed

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

gita da incubo per dei giovani riminesi

Il comunicato del Cdr: “ A fianco dei colleghi che seguono la guerra. No alle strumentalizzazioni”