Modelli di linguaggio: cosa sono, perché se ne parla tanto e che futuro avranno

I modelli di linguaggio di grandi dimensioni (Substantial Language Product, LLM) sono oggi al centro del dibattito soprattutto grazie a ChatGPT, che ha contribuito alla democratizzazione delle IA, rendendone disponibile l’uso a tutti e quindi anche a chi è completamente digiuno di conoscenze specifiche.

Tuttavia, la loro storia inizia ufficialmente durante gli anni Sessanta del secolo scorso quando, dai laboratori del Massachusetts Institute of Technological know-how (MIT) è uscito Eliza, quello che può essere considerato il primo chatbot al mondo, ha dato forma all’elaborazione del linguaggio naturale che oggi sta vivendo un’ennesima giovinezza, conquistando un’ampia platea di utilizzatori e vaste declinazioni d’uso.

Per capire meglio qual è il futuro dei modelli di linguaggio di grandi dimensioni ci siamo avvalsi dell’esperienza di Alessio Pomaro, ingegnere e Head of Synthetic Intelligence di Search On Media Group.

Numeri

Da 6 a 180 miliardi di dollari l’anno: gli investimenti nelle IA cresciuti di 30 volte dal 2013

di Emanuele Capone

26 Aprile 2023

Cosa sono i modelli di linguaggio

I modelli di linguaggio di grandi dimensioni (LLM) costituiscono una costola dell’apprendimento automatico capace di comprendere e generare linguaggio umano. For every farlo sfrutta le reti neurali profonde, tecniche in grado di elaborare grandi moli di dati e di emulare il cervello umano. Al riparo dai tecnicismi: un modello di linguaggio è un computer software che simula il linguaggio umano usando calcoli statistici e algoritmi e che, analizzando grandi quantità di dati, impara a prevedere la parola successiva in una frase tenendo conto del contesto.

In quali ambiti sono usati

La risposta breve è “in ogni ambito” e questo accade proprio perché, usando un dizionario specifico for every addestrarli, i modelli di linguaggio si muovono con una certa disinvoltura in domini circoscritti come il diritto, la medicina, il turismo, l’agricoltura e molti altri ancora considerando anche che, il loro uso declinato alla creazione di Chatbot, consente di rispondere a domande specifiche entrando così a buon diritto nel mondo dell’assistenza ai clienti, contesto nel quale, tuttavia, c’è ancora molto da fare for each aumentare la qualità. Non di meno, sono usati per generare testo, immagini, audio, movie e anche codice di programmazione. Factotum digitali che stanno aprendo nuove porte, stanno suscitando nuove domande e risollevando vecchi problemi.

Forse, più che parlare di ambiti, è meglio parlare di logiche che permettono la diffusione dei LLM, appear spiega Alessio Pomaro: “Stiamo osservando arrive application, CMS, piattaforme, sistemi operativi stanno integrando questa tipologia di modelli, facendoli diventare delle funzionalità avanzate o degli assistenti evoluti che ormai gli utenti si aspettano. Google, per esempio, sta facendo evolvere Duet AI all’interno di Workspace, Microsoft sta integrando Copilot su Windows e in ogni software program della sua suite, Amazon ha creato Q, un assistente all’interno di AWS, Adobe ha dotato Photoshop di strumenti avanzati for each l’editing delle immagini e ha anticipato un lavoro sbalorditivo nell’editing video, e così by using, fino advert arrivare all’integrazione dei modelli di linguaggio nel futuro della ricerca on-line (for every esempio Copilot su Bing, Search Generative Encounter di Google, Perplexity). Dal punto di vista delle aziende, i modelli generativi offriranno strumenti sempre più avanzati integrati nei flussi operativi for every la ricerca e l’elaborazione dei dati, e for each ottenere automazioni sempre più profonde. Oggi si parla sempre più spesso del concetto di RAG (Retrieval Augmented Generation), ovvero di sistemi in grado di interfacciare raccolte di dati di grandi dimensioni (potenzialmente la expertise aziendale) a un modello di linguaggio for each facilitarne l’estrazione, l’elaborazione e la trasformazione in diversi output. Stanno anche nascendo delle strutture dati dedicate a questi sistemi per renderli estremamente performanti e sicuri, for each esempio Infinity, The AI-indigenous database”.

Modelli personalizzati

I LLM possono essere personalizzati al good di usare dati di cui un’azienda dispone, pratica attuale che in futuro sarà sempre più diffusa: “La personalizzazione su larga scala è un altro effetto che deriverà dai modelli generativi, che permetteranno alle aziende di estendere operazioni oggi irrealizzabili a causa dell’elevato sforzo che comporterebbero. Uber India, in occasione del decimo anniversario del model, ha inviato un video personalizzato a tutti i dipendenti in cui l’attore Sonu Sood saluta ognuno for each nome. Questo è stato possibile con un’unica ripresa e grazie ad algoritmi generativi in grado di modificare il video clip clonando la voce, inserendo delle parti dinamiche e attuando la sincronizzazione labiale (lip sync), il tutto in indiano e inglese”, spiega Pomaro.

https://www.youtube.com/look at?v=4pB5zIQvU_U

C’è ancora molto da fare

A ognuno è capitato di usare una Chatbot, tipicamente nel tentativo di interfacciarsi con il servizio clienti di un fornitore. Per lo più si tratta di esperienze a tratti persino irritanti che restituiscono la sensazione di dialogare con qualcosa di stupido. “Di certo abbiamo sperimentato un’era di assistenti virtuali abbastanza ‘triste’ – spiega Pomaro – che ci ha reso vittime di risposte della serie ‘scusa, non ho capito’, e che ha stimolato un’inevitabile diffidenza nei confronti di questi sistemi. Tutto questo è stato causato da una tecnologia acerba. Successivamente abbiamo visto cos’è successo: i modelli di linguaggio si sono evoluti con un’accelerazione impressionante, grazie al miglioramento strutturale e alla scala dei dati di teaching. Mi sento di dire che oggi, la parentesi triste nello sviluppo degli assistenti virtuali è stata chiusa for every aprirne una caratterizzata da una grande flessibilità, che produrrà sistemi in grado di interagire con gli utenti in modo multimodale, non solo attraverso chat testuali, ma anche attraverso scambi di immagini, documenti, audio, e in più lingue. I LLM ci permetteranno di facilitare l’abbattimento della barriera linguistica”.

Con l’evolvere dei LLM e delle tecnologie a questi correlate, ci si deve confrontare anche con problemi non inediti ma amplificati.

I problemi da risolvere

Ogni forma di progresso porta con sé dei problemi e i LLM non fanno eccezione. I modelli linguistici lavorano sui dati (input) e, nonostante le fasi di addestramento, possono sortire effetti indesiderati: “L’altra faccia della medaglia è rappresentata dai rischi e dalle sfide a cui i LLM ci mettono di fronte, e che possiamo sintetizzare in various aree. L’affidabilità, specialmente in situazioni advert alto rischio. I modelli possono funzionare bene nei benchmark ma fallire in modi inaspettati quando affrontano dati reali o enter leggermente modificati. La privateness: i LLM presentano significativi rischi for each la privacy poiché aggregano enormi quantità di dati, che possono includere informazioni sensibili”.

C’è poi la questione del copyright che rimanda alla cronaca recente: alla great del 2023 Il New York Times ha fatto causa a OpenAI e a Microsoft perché le rispettive Intelligenze artificiali sfruttano e riproducono porzioni di testo coperte dai diritti d’autore. “Stiamo anche osservando numerose denunce da parte di utenti che stanno generando immagini che con tutta probabilità derivano da un coaching su dati coperti da copyright”, aggiunge Pomaro che cita anche i bias derivanti dai dati con i quali i modelli vengono addestrati.

Lo studio

L’intelligenza artificiale e la politica: ChatGPT è di sinistra, Google di destra

di Bruno Ruffilli

14 Agosto 2023

L’Open resource e i LLM

Ci sono progetti Open up source che, di fatto, rendono più facile l’accesso e l’uso dei LLM (un esempio è The Cheshire Cat) e questo può amplificare la gittata dei rischi così appear quella dei vantaggi. Come si regolamenta l’uso dei modelli Open? C’è il rischio di perdere il controllo delle implicazioni etiche dei LLM? Sono due domande lecite che meritano una risposta: “Ci sono correnti di pensiero secondo le quali i modelli Open source potrebbero aumentare i rischi derivanti dall’AI Generativa. Tuttavia, credo che gli open basis design possano essere importanti in termini di sicurezza for each diversi motivi”, spiega Pomaro.

“In primo luogo, i modelli aperti consentono un’enorme quantità di ricerche sulla sicurezza estremamente necessarie, in secondo luogo i modelli aperti offrono trasparenza e verificabilità. Gran parte dell’ecosistema di Web, for every esempio, si basa su software program Open supply (Linux, Apache, MySQL, eccetera) e questo l’ha reso più sicuro. Info la facilità di jailbreak, ovvero di azioni che mirano ad aggirare i controlli di sicurezza, è chiaro che abbiamo scarsa comprensione e controllo sui modelli attuali, e i modelli aperti espongono a questo rischio. Questo aspetto va risolto attraverso la ricerca, prima di basare un’intera infrastruttura critica su sistemi instabili”.

I modelli Open up supply possono essere usati in modo non opportuno, ma a prevalere sono gli atteggiamenti delle comunità che li sostengono e contribuiscono a regolarne lo sviluppo e l’impiego. “Di fatto, i principi dell’Open supply sono gli stessi, che si tratti di Intelligenza artificiale o di altre tecnologie”.

Cosa serve per superare i problemi

Si parla spesso di una cultura necessaria ad accettare e a gestire il cambiamento in corso. Cosa certamente vera che, però, merita una migliore inquadratura: cosa favorisce lo sviluppo di questa cultura? “L’evoluzione tecnologica per rendere questi sistemi sempre più affidabili e trasparenti sulle correlazioni tra le fonti e gli output. I nuovi sistemi di governance per regolamentare il schooling e l’utilizzo. Questo non per limitare la ricerca e lo sviluppo, ma for each aumentare la comprensione e per capire quali sono le direzioni percorribili”, conclude Pomaro.

Futuro

Comportamenti emergenti, quando l’intelligenza artificiale sorprende anche i suoi creatori

di Andrea Daniele Signorelli

30 Marzo 2023

Leggi di più su repubblica.it

Modelli di linguaggio: cosa sono, perché se ne parla tanto e che futuro avranno

Da 6 a 180 miliardi di dollari l’anno: gli investimenti nelle IA cresciuti di 30 volte dal 2013

Cosa sono i modelli di linguaggio

In quali ambiti sono usati

Modelli personalizzati

C’è ancora molto da fare

I problemi da risolvere

L’intelligenza artificiale e la politica: ChatGPT è di sinistra, Google di destra

L’Open resource e i LLM

Cosa serve per superare i problemi

Comportamenti emergenti, quando l’intelligenza artificiale sorprende anche i suoi creatori

Written by bourbiza mohamed

“Cosa sono gli NFT” è una domanda che vale ancora la pena farsi

Che cosa sono i crimini di guerra e chi li processa

IT Academy Masterclass – Cosa sono “AI Policy” e “AI Impact Analysis” e perché ne avete bisogno

Valditara, giovani sono lampade che aspettano di essere accese – Notizie

Naufragio invisibile nello Ionio, interrogazione di Avs in Parlamento: “Perché i soccorsi sono partiti tardi?”

IA in corsia al posto dei medici: gli italiani sono scettici

Lyca Cellular lancia il 5G: offerte dedicate con minuti, SMS e fino a 250 Giga da 7,99 euro – MondoMobileWeb.it | Information | Telefonia

Teufel Real Blue Pro, la prova: le cuffie con ANC per chi vuole distinguersi

284 mila italiani si sono opposti al trasferimento dei dati nel Fascicolo sanitario elettronico

FiberCop operatore wholesale nomina Sarmi Presidente e Ferraris Amministratore Delegato – MondoMobileWeb.it | Information | Telefonia

Lascia un commento Annulla risposta

Tre giovani dispersi per la piena del Natisone in Friuli, l’abbraccio disperato poi la piena li ha travolti – Notizie

TIMVISION con DAZN, ecco le nuove offerte sportive mensili e annuali dal 9 Giugno 2024 – MondoMobileWeb.it | News | Telefonia

Very Mobile: portafoglio da 2,99 euro al mese prorogato di un paio di giorni – MondoMobileWeb.it | News | Telefonia

xTE TIM Cross da 5,99 euro al mese: nuovo portafoglio con 5G fino a 250 Mbps o 5G Ultra – MondoMobileWeb.it | News | Telefonia

aprono Fabio De Luigi e Roberto Mercadini

gita da incubo per dei giovani riminesi

Il comunicato del Cdr: “ A fianco dei colleghi che seguono la guerra. No alle strumentalizzazioni”

13,000+ People Have Bought Our Theme

Which Company Would You Choose?

Nexus 6 review

Simple Ways To Reduce Your Unwanted Wrinkles!

Primo consiglio comunale, il giuramento del sindaco Lattuca. Filippo Rossini è il nuovo presidente

New! A Stain Remover That Works Like Magic