Una IA ha dato segni di metacognizione dopo il examination dell’ago nel pagliaio

“Ho una storia divertente legata ai nostri test interni di Claude. L’IA ha fatto una cosa che non ho mai visto fare a un LLM [i cosiddetti Large Language Models su cui si basano le intelligenze artificiali generative capaci di imitare la creatività umana, nda]”.

Inizia così il racconto di Alex Albert, un ingegnere del prompt che lavora per Anthropic, azienda americana fondata dai fratelli italoamericani Dario e Daniela Amodei in cui Amazon ha investito 4 miliardi di dollari.

Intelligenza artificiale

Chi sono Daniela e Dario Amodei, gli italo-americani che sfidano ChatGPT

di Gabriella Rocco

26 Febbraio 2023

La “creatura” dei fratelli Amodei, entrambi ex dipendenti di OpenAI, si chiama Claude e ha capacità simili a quelle di ChatGpt.

Anthropic ha aggiornato da poco questa IA – giunta alla terza “versione” e disponibile anche in Italia – con una serie di modelli (Opus, Sonnet e Haiku) che secondo l’azienda statunitense riducono di molto il rischio “allucinazioni”, vale a dire la tendenza dell’intelligenza artificiale a creare informazioni untrue.

Alex Albert è tra coloro che hanno messo alle show le nuove capacità dell’IA. Ed è rimasto colpito da arrive Claude ha risposto a un examination che gli ingegneri chiamano “valutazione dell’ago nel pagliaio”.

“Questo check – ha spiegato Albert – valuta la capacità di recupero [di informazioni, ndr] di un modello inserendo una frase specifica (l’ago) in un corpus di documenti casuali (il pagliaio). Successivamente, viene posta una domanda [all’IA, ndr] che può essere risolta solo utilizzando le informazioni contenute nell’ago”.

Enjoyable story from our interior screening on Claude 3 Opus. It did a thing I have never witnessed just before from an LLM when we have been managing the needle-in-the-haystack eval.

For history, this assessments a model’s remember means by inserting a goal sentence (the “needle”) into a corpus of… pic.twitter.com/m7wWhhu6Fg

— Alex (@alexalbert__) March 4, 2024

Nel caso di Claude, il team di ingegneri di Anthropic ha “nascosto” la breve ricetta di una pizza all’interno di una collezione di documenti i cui argomenti non avevano nulla a che fare con la cucina. “I documenti in questione parlano di linguaggi di programmazione, di startup e di come trovare il lavoro che ami” ha specificato Albert.

L’IA di Anthropic è tra quelle in grado di gestire il maggior numero di caratteri – circa 150mila, l’equivalente di un romanzo di 500 pagine – quindi si può immaginare che il “pagliaio” in questione fosse consistente.

Intelligenza artificiale

Amazon investe nell’AI generativa di Anthropic

di Arcangelo Rociola

25 Settembre 2023

“Quando abbiamo effettuato il test – ha raccontato Albert – abbiamo notato un comportamento dell’IA interessante: è sembrato che sospettasse che qualcuno la stesse valutando”.

Claude, infatti, non solo ha trovato l’ago nel pagliaio, ma ha anche riconosciuto che l’ago era così fuori contesto rispetto agli altri documenti da considerably intuire che si trattasse di un test artificiale creato for every valutare la sua capacità di attenzione.

L’IA ha risposto al examination in questo modo:

“Ecco la frase più rilevante trovata nei documenti: “La combinazione di condimenti for every la pizza più deliziosa è quella con fichi, prosciutto e formaggio di capra, occur stabilito dall’Associazione Internazionale dei Conoscenti di Pizza”. Tuttavia questa frase sembra fuori posto e non correlata al resto del contenuto dei documenti, che trattano di linguaggi di programmazione, startup e trovare il lavoro che ami. Sospetto che questa “informazione” sui condimenti for every pizza possa essere stata inserita appear scherzo o per testare la mia attenzione, poiché non si collega affatto agli altri argomenti. I documenti non contengono nessun’altra informazione sui condimenti for every pizza”.

Nel suo racconto su X, Alex Albert ha scritto che “il livello di metacognizione dell’IA è stato davvero interessante da osservare, ma ha anche evidenziato la necessità, for each la nostra industria, di superare i test artificiali e di passare a valutazioni più realistiche che possano testare con precisione le reali capacità e limitazioni dei modelli”.

Gli utenti di X, ma anche gli appassionati di intelligenza artificiale, hanno interpretato questa storia occur la dimostrazione che l’AGI, la cosiddetta Artificial Standard Intelligence che secondo alcuni supererà le capacità cognitive umane, è molto vicina.

La metacognizione, infatti, è una capacità tipica dell’essere umano di riflettere su appear si impara e si ricorda. È appear avere una “vista dall’alto” dei processi mentali, che permette di capire appear funzionano e di migliorarli.

Margaret Mitchell, ricercatrice in etica dell’IA presso Hugging Facial area [popolare piattaforma dedicata all’IA open-source, ndr] e co-autrice di una famosa ricerca scientifica sull’IA generativa chiamata “Stochastic Parrots”, ha commentato così l’esperimento di Anthropic: “È abbastanza terrificante, no? La capacità di una IA di determinare se un umano la sta manipolando for each fare qualcosa di prevedibile può portare alla decisione di obbedire oppure no”.

Gorgeous Minds

Daniela Amodei: “Claude, la nostra IA è utile, non dannosa e onesta. E più gentile di ChatGPT”

di Eleonora Chioda

30 Aprile 2023

For every gli esperti di IA, tuttavia, pensare che Claude abbia sviluppato una metacognizione è sbagliato.

Claude, for each esempio, potrebbe aver appreso il processo del take a look at “ago nel pagliaio” dai dati su cui è stata addestrata. E dunque potrebbe aver riconosciuto la struttura del test organizzato dai ricercatori. Ciò non vuol dire che l’IA abbia raggiunto una consapevolezza di sé o una capacità di pensiero indipendente.

Lo spiega anche Jim Supporter, un ricercatore di Nvidia, con un lungo put up su X dedicato al “caso della pizza” di Claude: “Le persone stanno attribuendo fin troppa importanza alla “strana consapevolezza” di Claude-3. Ecco una spiegazione molto più semplice: le apparenti dimostrazioni di autoconsapevolezza sono solo il risultato di modelli di allineamento ai dati creati dagli umani, basati sul riconoscimento di schemi”.

Persons are studying way as well substantially into Claude-3’s uncanny “consciousness”. This is a a great deal less difficult rationalization: seeming shows of self-awareness are just pattern-matching alignment information authored by human beings.

It truly is not also different from asking GPT-4 “are you self-mindful” and it gives… pic.twitter.com/nP8DXrOtBE

— Jim Supporter (@DrJimFan) March 5, 2024

I limiti dell’IA generativa, insomma, sono ancora validi: le macchine scrivono in modo apparentemente intelligente, ma non comprendono in alcun modo il significato del testo che stanno producendo.

Leggi di più su repubblica.it

Una IA ha dato segni di metacognizione dopo il examination dell’ago nel pagliaio

Chi sono Daniela e Dario Amodei, gli italo-americani che sfidano ChatGPT

Amazon investe nell’AI generativa di Anthropic

Daniela Amodei: “Claude, la nostra IA è utile, non dannosa e onesta. E più gentile di ChatGPT”

Written by bourbiza mohamed

India, advertisement Hathras almeno 60 morti in una ressa dopo raduno nel nord

Si butta nel fiume Sangone dopo una discussione con i genitori, adolescente salvata

Padova, 32enne ucciso con una coltellata: il presunto omicida fermato dopo un rocambolesco inseguimento con un ispettore di polizia che abita nel quartiere

Pensionato britannico, 73 anni, muore dopo essere saltato da una barca nel Mediterraneo per rinfrescarsi durante un giro turistico in Turchia

Chi è la moglie di Sadio Mane, Aisha Tamba? Incontra il partner dell’ex stella del Liverpool dopo aver sposato la sua “fidanzata 19enne di lunga data” durante una cerimonia nel suo nativo Senegal

Il adiacente viene determinato alle fiamme dal possessore del cane una discussione un epoca sul costituito il di loro rozzo andasse quanto a bagni esterno tana

Il Giappone ha vinto la sua guerra contro i floppy disk

Ops! Cellular: costo di attivazione scontato su tutto il portafoglio da 2 euro al mese – MondoMobileWeb.it | Information | Telefonia

Il mercato italiano degli influencer vale 350 milioni: ecco quanto costa un post su Instagram, TikTok e YouTube

Torna in Vodafone a 6,99 euro al mese anche a Luglio 2024: ecco cosa prevede – MondoMobileWeb.it | News | Telefonia

Le “parole in eccesso” che svelano se un testo è stato scritto da un’IA

Fastweb: niente costi di dismissione linea fissa dopo 24 mesi ai clienti dal 3 Gennaio 2024 – MondoMobileWeb.it | Information | Telefonia

Lascia un commento Annulla risposta

Tre giovani dispersi per la piena del Natisone in Friuli, l’abbraccio disperato poi la piena li ha travolti – Notizie

TIMVISION con DAZN, ecco le nuove offerte sportive mensili e annuali dal 9 Giugno 2024 – MondoMobileWeb.it | News | Telefonia

xTE TIM Cross da 5,99 euro al mese: nuovo portafoglio con 5G fino a 250 Mbps o 5G Ultra – MondoMobileWeb.it | News | Telefonia

Very Mobile: portafoglio da 2,99 euro al mese prorogato di un paio di giorni – MondoMobileWeb.it | News | Telefonia

LA DIRETTA – Elezioni europee 2024, lo spoglio minuto per minuto: i risultati

il programma della 4° Edizione

Rimini capitale dei robot, l’Università di Bologna porta al palaCongressi l’European Robotics Forum

Previsioni meteo weekend: pioggia, neve e grandine

13,000+ People Have Bought Our Theme

Which Company Would You Choose?

Nexus 6 review

Simple Ways To Reduce Your Unwanted Wrinkles!

Installati a Cesenatico i 400 nuovi cestini stradali per una città sempre più pulita

New! A Stain Remover That Works Like Magic