Introduzione
Il 60% delle fonti in un report di Ernst & Young erano allucinazioni IA. E noi, quanto verifichiamo davvero le risposte che riceviamo dall'intelligenza artificiale?Ieri ero a un corso di formazione con altri colleghi e si parlava di intelligenza artificiale. Qualcuno ha fatto una domanda al relatore, che nella sua risposta ha toccato anche il tema delle allucinazioni IA: quei momenti in cui un modello restituisce informazioni inventate con la stessa sicurezza con cui darebbe un dato reale.
Quando ha finito, ho aggiunto un esempio concreto, fresco di pochi giorni. Quello di Ernst & Young.
Il caso Ernst & Young: allucinazioni IA in un report ufficiale
A fine 2025, EY Canada ha pubblicato un report di 44 pagine sulla cybersecurity dei programmi fedeltà, intitolato Points of Attack: Uncovering Cyber Threats and Fraud in Loyalty Systems. Un documento firmato da due partner e un senior manager. Sulla carta, un lavoro di peso.
Nella pratica, un disastro.
GPTZero, una startup specializzata nel rilevamento di contenuti generati da IA, ha analizzato ogni singola citazione del report. Il risultato: il 60% delle fonti era inventato. Link che portavano a pagine inesistenti, articoli attribuiti a testate che non li avevano mai pubblicati, report di McKinsey che non sono mai esistiti.
GPTZero ha coniato un termine per questa pratica: vibe citing, citare "a sensazione", lasciando che sia l'IA a inventare riferimenti che suonano plausibili.
Uno dei dati centrali, la stima che tra il 30% e il 50% dei punti fedeltà non venga mai riscattato, era attribuito a un presunto Loyalty Economics Report di McKinsey del 2022. Quel report non esiste. GPTZero ha tracciato l'origine della cifra fino a un blog di bassa qualità che, a sua volta, l'aveva probabilmente generata con l'IA. Un'allucinazione che cita un'altra allucinazione: i ricercatori le hanno chiamate secondhand hallucinations.
EY ha ritirato il documento e avviato una revisione interna. Ma nel frattempo il report era già stato ripreso da decine di articoli, blog e, il cerchio si chiude, dai motori di ricerca basati su IA, che lo citavano come fonte autorevole.
Un ottimo articolo giornalistico sul caso è quello di Chris Stokel-Walker su Sherwood News.
Non è solo EY: il problema è di tutti
Dopo il mio intervento, un altro collega presente ha spostato il discorso su un piano diverso. Il punto non era solo EY. Il punto era: quanti di noi controllano davvero quello che l'IA restituisce?
È partita una discussione accesa, e il tema di fondo era tanto semplice quanto scomodo. Lo facciamo tutti. Chiediamo, leggiamo, usiamo. Senza verificare.
Qualcuno ha ammesso candidamente di usare ChatGPT per scrivere email ai clienti senza rileggere il risultato. Un altro ha raccontato di aver scoperto, per caso, che un documento interno conteneva un riferimento normativo inesistente, generato dall'IA e copiato tale e quale. Nessuno se n'era accorto per settimane. La cosa che mi ha colpito di più è che nessuno nella stanza si sentiva immune. Non era un problema "degli altri".
Il caso di EY non è nemmeno isolato. Le allucinazioni dell'intelligenza artificiale hanno colpito anche altre organizzazioni di primo piano. Tra il 2025 e il 2026: Deloitte ha dovuto rivedere un report prodotto per un governo provinciale canadese dopo la scoperta di citazioni accademiche inventate, e lo studio legale Sullivan & Cromwell ha presentato atti giudiziari con oltre 40 errori generati dall'IA. Il pattern è sempre lo stesso: contenuti generati dall'IA, pubblicati con il marchio di organizzazioni prestigiose, senza che nessuno abbia controllato se quello che c'era scritto fosse vero.

Ma perché succede? Perché professionisti competenti, in organizzazioni che investono miliardi nell'IA, non cliccano un link per verificare se esiste?
Perché il cervello non riconosce le allucinazioni dell'IA
La domanda sembra banale, ma la risposta non lo è.
In psicologia cognitiva esiste un fenomeno ben documentato: l'automation bias, la tendenza a fidarsi delle risposte di un sistema automatizzato anche quando le proprie competenze suggerirebbero il contrario. Uno studio del 2025 pubblicato su Procedia Computer Science (Wingerter et al.) lo ha misurato con un esperimento diretto: i partecipanti che ricevevano supporto da un'IA con risposte deliberatamente sbagliate ottenevano risultati peggiori rispetto a chi non aveva nessun supporto. Avere un'IA che ti aiuta male è peggio che non avere aiuto. E il livello di conoscenza dell'IA dichiarato dai partecipanti non cambiava nulla: sapere che l'IA può sbagliare non impedisce di fidarsi lo stesso.
Sandra Wachter, professoressa all'Oxford Internet Institute, ha sintetizzato bene il meccanismo in un'intervista con MIT Technology Review: i modelli di IA non sono costruiti per la verità, sono costruiti per essere persuasivi. Il testo che producono è così fluido e strutturato che il cervello lo tratta come affidabile senza passare per la fase di verifica. Ed è proprio questa fluidità a rendere le allucinazioni IA così pericolose: non sembrano errori, sembrano fatti.
"Dobbiamo dire addio all'idea di poter decidere velocemente se qualcosa è vero o no. Se vuoi capire cosa è vero, probabilmente oggi ti serve più tempo di prima." — Sandra Wachter, Oxford Internet Institute
Verificare le risposte dell'IA: il tempo che nessuno investe
Se ci pensiamo, il meccanismo è piuttosto chiaro. L'IA è stata adottata in massa perché fa risparmiare tempo. Ma il tempo risparmiato nella produzione di un contenuto viene raramente reinvestito nella verifica. Anzi, la promessa implicita è proprio quella di accorciare l'intero ciclo, dalla domanda al documento finito.
Generare è rapido, fluido, soddisfacente. Verificare è lento, noioso, ingrato. Spesso significa scoprire che qualcosa non torna e dover rifare parte del lavoro. Non è difficile capire quale delle due attività il cervello preferisca.
Chi lavora con l'IA si divide, semplificando, in due visioni. C'è chi dice: il problema è nel processo, e la soluzione sta in sistemi di verifica migliori, workflow più strutturati, tool di fact-checking, revisioni umane obbligatorie. E c'è chi pone una questione più profonda: a furia di delegare la produzione e la valutazione dei contenuti all'IA, stiamo perdendo la capacità stessa di pensare criticamente a quello che leggiamo.
Uno studio del 2025 di Gerlich, condotto su 666 partecipanti di diverse fasce d'età, ha trovato proprio questo: una correlazione significativa tra uso frequente di strumenti di IA e riduzione delle capacità di pensiero critico. Il meccanismo è il cognitive offloading: più deleghi il ragionamento alla macchina, meno il cervello si allena a farlo da solo.
La verità sta probabilmente da qualche parte nel mezzo. Un professionista che usa l'IA per produrre una bozza e poi la rivede punto per punto sta usando lo strumento in modo produttivo. Uno che copia un blocco di citazioni in un report da milioni di dollari senza cliccare un link sta facendo un'altra cosa. Ma in entrambi i casi, la responsabilità del controllo finale è sempre umana.
Fermarsi un attimo
Questo articolo non vuole dare soluzioni e non ha la presunzione di dire a nessuno come dovrebbe lavorare. Ma quella discussione tra colleghi ieri mi ha fatto pensare, e il valore sta proprio lì.
La prossima volta che un'IA ti restituisce una risposta perfettamente strutturata, con dati e fonti e link, prova a cliccare uno di quei link. Prova a cercare quel dato. Prova a verificare se quella fonte esiste davvero.
Potrebbe andare tutto bene. O potresti scoprire che stavi per costruire qualcosa su fondamenta che non esistono. E nel dubbio, verificare costa molto meno che scoprirlo dopo.