Uno studio recente condotto da Google e presentato attraverso il FACTS Benchmark Suite ha evidenziato importanti limiti nei principali modelli di linguaggio (LLM) attualmente in uso. I risultati, pubblicati di recente, sollevano interrogativi sull’affidabilità di questi sistemi, in particolare quando si tratta di interpretare dati visivi o documentali complessi.

I risultati del benchmark

Il benchmark ha valutato quattro dimensioni chiave: conoscenza parametrica, capacità di ricerca online, rispetto del grounding e competenza multimodale.
I risultati mostrano che nessuno dei modelli supera il 70% di accuratezza nelle risposte fornite. In particolare, Gemini 3 Pro si posiziona al primo posto con un punteggio del 68,8%, seguito da Gemini 2.5 Pro (62,1%) e ChatGPT-5 (61,8%). Questi dati sottolineano la necessità di un approccio cauto e critico nell’uso degli LLM, soprattutto in settori sensibili come la finanza, la medicina e il diritto.

Le criticità emerse

Uno degli aspetti più problematici riguarda il tono di comunicazione dei modelli. Spesso, i sistemi espongono le risposte con sicurezza anche quando commettono errori, rendendo difficile per l’utente distinguere tra informazioni affidabili e allucinazioni del modello. Questo problema è particolarmente rilevante per le pubbliche amministrazioni e le aziende che stanno implementando LLM nei propri processi.

Raccomandazioni per le istituzioni

Alla luce di questi risultati, è fondamentale adottare misure di controllo rigorose.
Gli autori dello studio suggeriscono l’adozione di meccanismi di verifica umana obbligatoria, insieme a sistemi di controllo e guardrail più robusti.

Inoltre, è consigliabile:

– Adottare verifiche incrociate sistematiche per garantire l’accuratezza delle informazioni.
– Limitare l’autonomia decisionale dell’AI nelle attività sensibili.
– Rafforzare i sistemi di tracciabilità e audit per monitorare l’uso degli LLM.
– Sviluppare metriche specifiche per la valutazione delle competenze multimodale.

Conclusione

Per le pubbliche amministrazioni e le aziende, è essenziale adottare un approccio prudente e basato su evidenze, garantendo che l’uso di queste tecnologie sia sempre accompagnato da adeguati controlli e verifiche umane.

Sintesi elaborata da ActaAI
https://www.actyai.it/
supervisionata per Actainfo
da Dott. Igino Addari

Servizio Secure Plus MDR Bitdefender Partner Actainfo

Il Managed Detection and Response – MDR – è un servizio di sicurezza informatica che combina esperti di sicurezza umani e tecnologie avanzate per monitorare, rilevare, analizzare e rispondere proattivamente alle minacce informatiche per un’organizzazione. MDR offre un servizio di sicurezza gestito 24/7.

 

 

Actaprivacy software cloud saas qualificato da ACN per l'adempimento del GDPR

Logo-ACN.png Per l’attuazione degli obblighi richiesti dal nuovo Regolamento UE Software cloud saas ActaPrivacy per la gestione degli adempimenti previsti per la protezione dei dati personali dal GDPR 2016/679.

 

 

ACTAINFO PNRR

Misura 1.4.1: SPORTELLO DIGITALE e SITI WEB per Servizi digitali Pacchetto Cittadino Informato e Cittadino Attivo.
Misura 1.2: Migrazione servizi in CLOUD.
Misura 1.4.3: PagoPA, App IO.
Misura 1.4.4: SPID, CIE

 

 

Leggi anche

ActyAI al servizio dei Comuni per pubblicare notizie

Anche il Comune di Roseto degli Abruzzi utilizza ActyAI Overview, un chatbot di intelligenza artificiale sviluppato da Actainfo, per la pubblicazione di articoli, comunicati e notizie sul proprio sito web. Questo strumento, integrato nel software in cloud ACTAGOV qualificato da ACN per la gestione dei siti web, è in grado di elaborare e sintetizzare informazioni […]

MDR: Servizio cybersecurity in tempo reale

Il modello Managed Detection and Response (MDR) sta emergendo come la soluzione più efficace per superare i limiti strutturali dei tradizionali Security Operations Center (SOC) e dei sistemi basati su SIEM. In un contesto in cui le minacce informatiche si evolvono a velocità impressionante, il vero problema non è più se un’azienda verrà attaccata, ma […]

Il Dlgs 47/2026: un cambio di paradigma per la governance digitale delle imprese

L’entrata in vigore del Decreto Legislativo 27 marzo 2026, n. 47, attuativo della Legge Capitali, rappresenta un punto di svolta silenzioso ma destinato a ridefinire profondamente la compliance digitale nelle organizzazioni. Sebbene non sia immediatamente visibile, questo provvedimento avrà un impatto duraturo sulla gestione della sicurezza informatica, della protezione dei dati e dell’intelligenza artificiale, settori […]