Benchmark Google: limiti di Gemini 3 e ChatGPT 5

Uno studio recente condotto da Google e presentato attraverso il FACTS Benchmark Suite ha evidenziato importanti limiti nei principali modelli di linguaggio (LLM) attualmente in uso. I risultati, pubblicati di recente, sollevano interrogativi sull’affidabilità di questi sistemi, in particolare quando si tratta di interpretare dati visivi o documentali complessi. I risultati del benchmark Il benchmark […]