NotebookCHECK - Notebook Forum
Notebookcheck Artikel => News => Topic started by: Redaktion on September 26, 2025, 10:47:40
Samsung hat mit TRUEBench einen neuen Benchmark vorgestellt, der nicht nur auf enge akademische Tests setzt, sondern die Leistungsfähigkeit von KI-Systemen bei realen Aufgaben im Arbeitsalltag misst. Insgesamt umfasst er 2.485 Szenarien in zehn Kategorien und zwölf Sprachen – von kurzen Eingabeaufforderungen bis hin zur Verarbeitung umfangreicher Dokumente. Die Bewertung gilt als besonders streng, da Modelle alle Anforderungen vollständig erfüllen müssen, was die Ergebnisse zwar anspruchsvoller, zugleich aber auch realistischer macht.https://www.notebookcheck.com/TRUEBench-von-Samsung-prueft-KI-Produktivitaet-im-Arbeitsalltag.1125064.0.html