Notebookcheck Artikel => News => Topic started by: Redaktion on September 18, 2025, 09:43:51
Title: Open-Source-Tool misst den „Dummheitsfaktor“ von KI-Modellen
Post by: Redaktion on September 18, 2025, 09:43:51
Ein neu entwickeltes Open-Source-Tool überwacht in Echtzeit führende KI-Modelle wie OpenAI GPT-5, Claude Opus 4 und Gemini 2.5 Pro. Erstmals ist es damit möglich, automatisch festzustellen, ob Anbieter die Modellleistung aus Kostengründen drosseln. Nutzer können Benchmarks außerdem direkt mit ihren eigenen API-Schlüsseln von OpenAI, xAI, Anthropic oder Google starten.