Ein Sicherheitsforscher investierte 1.500 US-Dollar (etwa 1.300 Euro), um mehr als 13 KI-Modelle gegen eine absichtlich sicherheitsanfällige App antreten zu lassen. GPT-5.5 führte das Feld mit einer Erfolgsquote von 70 % an, DeepSeek V4 Pro löste die Aufgabe für 0,62 US-Dollar (etwa 0,53 Euro) pro Versuch, und Gemini verweigerte die Mitarbeit fast vollständig.