Was für eine lahme Krücke, die nicht mal an die Decode TPS eines M1 Max herankommt... und das für $4000??
Ich hatte gehofft, dass man den Speicher breiter anbindet, aber wahrscheinlich will man sich nicht selbst Konkurrenz machen. So dürfte das Inferencing mit 273 GB/s lediglich etwas schneller sein als Strix Halo mit 256 GB/s.
Der kompakte Desktop Nvidia DGX Spark ist da und bietet KI-Entwicklern 128 GB einheitlichen Speicher, der es ermöglicht, große KI-Modelle ohne Quantisierung zu laden. Das System mit einer 20-Kern-Arm-CPU benötigt dabei lediglich 240 Watt Leistung.