Eine der größten Unbekannten zu Strix Halo ist die Art der Interconnects zwischen den CCDs und dem IOD. Im Chips & Cheese Interview wird hier von einem "Meer an Leitungen" (sea of wires) statt eines Infinity Fabric Busses gesprochen, was u.a. die Latenzen für den Zugriff auf Zwischenspeicher, die auf dem anderen CCD reserviert sind, signifikant ändern sollte: Teilweise entsteht sogar der Eindruck, daß die beiden CCDs sich fast monolithisch verhalten sollten, was gerade bei Spielen den Nachteil der separaten CCDs reduzieren sollte.
Testen kann man dies wohl mit
diesem Benchmark, so wie er über Jahre auch von Anandtech eingesetzt wurde.
Vielleicht könnten Sie dies noch nachreichen?
Ja und außerdem wäre natürlich Vergleichswerte für größere Sprach- und Bildmodelle interessant, die bis zu 96GB dynamisch vom Hauptspeicher für die Bearbeitung durch die GPU abzweigen können: Ob da die Leistung z.B. gebenüber meinem Hawk-Point mit der Anzahl der CUs dank der höheren Speicherbandbreite linear wächst, oder doch der Hauptspeicher vorher zu Bremse wird, wäre schon interessant zu messen.
Mit
Amuse kann man das ja gerade besonders einfach ausprobieren und z.B. mit einer größeren dGPU (in meinem Falle eine RTX 4090) vergleichen.