Fenster schliessen
 | RSSImpressum | Login logo
logo



WWDC 2022: »First we take Manhattan. Then we take Berlin.«


05.06.2022   Apples Erfolge mit seinen M1-Prozessoren sind so eindrucksvoll, dass die Welt mit Spannung auf deren nächstes Kapitel wartet: Die Enthüllung einer neuen Prozessor-Architektur speziell für den Mac Pro. Aber ich würde darauf tippen, dass die eigentliche Sensation nicht beim Prozessor liegen wird, sondern bei der Grafik. Außerdem würde ich erwarten, dass wir eine neue Technik sehen werden, wie man CPUs und GPUs verbindet. Dies ist bisher keinem Hersteller zufriedenstellend gelungen.



Warum ist Intel nicht Marktführer bei Grafikkarten? Wenn sie die schnellste CPU bauen können, warum dann nicht ebenso die schnellste GPU? Andersrum, wenn AMD oder Nvidia die schnellsten GPUs bauen können, warum gelingt es ihnen nicht auch bei der CPU? Ist es nicht eine sehr ähnliche Technik?

Die Aufteilung des Marktes in CPU- und GPU-Hersteller ist mysteriös. Umso mehr, weil lange klar ist, dass die nächste Epoche von integrierten Systemen dominiert werden wird. Das modulare Zeitalter ist schon lange vorbei. Deswegen haben sowohl AMD als auch Intel begonnen, eigene Grafik-Prozessoren zu entwickeln oder Firmen aufzukaufen. AMD ist damit auch erfolgreich, aber nur bei großen Grafikkarten. Von effizienten, performanten, integrierten Systemen bleibt man weit entfernt. Intel bietet seit langem eine Chipsatz-Grafik an, bedient damit aber nur den Low-End-Markt. Der Grund dafür ist schlicht, dass sie keine höhere Performance zustande bringen.

Es wird noch mysteriöser. Selbst ein Workstation-PC (oder ein Mac Pro) leidet an einem Flaschenhals zwischen CPU und GPU. Einfach gesagt bildet jede Grafikkarte eine Art „Computer im Computer“, eine Art Ritterburg, mit einer schmalen Zugbrücke am Eingang. Weil die Zugbrücke schmal ist, verwenden die Grafikkarten sogar ihren eigenen RAM-Speicher, denn hier werden höchste Bandbreiten benötigt.

Das bedeutet: Selbst wenn ein Hersteller sowohl CPU als auch GPU mit höchster Performance bieten könnte, stellte sich sofort die nächste Frage, nämlich, warum beide Systeme getrennt arbeiten. Die Antwort darauf ist, dass keine Methode existiert, die schnell genug wäre, um CPU und GPU nahtlos zu verbinden.

Apples »UltraFusion« leistet eine solche hochperformante Verbindung zwischen zwei Prozessoren (zwei M1 Max). Nicht nur verbindet es mehrere GPU-Cluster untereinander, sodass sie funktionieren wie eine einzige große GPU. Sondern es verbindet auch CPU und GPU. Diese Verbindung ist sehr viel schneller als die Verbindung einer klassischen Grafikkarte zum Rest des Systems (nämlich über den PCI-Bus).



Jedoch benötigt »UltraFusion« mehr als zehntausend Verbindungen, um die enorme Bandbreite von ca. 2,5 TeraByte/s realisieren zu können. Zum Vergleich: Der superschnelle RAM des aktuellen Mac Pro ist mit 140 GigaByte/s ans System angebunden. Das ist wirklich enorm schnell. Aber stellt man diese Zahl anders dar, nämlich als 0,14 TeraByte/s, dann erkennt man den Unterschied zu UltraFusion. Es ist mehr als fünfzehn Mal so schnell.

Eine herkömmliche Grafikkarte kann natürlich keine zehntausend Pins bieten, die sie mit dem Motherboard verbinden. Das ist einer der Gründe, warum herkömmliche Grafikkarten auch im Jahr 2022 noch funktionieren wie separate Computer innerhalb eines Computers, und warum sie eigenen RAM-Speicher usw. benötigen.

Apple stellt alle diese Prämissen infrage. Man spürt förmlich, dass sich einige eiserne Regeln demnächst ändern könnten. Anders als Intel, AMD oder Nvidia baut Apple tatsächlich den schnellsten CPU-Kern der Welt — aber auch den schnellsten GPU-Kern. Durch die verblüffende Größe der M1-Chips konnten sie eine große Zahl dieser Kerne direkt auf dem Die unterbringen, was ihnen die Verwendung langsamer Verbindungen erspart. Sie haben mit »UltraFusion« eine Technologie, die mehrere solcher Systeme koppeln kann, ohne den langsamen PCI-Bus verwenden zu müssen. Das bedeutet: Alte Regeln gelten plötzlich nicht mehr.

Einziger Pferdefuß: Wie weit kann man das treiben? Mit dem M1 Ultra scheint es an eine Grenze gelangt zu sein, jedenfalls derzeit. Das Augenmerk liegt dabei weniger auf den Prozessoren, sondern auf der Grafik. Die Flaschenhälse machen sich vor allem bei der Grafik bemerkbar. Am Ende läuft es auf die Frage hinaus, wie alles verbunden wird.

Betrachten wir den Aufbau des aktuellen Mac Pro. Ganz oben (1) befindet sich die CPU. Der RAM ist auf der Rückseite untergebracht. Die Steckkarten (2) und (3) dienen der Grafik. Zwischen den Bereichen ist die Kommunikation langsam.



Nun die Preisfrage: Wo müsste man die CPU idealerweise unterbringen, damit der langsame Flaschenhals zur Grafik obsolet würde?

Entweder man beseitigt den Flaschenhals und erfindet eine neue Verbindung. Oder man eliminiert die Notwendigkeit einer Verbindung. Man platziert die CPU auf das gleiche Modul wie die GPU. Etwa so:



Dieser Aufbau sieht mehr danach aus, als stamme er von einem Hersteller, der sowohl für die CPU als auch für die GPU verantwortlich ist und der den Vorteil von integrierten Systemen nutzen möchte. CPU und GPU wollten schon immer zusammen sein, wurden aber bei der Geburt getrennt. Jetzt kommen sie wieder zusammen.

Ich wage keine Vorhersage, ob wir zur WWDC tatsächlich eine solche Architektur sehen werden. Aber die Kopplung von CPU, GPU und RAM scheint eine wichtige Zutat bei Apples Strategie zu sein. Immerhin basieren alle M1-Macs auf diesem Prinzip — mit großem Erfolg.

Was ich jedoch vorhersage, mit einem gewissen lustigen Risiko, ist ein Umbruch bei der Grafik. Apple wird die Führung bei grafischen Systemen übernehmen. Man kann feilschen darüber, ob sie die schnellste „Grafikkarte“ bieten werden (falls der Begriff nicht sowieso obsolet wird). Damit meine ich praxisferne Benchmarks, die absichtlich nur innerhalb einer Grafikkarte laufen. Aber ich würde darauf tippen, dass reale Anwendungen, die stets eine Kombination aus CPU und GPU nutzen, nirgends so schnell laufen werden wie auf Apples neuesten Systemen. Denn genau dort liegt vielleicht der Zauber der neuen Architektur: Dass beides als integriertes System funktioniert, ohne Flaschenhälse.

Mit anderen Worten: Was zunächst aussah wie ein Knock-Out gegenüber den Prozessor-Herstellern, wird sich entpuppen als ein Double-Punch. Der zweite Schlag gilt den Herstellern der Grafikchips. First we take Manhattan. Then we take Berlin.

Mehr noch: Falls sich diese Performance ausschließlich durch eine integrierte Lösung erreichen lässt, dann wird es der PC-Markt schwer haben, demnächst eine ähnliche Lösung anbieten zu können. Nvidia hat keinen schnellen Prozessor, obwohl sie daran arbeiten. Intel hat keine schnelle Grafik, obwohl sie daran arbeiten. AMD hat beides, stößt aber an Grenzen bei der Effizienz.



Vielleicht wird sich diese Spekulation als völlig falsch erweisen, aber das wäre keine Schande. Niemand hätte den M1 oder gar den M1 Ultra vorhersagen können. Niemand hätte gedacht, dass Apple sich über eiserne Gesetze einfach so hinwegsetzen wird. Und alle waren verblüfft, wie einfach und elegant die Lösungen am Ende waren.

Das macht die ganze Sache ungemein vergnüglich. Bei den anderen Produkten, die auf der WWDC üblicherweise vorgestellt werden, gibt es klare Erwartungen. Jeder hat für iOS und macOS ein paar Wünsche auf dem Zettel. Es wird auch Enttäuschungen geben. Aber sobald der neue Mac Pro an die Reihe kommt, wird es das reine Vergnügen sein.

Natürlich nur, bis die Preise genannt werden. Diskussion im Forum Aktuelle Sendung dazu: M1 Ultra — Wie kann es jetzt noch schneller werden?