Search

Apples M1 Max im Test: Schlicht eine ganz irdische Glanzleistung - Golem.de - Golem.de

Apple sagt zum M1 Max: "Amazing! Incredible! Phenomenal!" Golem sagt: Effizienz und Performance sind top, aber nicht überraschend.

Ein Test von
Apples M1 Max im Test
Apples M1 Max im Test (Bild: Pixabay, Montage: Martin Wolf/Golem.de)

Wenn Begriffe wie "amazing" oder "incredible" auf dem Apple-Event fallen, sind wir obgleich der überbordenden Wortwahl aus Cupertino zumeist skeptisch: Beim M1 Max für das aktuelle Macbook Pro jedoch hat Apple nicht zu viel versprochen - was angesichts der verwendeten Technik zu erwarten war.

Der M1 Max ist das neue Design aus Cupertino, es folgt auf den M1 (Test). Der Hersteller selbst spricht von Apple Silicon, was nichts anderes meint als dass die Chips von Apple entworfen wurden. Dabei stellt der M1 Max rein von der Komplexität her alles weit in den Schatten, was AMD und Intel und Nvidia derzeit für Laptops im Angebot haben.

Eigene SoCs sind für Apple quasi Routine: Beginnend mit dem A6 (iPhone 5) von 2012 hat das Unternehmen auf Basis einer ARM-Architekturlizenz selbst CPU-Kerne entwickelt und ab dem A8 (iPhone 6) von 2014 kommt eine modifizierte PowerVR-Grafik von Imagination Technologies zum Einsatz; seit dem A11 (iPhone 8) von 2017 stammt die GPU komplett von Apple - wenngleich hier ebenfalls Lizenzzahlungen geleistet werden.

Alles aus einer Hand

Parallel zum Design eigener CPU-Kerne und Grafikeinheiten erfolgte die Entwicklung weiterer wichtiger IP-Blöcke, darunter etwa eine Apple Neural Engine (ANE aka NPU) für künstliche Intelligenz und ein NVMe-Controller für SSDs. Der wiederum bildete die Grundlage für die etablierten T1-/T2-Chips, die unter anderem Sicherheitsfunktionen wie Verschlüsselung übernehmen und schon seit Jahren in Mac-Geräten stecken.

Mit dem regulären M1 hat Apple die iPhone-SoC-Expertise für ein sparsames Laptop-Design genutzt, der Chip ist mit seinen bis 20 Watt zahm ausgelegt; überdies verkauft Apple ihn nur mit bis zu 16 GByte Arbeitsspeicher dazu. Beim M1 Max hingegen ist der Name auch Programm, was sich in mannigfaltiger Form von der Fertigung über die Chipfläche und die Leistungsaufnahme bis hin zum RAM-Ausbau bemerkbar macht.

Einfach nur monströs

Apple lässt das SoC bei TSMC im N5-Verfahren produzieren, also 5 nm mit extrem ultravioletter Belichtung (EUV). Das ist nach N4 der modernste und teuerste Node auf diesem Planeten, dennoch weist der M1 Max eine Die-Size von satten 430 mm² auf und integriert enorme 57 Milliarden Transistoren.

Zum Vergleich: Ein Ryzen 9 5900X (Cezanne in 7 nm DUV) kommt auf nur auf 10,7 Milliarden Transistoren und selbst wenn eine Geforce RTX 3080 für Laptops (GA104 in 8 nm DUV) mit 17,4 Milliarden Transistoren dazu gerechnet wird, ergibt das nur die Hälfte an Schaltungen.

Oder um es anders auszudrücken: Der Yitian 710 von Alibaba wird ebenfalls mit TSMCs N5 produziert und hat mit 60 Milliarden Transistoren ein paar mehr als der M1 Max, hierbei handelt es sich aber um eine Server-CPU mit 128 Kernen und acht DDR5-Speicherkanälen. Insbesondere aus Notebook-Perspektive erscheint der Apple-Chip daher geradezu monströs verglichen mit dem, was die x86-Hersteller und Nvidia im Angebot haben.

Schauen wir uns an, was Apple mit den 57 Milliarden Transistoren angestellt hat und welche Package-Kniffs bis zu 64 GByte RAM mit extrem schneller Anbindung ermöglichen.

Da Apple nahezu alle IP-Blöcke mittlerweile selbst entwirft - von der CPU über die Grafikeinheit und die NPU für künstliche Intelligenz bis hin zur Sicherheitsenklave -, hat der Hersteller sehr viel Erfahrung darin, die einzelnen Bestandteile zu skalieren und aufeinander abzustimmen.

Beim regulären M1 etwa lag der Fokus darauf, den Chip kompakt zu halten und ihn für sparsame Geräte zu optimieren - das Macbook Air kommt sogar mit einer passiven Kühlung aus. Für die CPU-Kerne wurde eine 4+4-Konfiguration verwendet, genauer vier schnelle (Firestorm) und vier effiziente (Icestorm). Die Grafikeinheit hat nur acht Shader-Cluster, das Speicherinterface ist 128 Bit breit und für LPDDR4X gedacht.

Für den M1 Pro und M1 Max hat Apple deutlich mehr Wert auf die Geschwindigkeit gelegt, weshalb 8+2 Firestorm/Icestorm-Kerne zum Einsatz kommen. Der M1 Pro nutzt 16 GPU-Cores und eine Codec-Engine, der M1 Max weist ein an Schmetterlingsflügel erinnerndes verdoppeltes Layout für 32 Grafikkerne und zwei Multimedia-Blöcke auf. Damit einher geht ein von 24 MByte auf 48 MByte verdoppelter System Level Cache (SLC), wobei dieser schnelle SRAM-Puffer auch für den Prozessorpart und die Neural Engine (NPU) verfügbar ist.

LPDDR5 on Package

Um den Grafikkernen sowie dem restlichen SoC die benötigten Daten zuzuführen, hat sich Apple beim M1 Pro und beim M1 Max für LPDDR5- statt LPDD4X-Speicher entschieden. Der vom M1 bekannte Ansatz, den DRAM mit auf den Träger (Package) zu verlöten, wurde beibehalten: Beim M1 Pro sind es zwei Chipgehäuse mit 32 GByte an 256 Bit, beim M1 Max vier davon mit 64 GByte an 512 Bit. Somit ergibt sich eine theoretische Transferrate von 400 GByte/s (und praktisch 360 GByte/s in Stream Triad), ein Novum für ein SoC im Laptop-Segment.

  • Die M1-Generation im Überblick (Bild: Apple)
Die M1-Generation im Überblick (Bild: Apple)
M1 M1 Pro M1 Max
Fertigung 5 nm TSMC 5 nm TSMC 5 nm TSMC
Transistoren 16 Mrd 33,7 Mrd 57 Mrd
Die-Size ca 120 mm² ca 250 mm² * ca 430 mm² *
CPU-Kerne 4P + 4E 8P + 2E 8P + 2E
L1/L2-Cache 12MB + 4MB 24MB + 4MB 24MB + 4MB
SL-Cache 16MB 24MB 48MB
GPU-Kerne 8 @ 2,6 Teraflops 16 @ 5,2 Teraflops 32 @ 10,4 Teraflops
NPU-Kerne 16 @ 11 Teraops 16 @ 11 Teraops 16 @ 11 Teraops
Interface 128 Bit 256 Bit 512 Bit
Bandbreite 68 GByte/s 200 GByte/s 400 GByte/s
Speicher LPDDR4X-4266 LPDDR5-6400 LPDDR5-6400
Kapazität 16 GByte (2x8) 32 GByte (2x16) 64 GByte (4x16)
Power bis zu 20 Watt bis zu 90 Watt bis zu 90 Watt
Spezifikationen des M1 Apple Silicon * basierend auf Apples Die-Shots

Auch hier ein Vergleich: Der Ryzen 9 5900HX mit DDR4-3200 an 128 Bit kommt auf 51 GByte/s, die Geforce RTX 3080 Mobile auf 448 GByte/s. Direkt gegenüberstellen lassen sich die Zahlen von Apple und Nvidia nicht, da sich die effektive Bandbreite je nach Kompression und Zugriffsmuster unterscheidet - die Stoßrichtung ist aber klar.

Hinsichtlich der Taktraten gibt es wenig Neues zu vermelden: Die acht Fireform-Performance-Cores laufen mit bis zu 3,23 GHz und die zwei Icestorm-Efficiency-Cores mit bis zu 2,064 GHz - das war beim M1 auch schon so. Die Grafikeinheit kann auf bis zu 1,296 GHz takten und entspricht damit ebenfalls dem kleinen Chip. Dabei gilt, dass Apple keine Boost-Modi verwendet, die Frequenzen liegen unter Last daher voll an und der Workload bestimmt die Leistungsaufnahme bis zur Kappungsgrenze von etwa 90 Watt.

Bevor wir die Effizienz beurteilen, wollen wir die Performance des M1 Max besprechen. Die fällt zwar definitiv hoch aus, aber nicht ganz so exorbitant wie das Apple im Vorfeld suggeriert hatte.

Für unsere Tests verwenden wir das Macbook Pro 16 mit dem Vollausbau des M1 Max, also eine 8P+2E+32G-Konfiguration. Das ist wichtig, denn Apple verkauft auch einen Salvage-Part, bei dem aufgrund der Chipausbeute (Yield) nur 24 Grafikkerne aktiv sind. Überdies hat das von Apple gestellte Macbook Pro mit 64 GByte RAM die höchste Ausstattungsstufe, was jedoch in unseren Benchmarks keine Rolle spielt.

Um die Leistung des M1 Max einordnen zu können, haben wir den regulären M1 als Teil des aktuellen Mac Mini mit in den Parcours aufgenommen; beide Systeme liefen mit MacOS 12.0.1 Monterey. Hinzu kommen das Razer Blade mit einem Ryzen 9 5900HX und einer Geforce RTX 3080 Laptop, die Power-Limits haben wir auf 42 Watt sowie 90 Watt eingestellt.

Ein Core i5-1135G7 (Tiger Lake) mit 20 Watt rundet das Testfeld ab, zudem haben wir einen zukünftigen Alder-Lake-H45-Notebook-Chip mit dem Core i9-12900K simuliert. Anders als der Desktop-Chip hat dieser nur sechs statt acht Performance-CPU-Kerne, aber weiterhin acht Efficiency-Kerne. Die integrierte Xe-Grafik wird 96 Shader-Cluster statt 32 aufweisen, bei reinen CPU-Messungen ist das allerdings irrelevant.

Meist ein Vorsprung für den M1 Max

Damit die Performance-Vergleiche nicht verzerrt sind, haben wir unter MacOS auf Anwendungen gesetzt, die nativ als ARM64-Versionen vorliegen und nicht erst durch die Rosetta-2-Übersetzungsschicht lauffähig gemacht werden müssen. Der Packer 7-Zip zeigt, dass schnelle CPU-Kerne und die immense LPDDR5-Bandbreite für eine exzellente Kompressionsgeschwindigkeit sorgen; nur der simulierte ADL-P hält dank DDR5-Speicher noch mit. Beim Dekomprimieren fallen die Unterschiede geringer aus, der M1 Max kann seine Spitzenposition aber verteidigen.

  • Apple Macbook Pro 16, Apple Mac Mini, Razer Blade 14, Lenovo Thinkpad X1 Carbon Gen9, * ADL-P H45 simulated with Core i9-12900K (Bild: Golem.de)
Apple Macbook Pro 16, Apple Mac Mini, Razer Blade 14, Lenovo Thinkpad X1 Carbon Gen9, * ADL-P H45 simulated with Core i9-12900K (Bild: Golem.de)

In Adobes Videoschnitt-Software Premiere Pro nutzen wir den PudgetBench, welcher erst kürzlich für die Apple-Chips angepasst wurde. Die 4K-Heavy-CPU-Effects-Extreme-Szene mit einem ProRes-Clip sieht den M1 Max genauso vorne wie das Umwandeln eines 8K-H.265-Videos in einen 4K-ProRes-Schnipsel. Die Encoding-Engine des Apple-Chips scheint inaktiv zu sein, die CPU-Kerne sind zu 100 Prozent ausgelastet.

Bei den Multithreading-Raytracing-Tests via zwei Blender-Szenen und dem Cinebench R23 zeigt sich, dass der M1 Max nicht unschlagbar ist: Der simulierte ADL-P rechnet kaum langsamer oder sogar nahezu gleich flott und auch der Ryzen 9 5900HX weist keinen allzu großen Abstand auf; mit höheren Power-Limits überholen beide den Apple-Chip. Beim Multithreading-Score des Geekbench holt der M1 Max den ersten Platz, was primär dem Crypto-Wert zu verdanken ist. Der Singlethread-Sieg geht an den simulierten ADL-P, da dessen Golden-Cove-Performance-Kerne mit bis zu 5,2 GHz punkten.

  • Apple Macbook Pro 16, Apple Mac Mini, Razer Blade 14 (Bild: Golem.de)
Apple Macbook Pro 16, Apple Mac Mini, Razer Blade 14 (Bild: Golem.de)

Wird die integrierte 32-Kern-Grafikeinheit des M1 Max angesprochen, erweist sich diese als sehr leistungsstark: Im 3DMark Wild Life Extreme Unlimited in 4K-Auflösung schafft es der Chip, einer Geforce RTX 3080 Laptop minimal zu enteilen und die vierfache Performance der M1-iGPU zu erreichen. Der GFX Bench mit der Aztec-Ruins-High-Szene in 1440p lässt den M1 Max verglichen zur Geforce noch besser dastehen, auch hier ist Faktor vier zum M1 zu verzeichnen.

Transcoding ist eine Wucht

Interessant bei Adobe Premiere Pro, genauer bei den beiden gewählten PudgetBench-Workloads: Die 4K-Heavy-GPU-Effects in der Extreme-Variante erledigt die Geforce RTX 3080 Laptop mit fast 40 Prozent höherer Bildrate, beim Transcodieren von 8K H.265 zu 4K H.264 allerdings rechnet die Grafikeinheit des M1 Max doppelt so flott. Zumindest bei der Nvidia-GPU wird der Hardware-Encoder (NVENC) genutzt, bei Apple möglicherweise ebenfalls entsprechende IP-Blöcke, was wir aber nicht verifizieren konnten.

Die Geschwindigkeit des M1 liegt somit CPU-seitig in etwa auf dem Niveau der AMD/Intel-Konkurrenz, wenn diese nicht mit Power-Targets jenseits der 50-Watt-Marke betrieben werden. GPU-seitig kann sich das Apple-Design durchaus mit dem Geforce RTX 3080 Laptop anlegen, wobei der Workload über den Sieger entscheidet. Was die für Notebooks wichtige Frage aufwirft: Wie viel Energie benötigen die Chips?

Unter Windows 10/11 lässt sich der Energiebedarf, genauer die Package Power, von CPUs und GPUs mit Tools wie HW-Info protokollieren. Unter MacOS klappt das per Terminal und dem mächtigen Powermetrics: Apple zeigt dort nicht nur die gesamte Leistungsaufnahme des SoCs, sondern schlüsselt diese auch erfreulicherweise auf. So können wir sehen, ob ein Workload primär die CPU oder die GPU oder die Apple Neural Engine (ANE) oder den DRAM-Controller oder eine Kombination davon belastet.

So lässt sich aus den Protokollen herauslesen, dass das Komprimieren via 7-Zip rund 2,7 Watt vom DRAM-Controller erfordert und der Cinebench R23 wie erwartet mit 1,8 Watt deutlich weniger externe Speicherzugriffe generiert; stattdessen fällt die CPU-Power höher aus. Generell benötigt der M1 Max bei reiner Prozessorlast zwischen 30 und 35 Watt, was klar sparsamer ist als die Konkurrenz mit ihren 42 Watt (AMD) und 45 Watt (Intel).

Hierbei gilt zu beachten, dass wir unsere Messwerte im Akkubetrieb ermittelt haben, wo der Ryzen 9 5900HX eben nicht die bis zu 75 Watt erhält, die Razer im Steckdosenmodus vorsieht. Ohnehin neigen die Hersteller dazu, arg hohe Power-Limits zugunsten einer Desktop-ähnlichen Performance einzustellen, weshalb im mobilen Modus die Leistung entsprechend abfällt. Die Geschwindigkeit skaliert jedoch nur bedingt mit höherer Wattage, daher ist die Effizienz im Akkubetrieb besser.

Breite Kerne als Trumpfkarte

Apple hat mit TSMCs N5 einen gewaltigen Vorteil verglichen zu TSMCs N7-Verfahren, was AMD für den Ryzen 9 5900HX nutzt, und auch verglichen zu Intels 7-Node (früher als 10 nm Enhanced Super Fin alias 10+++ nm bezeichnet). Dem Auftragshersteller zufolge reduziert N5 den Energiebedarf verglichen zu N7 um satte 40 Prozent, wohlgemerkt bei Iso-Performance. Auch nutzt Apple extrem breite CPU/GPU-Designs mit sehr vielen Ressourcen pro Kern, aber gemäßigten Taktraten.

  • Apple Macbook Pro 16, Apple Mac Mini, Razer Blade 14, Lenovo Thinkpad X1 Carbon Gen9, ADL-P H45 simulated with Core i9-12900K (Bild: Golem.de)
Apple Macbook Pro 16, Apple Mac Mini, Razer Blade 14, Lenovo Thinkpad X1 Carbon Gen9, ADL-P H45 simulated with Core i9-12900K (Bild: Golem.de)

Besonders deutlich wird das im 1T-Durchlauf des Cinebench R23: Dort sind der M1 Max und der Ryzen 9 5900X in etwa gleich flott, der Apple-Chip ist jedoch mit knapp 9 Watt statt 20 Watt signifikant sparsamer - Intels Alder Lake mit wahnwitzigen 40 Watt lassen wir lieber unerwähnt (ups). Die 5,2 GHz auf den P-Cores gibt es eben nicht umsonst, dafür ist der Chip auch ein Drittel flotter als der M1 Max.

Die GPU-Effizienz ist galaktisch

Über alle CPU-Benchmarks hinweg weist der M1 Max neben einer leicht höheren Leistung eine klar bessere Energie-Effizienz auf, was im Akkubetrieb eine entsprechend bessere Laufzeit bedeutet. Noch einmal deutlich krasser zeigt sich das bei GPU-Last, denn hier spielt auch noch der SoC-Vorteil mit hinein: Bei Apple steckt alles in einem Chip, beim Razer Blade hingegen braucht es den Ryzen und die Geforce in kombinierter Form.

  • Apple Macbook Pro 16, Apple Mac Mini, Razer Blade 14 (Bild: Golem.de)
Apple Macbook Pro 16, Apple Mac Mini, Razer Blade 14 (Bild: Golem.de)

Der M1 Max benötigt unter 3D-Last rund 60 Watt, bei ähnlicher Leistung wie ein Geforce RTX 3080 Laptop. Der allerdings zieht mal eben 90 Watt, hinzu kommen je nach Benchmark noch einmal 10 bis 15 Watt vom Ryzen 9 5900HX. Als Spitzenwert konnten wir beim M1 Max knapp 70 Watt beim Transcodieren via Adobe Premiere Pro messen, bei gewollter Doppellast (3DMark + Cinebench) bis zu 90 Watt.

Kommen wir zum Resümee!

Apple verkauft den M1 Max nicht einzeln, er ist nur als Teil des Macbook Pro mit 14/16 Zoll erhältlich. Für die Salvage-Variante mit 24 Grafikkernen und 32 GByte RAM sind mindestens 3.670 Euro fällig, für den von uns getesteten Vollausbau mit 32 GPU-Cores und 64 GByte Arbeitsspeicher mindestens 4.310 Euro.

Fazit

Im Smartphone- und im Tablet-Segment demonstriert Apple seit vielen Jahren, dass man extrem leistungsstarke SoCs bauen kann. Vor allem die Entwicklung eigener CPU- sowie GPU-Kerne führte zu beeindruckenden Resultaten, die im M1 als gelungene Ultrabook-, sorry: Air/Mac-Mini-Vorstellung resultierten. Einen Chip davon ausgehend auf 16-Zoll-Laptop-Niveau zu skalieren, ist dann aber eben doch eine andere Kategorie.

Und was sollen wir sagen? Apple hat geliefert. Rein von der CPU/GPU-Performance her kann sich der M1 Max in Cross-Platform-Vergleich bei nativer ARM64-Software locker gegen einen Ryzen 9 5900HX kombiniert mit einer Geforce RTX 3080 Mobile behaupten. Die zehn Firestorm/Icestorm-CPU-Kerne sind ein bisschen flotter als ihre acht Zen-3-Pendants, die integrierte 32-Core-Grafikeinheit liegt mal vor und mal hinter der dedizierten Nvidia-GPU.

Viel wichtiger aber ist, dass der M1 Max diese Geschwindigkeit bei deutlich niedriger Verlustleistung schafft, sprich das Apple-SoC ist weitaus effizienter als die Konkurrenz. Dabei sei erwähnt, dass wir recht sparsame Mitbewerber im Akkubetrieb ausgesucht haben und keine völlig überzüchteten Varianten, die meilenweit oberhalb ihres Sweet-Spots betrieben werden. Wirklich überraschend war dieses Ergebnis allerdings nicht, da Apple einen technischen Vorteil hat.

Ohne die architektonische Leistung des SoC-Teams in Abrede stellen zu wollen: Dank TSMCs 5-nm-EUV-Fertigung kann der M1 Max seine Leistung bei signifikant weniger Energiebedarf erreichen als mit 7 nm DUV oder 8 nm DUV wie bei AMD/Nvidia, zumal Apple den Chip bewusst nicht auf hohe Taktraten ausgelegt hat. Der Preis dafür ist wortwörtlich hoch, ergo steckt der M1 Max auch nicht in "günstigen" 2.000-Euro-Laptops wie der Ryzen 9 5900HX und die Geforce RTX 3080.

Unterm Strich ist der M1 Max zwar kein extraterrestrisches Wunderding, wohl aber eine irdische Glanzleistung, die sich mit den Chips etablierter Hersteller mehr als nur messen kann. Wir sind daher gespannt, wie Apple in den nächsten Monaten und Jahren das Design bis hin zum Mac Pro skalieren möchte. Ausgehend von den 8+2+32 Kernen des M1 Max sollen es dort bis zu 32+8+128 Kerne werden - hat jemand "amazing" gesagt?

Adblock test (Why?)

Artikel von & Weiterlesen ( Apples M1 Max im Test: Schlicht eine ganz irdische Glanzleistung - Golem.de - Golem.de )
https://ift.tt/3CJQGGW
Wissenschaft & Technik

Bagikan Berita Ini

0 Response to "Apples M1 Max im Test: Schlicht eine ganz irdische Glanzleistung - Golem.de - Golem.de"

Post a Comment

Powered by Blogger.