IPB

Bienvenue invité ( Connexion | Inscription )

> La CPU du M3 Max aussi rapide que celle du M2 Ultra?, Réactions à la publication du 02/11/2023
Options
Paul Emploi
posté 2 Nov 2023, 19:30
Message #1


Macbidouilleur d'Or !
*****

Groupe : Rédacteurs
Messages : 1 657
Inscrit : 19 Nov 2020
Membre no 212 895



[MàJ par Philippe]

Mêmes causes mêmes effets entre M4 Max et M3 Ultra!

[Article initial]

Attention, on va encore reparler de résultats de GeekBench 6 non-officiels, non-validés et toujours non-reproductibles. Donc là aussi, il y aura du conditionnel, et plus que cela il faut éviter de comparer des pommes et des oranges au travers d'un outil inadapté.

On a vu fleurir des articles avec les résultats GeekBench 6 du M3 Max comparés à ceux du M2 Ultra, et concluant que le premier est maintenant l'égal du second, et je dois m'inscrire en faux. Je vais vous expliquer pourquoi!

Architecture des M Ultra

Les M1 Ultra et M2 Ultra sont composés de deux M1 Max ou M2 Max accolés via un bus interne, cela permet un doublement des cœurs et donc de leurs performances théoriques. Leurs caches L3 sont aussi séparés et communiquant via ce même bus.

C'est de là que vient le problème, comme pour les Xeon des Mac Pro Intel : pour en tirer la substantifique moelle, il faut absolument éviter que des données partagées ou pire mises à jour, ne soient nécessaires sur les différents caches L3 simultanément, sauf à provoquer des allers-retours de celles-ci entre ces caches au travers du bus et des ralentissement importants.

GeekBench 6 et ses résultats étranges

Sous GeekBench 6, on peut observer le phénomène de deux façons différentes, d'abord avec le manque de montée en puissance multithread des Mac Pro Intel, le 28 cœurs (10426) ne semblant délivrer que 46% de plus que le 8 cœurs (7118). C'est faux avec des logiciels pro.

Ensuite par la faible différence de performance multithread entre un M2 Max et un M2 Ultra, 44% de plus, ne correspondant en rien au doublement de performances théoriques. C'est tout aussi faux avec ces mêmes logiciels pros.

Le problème n'est pas les Xeon, ceux qui en ont pourront en témoigner, ou le M2 Ultra, mais bien GeekBench 6...

Logiciels non-professionnels

Ce que mesure GeekBench 6 est un mélange de logiciels plus ou moins bien multithreadés dont la plupart ne sont pas aptes à exploiter des architectures avancées, professionnelles. Je résumerais en disant qu'ils représentent des logiciels grand-publics multithreadés.

Pas des logiciels professionnels.

Logiciels professionnels

Avec ses 24 cœurs un peu plus lents, le M2 Ultra est toujours le plus rapide si la charge est parfaitement répartie, incluant la localité mémoire surtout au niveau des caches, pour éviter de l'éviction à répétition et le transfert de données réutilisées d'un cache à l'autre par le bus interne.

C'est le cas des logiciels professionnels, ceux qui savaient tirer le meilleur du Mac Pro Intel 28 cœurs, et dont beaucoup ont été portés sur les Mac ARM incluant les M1 Ultra et M2 ultra. Ces logiciels sont architecturés pour ce type de matériel et ne rencontreront pas les limites observées dans GeekBench 6, qui ne les représente pas correctement.

Le M3 Max est un gros progrès mais pas comparable au M2 Ultra

J'apprécie GeekBench 6, mais il n'est pas conçu pour mettre en avant tout le potentiel des architectures très multithreadés, avec des caches L2 séparés ou de la localité mémoire (NUMA). Pour cela GeekBench 5 fournissait un tableau bien plus réaliste dans le cadre d'usage de logiciels conçus et optimisés pour ces architectures, qu'on ne retrouve que dans le monde professionnel ou les serveurs.


Si le M3 Max sera aussi rapide que le M2 Ultra sur des logiciels grand public, ça ne sera pas le cas sur les meilleurs outils professionnels, qui depuis des années sont peaufinés pour exploiter à fond les Mac Pro Intel et maintenant les doubles SoC Ultra.

Il faut toujours remettre les résultats des benchmarks dans leur contexte et GeekBench 6 n'est pas fait pour ce type d'architecture ni d'usage. C'est pour cela que nous n'avons pas reproduit ces résultats, car ils n'ont pas de valeur dans ce cadre.
GeekBench 5 est plus indiqué pour cela même si plus âgé.

En revanche, face au M2 Max 12 cœurs, le M3 Max 16 cœurs amènerait un gain en performances CPU multithread de l'ordre de 50%, un bond en avant pour les MacBook Pro ainsi que le futur Mac Studio M3 Max.

Même si la micro-architecture n'a pas évoluée, en jouant avec les fréquences et le nombre de cœurs Performance, Apple a sorti un SoC doté d'une CPU de premier plan pour les ordinateurs portables, mais qui ne se compare pas au M2 Ultra du Mac Studio!

Lien vers le billet original



--------------------
La liberté d'expression c'est l'extrémisme. La censure c'est la liberté.
Go to the top of the page
 
+Quote Post
 
Start new topic
Réponse(s)
jeandemi
posté 3 Nov 2023, 23:08
Message #2


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 2 592
Inscrit : 20 Aug 2020
Lieu : Belgique
Membre no 212 269



Citation (Paul Emploi @ 2 Nov 2023, 20:30) *
J'apprécie GeekBench 6, mais il n'est pas conçu pour mettre en avant tout le potentiel des architectures très multithreadés, avec des caches L2 séparés ou de la localité mémoire (NUMA). Pour cela GeekBench 5 fournissait un tableau bien plus réaliste dans le cadre d'usage de logiciels conçus et optimisés pour ces architectures, qu'on ne retrouve que dans le monde professionnel ou les serveurs.

Il faut toujours remettre les résultats des benchmarks dans leur contexte et GeekBench 6 n'est pas fait pour ce type d'architecture ni d'usage. C'est pour cela que nous n'avons pas reproduit ces résultats, car ils n'ont pas de valeur dans ce cadre.
GeekBench 5 est plus indiqué pour cela même si plus âgé.

Cinebench est le bench d'un logiciel pro, Cinéma4D, qui tire pleinement profit d'une architecture avec plein de cœurs. Les résultats qu'il va donner seront représentatifs d'une performance tirant pleinement profit des multiples threads disponibles, comme Geekbench 5 le faisait.

Mais pour une utilisation plus domestique, les scores obtenus ne seront pas du tout représentatifs. C'est pour cela que Geekbench 6 a été modifié pour tenir compte des logiciels courants peu multi threadés. Dans GB6, un CPU avec plein de cœurs lents sera pénalisé par rapport à un CPU disposant de peu de cœurs très rapides, comme ce qu'utiliserait "monsieur tout le monde" à la maison.

Donc tout dépend de l'usage que vous avez de la machine

Je n'ai pas encore testé iMovie sur un de mes doubles Xeon pour savoir s'il utiliserait tous les cœurs disponibles ou pas.

Capture One, le logiciel de traitement photos, utilisait un maximum de 8 cœurs (testé avec un ordi qui en avait 12) pour traiter les photos, raison pour laquelle j'ai acheté le Xeon E5-2667v2 (8c/16th à 3,3 GHz), mais depuis que j'ai mis une carte graphique récente dedans (RX580 puis Vega 64), il n'y a plus que 2 cœurs qui travaillent, le reste est fait par la carte graphique, aussi vite avec la RX580, plus vite avec la Vega.

Dans Cinebench aussi, la carte graphique écrase n'importe quel CPU: genre MC 860 avec les 14 cœurs du Hackintosh no12, 4000 avec la Vega, 7700 avec deux Vega 64, ce qui en passant bat le M1 Ultra (6600 environ)
M1 Ultra qui n'est pas 2x plus rapide que le M1 Max, preuve qu'on ne peut multiplier ces CPUs en parallèle et espérer multiplier d'autant les performances, il faut qu'ils puissent communiquer correctement entre eux, ce qui ne semble pas le point fort de l'architecture Silicon. Peut-être la raison de l'absence de M3 Ultra.

Ce message a été modifié par jeandemi - 3 Nov 2023, 23:08.


--------------------
Hack 16 "Photo": MSI H97M-G43 i7-4770 32GB DDR3-1600 XFX RX6800XT SSD SATA 4TB WD Red, MacOS 12.7.6 Monterey, OC1.0.5
Hack 15 "Musique": Asus Z10PA-U8 Xeon Broadwell E5-2690v4 (14c @2,6GHz) 2x16GB DDR4 ECC, GF GT730/4G, NVME Micron 512, Firewire PCI + Roland Edirol FW (avec patches), Séquoia OC1.0.4 + OCLP (pour la GF)
Hack 14: Asus Strix X99 Gaming Xeon Haswell E5-1660v3 (OVC à 4,2) 4x8GB DDR4 Gigabyte Vega56/8G, Monterey et Sonoma OC 1.0.4
Hack 13: Asus Z87 Gryphon i7-4770K 2x8GB DDR3 Gigabyte RX580/8G MacOS 15.5.5 Séquoia+Win10 OC1.0.5
Hack 12: CM Qiyida E5-A99 (X9H9D) Xeon Haswell E5-2666v3 (10c/20th à 2,9GHz) 2x8GB DDR4, Sonoma OC 0.9.3
Hack 9: Asus P8Z77-M i5-3450 0.8.3 Monterey Hack 10: Asus H81M-C i7-4770 16GB DDR3, MSI RX570/8GB Monterey OC 0.9.8
Hack 8 "dual2": Supermicro X9DAi Double Xeon E5-2670v2 (total 20c/40th@2,5GHz) 192GB (6x32GB) DDR3-1333RegECC, Sapphire Vega64/8G, USB3 FL1100, Catalina OC 0.7.9 et Ubuntu 20.04LTS
Hack 7 "MP6" : JingSha X79-P3 Xeon E5-2667v2 (8c/16th@3,3GHz) 4x16GB DDR3-1866RegECC Gigabyte Vega64/8GB USB3 FL1100 PCI-E SSD500GB NVME 970Evo+ HDD500GB SATA Mojave Clover
Hack 6 "Dual" : Kllisre Dual-X79 2x Xeon E5-2697v2 (total 24c/48th@2,7GHz) 128GB (8x16) DDR3-1600ECC Asus GTX760/2GB SSD256GB Mac OS-X Mojave Clover
Hackintosh 2, 3, 4 et 5: Asus P5B/P5E-VM DO/P5KPL-VM, Q9550, 8/4GB DDR2-800, Quadro K600/8800GTX/8500GT, SSD+HDD SATA, Mac OS-X 10.9, 10.11, 10.12.6 et 10.13.6 (+ Snow Léopard incomplet en cours d'essais) Clover
Hackintosh1 "Photo" : Asus P7P55D i5-750 2x8GB DDR3 Gigabyte GTX770/4GB USB3 FL1100 SSD4TB SATA, Sierra Clover 5070
Go to the top of the page
 
+Quote Post
Paul Emploi
posté 4 Nov 2023, 13:08
Message #3


Macbidouilleur d'Or !
*****

Groupe : Rédacteurs
Messages : 1 657
Inscrit : 19 Nov 2020
Membre no 212 895



Citation (jeandemi @ 3 Nov 2023, 23:08) *
M1 Ultra qui n'est pas 2x plus rapide que le M1 Max, preuve qu'on ne peut multiplier ces CPUs en parallèle et espérer multiplier d'autant les performances, il faut qu'ils puissent communiquer correctement entre eux, ce qui ne semble pas le point fort de l'architecture Silicon. Peut-être la raison de l'absence de M3 Ultra.

J'étais pour le moins dubitatif lors de la présentation du M1 Ultra et de sa connexion interne "ultra-rapide" à 2.5 To/s.

Avec 800 Go/s de bande-passante mémoire physique, accédée au travers des SLC, ceux-ci ont probablement une bande-passante de 6 To/s avec une efficacité de 90%, ce qui est une valeur vraiment basse.
Et de l'autre coté si les logiciels ne sont pas conçus pour des architectures telles que celle-ci, il y a le yoyo fait par des lignes de probablement 64 octets (512 bits) entre les 2 caches L3 des deux CPU accolées, c'est probablement ce phénomène qu'on observe sous Geekbench 6. Et c'est mortel en terme de performances!

Les M Ultra sont très puissants, mais pas pour n'importe quel logiciel, et d'ailleurs ceux incapables de l'exploiter ne savent pas plus exploiter le Xeon 28 cœurs des Mac Pro Intel, et ne nécessitent probablement pas autant de puissance de toute façon.


--------------------
La liberté d'expression c'est l'extrémisme. La censure c'est la liberté.
Go to the top of the page
 
+Quote Post

Les messages de ce sujet


Reply to this topicStart new topic
1 utilisateur(s) sur ce sujet (1 invité(s) et 0 utilisateur(s) anonyme(s))
0 membre(s) :

 



Nous sommes le : 31st July 2025 - 19:02