AMD Summit Ridge vs. Pinnacle Ridge beim Monero-Mining
Einige Monate lang war Cryptonight-Mining mit CPUs in den Hintergrund getreten, denn zwei Hersteller hatten maßgeschneiderte ASICs auf den Markt geworfen, die Kryptowährung wie Monero derart viel schneller schürften konnten als handelsübliche CPUs, dass “Mining at Home” uninteressant geworden war. Allerdings ist Mining mit ASICs nicht im Sinne der jeweiligen Community, schließlich wurden Altcoins auf Basis des Cryptonight-Algorithmus wie Monero seinerzeit eigens so entworfen, dass nur dezentrales Mining auf normalen CPUs oder GPUs möglich ist; eigentlich. Dennoch fanden die ASIC-Hersteller einen Weg, das irgendwie zu umgehen. Deswegen haben die Coin-Entwickler kürzlich einen Hard-Fork durchgeführt und den Algorithmus minimal angepasst. Für eine flexibel programmierbare CPU samt Software kein Problem, für einen hochspezialisierten ASIC-Miner dagegen das Todesurteil. Daher rücken schnelle, energieeffiziente CPUs wie die non-X-Varianten des AMD Ryzen in der Minerszene momentan wieder in den Fokus.
Charakteristisch beim CPU-Mining ist, dass die Software in der Regel so eingestellt wird, dass die Daten, die sogenannten Scratchpads, gerade so eben in den Cache der CPU passen. Langsame Speicherzugriffe finden demnach nicht statt. Aufgrund der Cachelastigkeit ist Mining zudem relativ stromsparend, weshalb die CPU viel TDP-Budget übrig haben sollte, um ggf. per Turbo höher zu boosten als üblich.
Wer die Markteinführung des Ryzen 7 2000 “Pinnacle Ridge” vergangene Woche verfolgt hat, dem werden die beiden Kriterien womöglich bekannt vorkommen, denn genau dort – bei der Cache-Latenz und der Turbo-Funktion – wurde der Ryzen der zweiten Generation überarbeitet.
Bei den Speicher-Latenzen will AMD eine Verbesserung von 11 % erzielt haben, wobei der L2-Cache mit bis zu 34 % die stärkste Verbesserung erhalten haben soll.
Relevant in diesem Zusammenhang auch das Feature Precision Boost 2, dank dessen Hilfe Pinnacle Ridge nicht einfach vom Single-Core-Turbo auf den All-Core-Turbo zurücktaktet, sobald mehr als 2 Kerne belastet sind, sondern stufenweise unter Berücksichtigung von Temperatur und TDP-Budget. Daher sind insbesondere dann, wenn nicht alle Kerne belastet sind, Fortschritte zu erwarten.
So wollen wir heute überprüfen, wieviel von AMDs Versprechen in der Mining-Praxis ankommt. Vom Cryptonight-Algorithmus gibt es mittlerweile eine ganze Reihe von Varianten. Wir sehen uns heute Cryptonight v7 an, wie es von Monero seit dem 07.04.2018 verwendet wird. Hier kommt eine Scratchpad-Größe von 2 MB je Thread zum Einsatz. Um die 16 MB L3-Cache des AMD Ryzen 7 zu füllen, werden hier also 8 Threads gestartet. Die zweite Variante nennt sich Cryptonight-Heavy, kommt bei SumoKoin seit dem 06.04.2018 zum Einsatz und arbeitet mit einer Scratchpad-Size von 4 MB. Daher kann der Ryzen 7 nur 4 Threads nutzen, ehe sein Cache vollläuft. Theoretisch müsste sich hier der verbesserte Precision Boost 2 auswirken, da nicht alle Kerne in Benutzung sind. Und last but not least haben wir noch Cryptonight-Lite v1, so in Benutzung bei TurtleCoin seit 08.04.2018, das mit einer Scratchpad-Size von nur 1 MB arbeitet, aufgrund dessen dieser Coin auch auf CPUs geschürft werden kann, die mit sehr wenig Cache ausgestattet sind, z.B. Bristol Ridge mit nur 1 MB L2 je Modul. Bei Ryzen 7 dagegen könnte man mit einer Scratchpad-Size von 1 MB entweder 16 Threads starten und damit auch SMT nutzen. Allerdings verwendet man in der Praxis eher Dual-Share, füllt die Caches also mit zwei Scratchpads je Thread und bescheidet sich mit 8 Threads. Das ist kaum langsamer, allerdings erheblich energieeffizienter.
Base / Turbo | All-Core-Turbo | L2-Cache | L3-Cache | TDP | |
AMD Ryzen 7 1700 | 3,0 GHz / 3,7 GHz | 3,2 GHz | 8x 512 KB | 16 MB | 65 W |
AMD Ryzen 7 2700 | 3,2 GHz / 4,1 GHz | variabel | 8x 512 KB | 16 MB | 65 W |
Um einerseits die CPUs an sich, andererseits die Architektur-Verbesserungen testen zu können, haben wir AMD Ryzen 7 1700 “Summit Ridge” und seinen direkten Nachfolger AMD Ryzen 7 2700 “Pinnacle Ridge” einmal @Stock gegeneinander angetreten lassen, und einmal festgezurrt auf 3,0 GHz. Ersteres testet den erhöhten Takt und den verbesserten Boost mit, zweiteres zeigt dank gleicher und konstanter Taktfrequenz isoliert die Verbesserungen beim Cache auf.
Und los geht’s. Sehen wir uns zunächst einmal die @Stock-Tests an:
Monero Cryptonight v7 |
SumoKoin Cryptonight-Heavy |
TurtleCoin Cryptonight-Lite v1 |
|
AMD Ryzen 7 1700 @Stock | 526 H/s | 239 H/s | 1907 H/s |
AMD Ryzen 7 2700 @Stock | 624 H/s | 283 H/s | 2184 H/s |
Oder prozentual:
Monero Cryptonight v7 |
SumoKoin Cryptonight-Heavy |
TurtleCoin Cryptonight-Lite v1 |
|
AMD Ryzen 7 1700 @Stock | 100 % | 100 % | 100 % |
AMD Ryzen 7 2700 @Stock | 119 % | 118 % | 113 % |
Im Auslieferungszustand der CPUs schafft der Ryzen 7 2700 mit verbessertem “Pinnacle Ridge”-Die bis zu 19 % mehr Leistung als die Referenz AMD Ryzen 7 1700, ebenfalls im Auslieferungszustand.
Werfen wir nun einen Blick auf die Werte mit konstant 3,0 GHz. Das klammert mögliche Vorteile durch Precision Boost 2 und höhere Kerntakte aus und zeigt allein die Auswirkungen der verkürzten Cache-Latenzen:
Monero Cryptonight v7 |
SumoKoin Cryptonight-Heavy |
TurtleCoin Cryptonight-Lite v1 |
|
AMD Ryzen 7 1700 @3 GHz | 481 H/s | 220 H/s | 1760 H/s |
AMD Ryzen 7 2700 @3 GHz | 552 H/s | 246 H/s | 1946 H/s |
Oder prozentual:
Monero Cryptonight v7 |
SumoKoin Cryptonight-Heavy |
TurtleCoin Cryptonight-Lite v1 |
|
AMD Ryzen 7 1700 @3 GHz | 100 % | 100 % | 100 % |
AMD Ryzen 7 2700 @3 GHz | 115 % | 112 % | 111 % |
Zusammenfassung
Wie man sieht kommen je nach Algo 11–15 % Verbesserung allein durch die höhere IPC aufgrund der verbesserten Caches. Das ist genau das Fenster, das AMD in seiner Ankündigung versprochen hat. Damit ist aber auch klar, dass zumindest beim Mining der überwiegende Großteil der höheren Leistung von den Caches kommt und nicht vom höheren Takt oder dem verbesserten Turbo.
Testsystem: ASUS Prime B350-PLUS mit BIOS 4008 (AGESA-Code PinnaclePI-AM4 1.0.0.2a), Boxed-Kühler, 2x 8 GB Crucial DDR4-2667 Dual-Rank 16–16-16–39-1T im Dual-Channel-Modus, Windows 10 v1709 mit aktiviertem Spectre_v2-Schutz, xmrig 2.6.0‑beta3.