AMD Summit Ridge vs. Pinnacle Ridge beim Monero-Mining

Eini­ge Mona­te lang war Cryp­to­night-Mining mit CPUs in den Hin­ter­grund getre­ten, denn zwei Her­stel­ler hat­ten maß­ge­schnei­der­te ASICs auf den Markt gewor­fen, die Kryp­towäh­rung wie Mone­ro der­art viel schnel­ler schürf­ten konn­ten als han­dels­üb­li­che CPUs, dass “Mining at Home” unin­ter­es­sant gewor­den war. Aller­dings ist Mining mit ASICs nicht im Sin­ne der jewei­li­gen Com­mu­ni­ty, schließ­lich wur­den Alt­coins auf Basis des Cryp­to­night-Algo­rith­mus wie Mone­ro sei­ner­zeit eigens so ent­wor­fen, dass nur dezen­tra­les Mining auf nor­ma­len CPUs oder GPUs mög­lich ist; eigent­lich. Den­noch fan­den die ASIC-Her­stel­ler einen Weg, das irgend­wie zu umge­hen. Des­we­gen haben die Coin-Ent­wick­ler kürz­lich einen Hard-Fork durch­ge­führt und den Algo­rith­mus mini­mal ange­passt. Für eine fle­xi­bel pro­gram­mier­ba­re CPU samt Soft­ware kein Pro­blem, für einen hoch­spe­zia­li­sier­ten ASIC-Miner dage­gen das Todes­ur­teil. Daher rücken schnel­le, ener­gie­ef­fi­zi­en­te CPUs wie die non-X-Vari­an­ten des AMD Ryzen in der Miner­sze­ne momen­tan wie­der in den Fokus.

Cha­rak­te­ris­tisch beim CPU-Mining ist, dass die Soft­ware in der Regel so ein­ge­stellt wird, dass die Daten, die soge­nann­ten Scratch­pads, gera­de so eben in den Cache der CPU pas­sen. Lang­sa­me Spei­cher­zu­grif­fe fin­den dem­nach nicht statt. Auf­grund der Cachelas­tig­keit ist Mining zudem rela­tiv strom­spa­rend, wes­halb die CPU viel TDP-Bud­get übrig haben soll­te, um ggf. per Tur­bo höher zu boos­ten als üblich.

Wer die Markt­ein­füh­rung des Ryzen 7 2000 “Pin­na­cle Ridge” ver­gan­ge­ne Woche ver­folgt hat, dem wer­den die bei­den Kri­te­ri­en womög­lich bekannt vor­kom­men, denn genau dort – bei der Cache-Latenz und der Tur­bo-Funk­ti­on – wur­de der Ryzen der zwei­ten Genera­ti­on über­ar­bei­tet.

Bei den Spei­cher-Laten­zen will AMD eine Ver­bes­se­rung von 11 % erzielt haben, wobei der L2-Cache mit bis zu 34 % die stärks­te Ver­bes­se­rung erhal­ten haben soll.

Rele­vant in die­sem Zusam­men­hang auch das Fea­ture Pre­cisi­on Boost 2, dank des­sen Hil­fe Pin­na­cle Ridge nicht ein­fach vom Sin­gle-Core-Tur­bo auf den All-Core-Tur­bo zurück­t­ak­tet, sobald mehr als 2 Ker­ne belas­tet sind, son­dern stu­fen­wei­se unter Berück­sich­ti­gung von Tem­pe­ra­tur und TDP-Bud­get. Daher sind ins­be­son­de­re dann, wenn nicht alle Ker­ne belas­tet sind, Fort­schrit­te zu erwar­ten.

So wol­len wir heu­te über­prü­fen, wie­viel von AMDs Ver­spre­chen in der Mining-Pra­xis ankommt. Vom Cryp­to­night-Algo­rith­mus gibt es mitt­ler­wei­le eine gan­ze Rei­he von Vari­an­ten. Wir sehen uns heu­te Cryp­to­night v7 an, wie es von Mone­ro seit dem 07.04.2018 ver­wen­det wird. Hier kommt eine Scratch­pad-Grö­ße von 2 MB je Thread zum Ein­satz. Um die 16 MB L3-Cache des AMD Ryzen 7 zu fül­len, wer­den hier also 8 Threads gestar­tet. Die zwei­te Vari­an­te nennt sich Cryp­to­night-Hea­vy, kommt bei SumoKoin seit dem 06.04.2018 zum Ein­satz und arbei­tet mit einer Scratch­pad-Size von 4 MB. Daher kann der Ryzen 7 nur 4 Threads nut­zen, ehe sein Cache voll­läuft. Theo­re­tisch müss­te sich hier der ver­bes­ser­te Pre­cisi­on Boost 2 aus­wir­ken, da nicht alle Ker­ne in Benut­zung sind. Und last but not least haben wir noch Cryp­to­night-Lite v1, so in Benut­zung bei Turt­le­Coin seit 08.04.2018, das mit einer Scratch­pad-Size von nur 1 MB arbei­tet, auf­grund des­sen die­ser Coin auch auf CPUs geschürft wer­den kann, die mit sehr wenig Cache aus­ge­stat­tet sind, z.B. Bris­tol Ridge mit nur 1 MB L2 je Modul. Bei Ryzen 7 dage­gen könn­te man mit einer Scratch­pad-Size von 1 MB ent­we­der 16 Threads star­ten und damit auch SMT nut­zen. Aller­dings ver­wen­det man in der Pra­xis eher Dual-Sha­re, füllt die Caches also mit zwei Scratch­pads je Thread und beschei­det sich mit 8 Threads. Das ist kaum lang­sa­mer, aller­dings erheb­lich ener­gie­ef­fi­zi­en­ter.

  Base / Tur­bo All-Core-Tur­bo L2-Cache L3-Cache TDP
AMD Ryzen 7 1700 3,0 GHz / 3,7 GHz 3,2 GHz 8x 512 KB 16 MB 65 W
AMD Ryzen 7 2700 3,2 GHz / 4,1 GHz varia­bel 8x 512 KB 16 MB 65 W

Um einer­seits die CPUs an sich, ande­rer­seits die Archi­tek­tur-Ver­bes­se­run­gen tes­ten zu kön­nen, haben wir AMD Ryzen 7 1700 “Sum­mit Ridge” und sei­nen direk­ten Nach­fol­ger AMD Ryzen 7 2700 “Pin­na­cle Ridge” ein­mal @Stock gegen­ein­an­der ange­tre­ten las­sen, und ein­mal fest­ge­zurrt auf 3,0 GHz. Ers­te­res tes­tet den erhöh­ten Takt und den ver­bes­ser­ten Boost mit, zwei­te­res zeigt dank glei­cher und kon­stan­ter Takt­fre­quenz iso­liert die Ver­bes­se­run­gen beim Cache auf.

Und los geht’s. Sehen wir uns zunächst ein­mal die @Stock-Tests an:

  Mone­ro
Cryp­to­night v7
SumoKoin
Cryp­to­night-Hea­vy
Turt­le­Coin
Cryp­to­night-Lite v1
AMD Ryzen 7 1700 @Stock 526 H/s 239 H/s 1907 H/s
AMD Ryzen 7 2700 @Stock 624 H/s 283 H/s 2184 H/s

Oder pro­zen­tu­al:

  Mone­ro
Cryp­to­night v7
SumoKoin
Cryp­to­night-Hea­vy
Turt­le­Coin
Cryp­to­night-Lite v1
AMD Ryzen 7 1700 @Stock 100 % 100 % 100 %
AMD Ryzen 7 2700 @Stock 119 % 118 % 113 %

Im Aus­lie­fe­rungs­zu­stand der CPUs schafft der Ryzen 7 2700 mit ver­bes­ser­tem “Pin­na­cle Ridge”-Die bis zu 19 % mehr Leis­tung als die Refe­renz AMD Ryzen 7 1700, eben­falls im Aus­lie­fe­rungs­zu­stand.

Wer­fen wir nun einen Blick auf die Wer­te mit kon­stant 3,0 GHz. Das klam­mert mög­li­che Vor­tei­le durch Pre­cisi­on Boost 2 und höhe­re Kern­tak­te aus und zeigt allein die Aus­wir­kun­gen der ver­kürz­ten Cache-Laten­zen:

  Mone­ro
Cryp­to­night v7
SumoKoin
Cryp­to­night-Hea­vy
Turt­le­Coin
Cryp­to­night-Lite v1
AMD Ryzen 7 1700 @3 GHz 481 H/s 220 H/s 1760 H/s
AMD Ryzen 7 2700 @3 GHz 552 H/s 246 H/s 1946 H/s

Oder pro­zen­tu­al:

  Mone­ro
Cryp­to­night v7
SumoKoin
Cryp­to­night-Hea­vy
Turt­le­Coin
Cryp­to­night-Lite v1
AMD Ryzen 7 1700 @3 GHz 100 % 100 % 100 %
AMD Ryzen 7 2700 @3 GHz 115 % 112 % 111 %

Zusam­men­fas­sung

Wie man sieht kom­men je nach Algo 11–15 % Ver­bes­se­rung allein durch die höhe­re IPC auf­grund der ver­bes­ser­ten Caches. Das ist genau das Fens­ter, das AMD in sei­ner Ankün­di­gung ver­spro­chen hat. Damit ist aber auch klar, dass zumin­dest beim Mining der über­wie­gen­de Groß­teil der höhe­ren Leis­tung von den Caches kommt und nicht vom höhe­ren Takt oder dem ver­bes­ser­ten Tur­bo.

Test­sys­tem: ASUS Prime B350-PLUS mit BIOS 4008 (AGE­­SA-Code Pin­­na­clePI-AM4 1.0.0.2a), Boxed-Küh­ler, 2x 8 GB Cru­ci­al DDR4-2667 Dual-Rank 16–16-16–39-1T im Dual-Chan­nel-Modus, Win­dows 10 v1709 mit akti­vier­tem Spec­t­re_v2-Schutz, xmrig 2.6.0-beta3.