Gute Nachrichten f체r Verf체gbarkeit: Zen 3 f체r Kryptominer wohl uninteressant

Es war ein unglaub짯li짯cher Hype, der vor und zur Markt짯ein짯f체h짯rung des Ryzen 5000 쏺er짯meer mit der neu짯en Zen-3-Archi짯tek짯tur auf짯ge짯baut wur짯de. Und die Reviews haben gezeigt: AMD hat짯te nicht zu viel ver짯spro짯chen. Im Gegen짯teil best채짯tig짯te sich die Ten짯denz der letz짯ten paar Jah짯re unter Lisa Su, dass AMD bei den Her짯stel짯ler-Bench짯marks kein Cher짯ry-Picking betreibt und v철l짯lig unrea짯lis짯ti짯sche Wer짯te ver짯spro짯chen hat, die in der Pra짯xis anschlie짯횩end nicht zu hal짯ten waren. Sol짯che Zei짯ten gab es bei AMD ja auch; es sei짯en nur Phe짯nom und Bull짯do짯zer genannt. Und so kam was kom짯men muss짯te. Obwohl AMD dach짯te, f체r aus짯rei짯chend St체ck짯zah짯len im Chan짯nel gesorgt zu haben, waren die Ryzen-5000-Pro짯zes짯so짯ren in weni짯gen Stun짯den aus짯ver짯kauft. Man짯che Beob짯ach짯ter spra짯chen gar von einem Paper짯launch, aber genau das Gegen짯teil ist der Fall. Wie der deut짯sche Online-H채nd짯ler Mind짯fac짯to짯ry mit짯ge짯teilt hat, war es der bes짯te CPU-Launch (sprich: die meis짯ten Ver짯k채u짯fe) ever.

Momen짯tan herrscht also Ebbe bei den H채nd짯lern nicht auf짯grund von Her짯stel짯lungs짯pro짯ble짯men, son짯dern auf짯grund der mas짯si짯ven Nach짯fra짯ge daher w채re das schlimms짯te, was den Kun짯den jetzt pas짯sie짯ren k철nn짯te, dass die Zen-3-Archi짯tek짯tur sich auch noch opti짯mal f체r Kryp짯to짯mi짯ning eig짯net. Wie wir 2017 bei den GPUs gese짯hen haben, ist der Markt dann schnell leer짯ge짯fegt noch ehe die Hard짯ware 체ber짯haupt in End짯kun짯den짯n채짯he kommt. Da Kryp짯to짯w채h짯run짯gen der짯zeit auch noch mas짯siv im Auf짯wind sind, muss man hier immer auf der Hut sein.

Was, wenn nun Zen 3 durch sei짯ne zahl짯rei짯chen Opti짯mie짯run짯gen bei Cache und Exe짯cu짯ti짯on-Units 채hn짯li짯che Fort짯schrit짯te macht wie beim Gam짯ing? Besteht die Gefahr, dass Kryp짯to짯mi짯ner den End짯kun짯den die Ryzen-5000-CPU wegkaufen?

Ers짯te Anzei짯chen deu짯ten dar짯auf hin, dass dies nicht der Fall sein wird und bei genaue짯rer Betrach짯tung wird auch deut짯lich wieso.

1. Gemein짯sa짯mer L3-Cache dank CCX-횆nde짯rung spielt beim Kryp짯to짯mi짯ning kei짯ne Rolle
Der L3-Cache des Ryzen spielt genau genom짯men die Haupt짯rol짯le beim Kryp짯to짯mi짯ning mit Ran짯domX, dem ein짯zi짯gen Algo짯rith짯mus, der noch rele짯vant ist f체r CPUs, denn dort lagern die in Berech짯nung befind짯li짯chen Daten. 2 MB sind es pro Thread bei Mone짯ro. Das ist ide짯al f체r den bis짯he짯ri짯gen Ryzen 3000, denn dank sei짯nes 체ppi짯gen L3-Caches konn짯te er all sei짯ne Ker짯ne und Threads akti짯vie짯ren und so die Rechen-Ein짯hei짯ten maxi짯mal aus짯las짯ten. Das ist der Haupt짯grund f체r sei짯ne 횥ber짯le짯gen짯heit gegen짯체ber der Vor짯g채n짯ger-Gene짯ra짯ti짯on und dem Intel-Mit짯be짯werb. Aber

2. Core-zu-Core-Kom짯mu짯ni짯ka짯ti짯on fin짯det nicht statt
쫤as im Gegen짯satz zum Gam짯ing beim Kryp짯to짯mi짯ning gar kei짯ne Rol짯le spielt, ist Core-zu-Core-Kom짯mu짯ni짯ka짯ti짯on und der gemein짯sa짯me L3-Cache je Die statt der Tren짯nung in zwei CCX. Das liegt dar짯an, dass Kryp짯to짯mi짯ning-Soft짯ware nicht mul짯ti짯th짯rea짯ded ist, son짯dern 채hn짯lich wie die meis짯ten BOINC-Pro짯jek짯te mehr짯fach sin짯gle짯th짯rea짯ded. Es gibt also nicht zig Threads, die an einem gemein짯sa짯men Daten짯pool her짯um짯rech짯nen, kei짯ne Ker짯ne, die Daten unter짯ein짯an짯der aus짯tau짯schen m체ss짯ten, statt짯des짯sen nur n Threads mit jeweils ihren eige짯nen Daten (쏶cratch짯pads), die m철g짯lichst unge짯st철rt neben짯ei짯nen짯an짯der her짯rech짯nen m철ch짯ten. Zudem sind die Threads bei den meis짯ten Minern auf fixen Ker짯nen fest짯ge짯pinnt, sodass sie sowie짯so maxi짯ma짯le Loka짯li짯t채t auf짯wei짯sen. Core-zu-Core-Kom짯mu짯ni짯ka짯ti짯on und der gemein짯sa짯me L3-Cache sind also irrelevant.

3. Die L3-Cache-Latenz ist bei Zen 3 schlech짯ter geworden
Wenn die Core-zu-Core-Kom짯mu짯ni짯ka짯ti짯on kei짯ne Rol짯le spielt und auch der gemein짯sa짯me L3-Cache kein Kri짯te짯ri짯um ist, das Kryp짯to짯mi짯ning (mit Ran짯domX) posi짯tiv beein짯flus짯sen k철nn짯te, dann kann die gene짯rell schlech짯ter gewor짯de짯ne L3-Latenz sehr wohl Ein짯fluss haben; n채m짯lich einen nega짯ti짯ven. Wie wir in unse짯rem Tech짯nik-Arti짯kel gezeigt haben, liegt die Latenz eines Kerns beim Zugriff auf 쐓ei짯nen L3-Cache nun nicht mehr bei 39 Tak짯ten wie noch bei Zen 2, son짯dern bei 46 Tak짯ten. Zudem ist auch die Band짯brei짯te des L3-Caches gleich geblie짯ben; mit dem nega짯ti짯ven Effekt, dass nun nicht 4 Ker짯ne dar짯an nuckeln, son짯dern 8 je Die. Da bei Zen 2/3 sowie짯so alle gera짯de in Berech짯nung befind짯li짯chen Daten in den L3-Cache pas짯sen, ist das Haupt짯kri짯te짯ri짯um f체r die Ver짯ar짯bei짯tung, wie schnell sie gelie짯fert wer짯den. Und da ist Zen 3 schlech짯ter als Zen 2.

4. Pre짯fet짯ching spielt kei짯ne Rolle
AMD gibt an, bei Zen 3 die Branch-Pre짯dic짯tors und das Pre짯fet짯ching ver짯bes짯sert zu haben. Zumin짯dest das Pre짯fet짯ching wird Zen 3 beim Kryp짯to짯mi짯ning unter Ran짯domX nicht hel짯fen, da die짯ser Algo짯rith짯mus absicht짯lich so aus짯ge짯legt ist, dass er maxi짯mal zuf채l짯lig Daten ben철짯tigt. Daher war es bis짯her sogar von Vor짯teil, per MSR-Modi짯fi짯ka짯tio짯nen die Hard짯ware-Pre짯fet짯cher abzu짯schal짯ten. Sofern AMD es nicht geschafft hat, auch 쐚uf채l짯li짯ge Zugrif짯fe bes짯ser vor짯her짯zu짯sa짯gen, wird Zen 3 der ver짯bes짯ser짯te Pre짯fet짯cher nicht hel짯fen, da er (wohl?) sowie짯so deak짯ti짯viert wer짯den wird von der Mining-Soft짯ware sobald sich her짯aus짯stellt, dass auch Zen 3 ohne Hard짯ware-Pre짯fet짯ching schnel짯ler ist.

5. Her짯stel짯lungs짯pro짯zess ist gleich geblie짯ben, Takt짯ra짯ten auch unge짯f채hr, Under짯vol짯ting (noch) nicht m철glich
Die meis짯ten Sys짯te짯me, auf denen aktiv Kryp짯to짯mi짯ning betrie짯ben wird, wer짯den in Sachen Ener짯gie짯ver짯brauch opti짯miert. Ent짯we짯der wird die Sockel-Power begrenzt oder Under짯vol짯ting betrie짯ben, in jedem Fall wer짯den alle Hebel in Bewe짯gung gesetzt, um so wenig Strom wie m철g짯lich zu ver짯brau짯chen und dabei so wenig wie m철g짯lich Leis짯tung zu ver짯lie짯ren, denn die Kur짯ve ver짯l채uft nicht line짯ar. So konn짯te man einem Ryzen 9 3900X z.B. ohne wei짯te짯res im BIOS oder per Ryzen-Mas짯ter das PPT von 142 W auf 125 W dros짯seln und damit Strom(kosten) und K체hl짯auf짯wand spa짯ren ohne dabei nen짯nens짯wert Hash짯ra짯te ein짯zu짯b체짯횩en. Wer noch wei짯ter opti짯mie짯ren moch짯te, konn짯te sich aktiv ans Under짯vol짯ting wagen. Da bei Ryzen 5000 der Her짯stel짯lungs짯pro짯zess gleich geblie짯ben ist, sind hier kei짯ne Effi짯zi짯enz-Wun짯der zu erwar짯ten. Zudem sind mit den aktu짯el짯len AGE짯SA-Ver짯sio짯nen der Main짯boards noch kei짯ne Under짯vol짯ting-Optio짯nen freigeschaltet.

6. Anzahl der Ker짯ne und Cache-Gr철짯횩e gleich geblieben
Im Gegen짯satz zur Umstel짯lung von Zen/Zen+ auf Zen 2 ist bei der aktu짯el짯len Ite짯ra짯ti짯on sowohl die Anzahl der Ker짯ne gleich geblie짯ben, als auch die Gr철짯횩e der Caches. Man kann also nicht pl철tz짯lich dop짯pelt oder gar 4 Mal so vie짯le Threads star짯ten wie mit der Vor짯g채n짯ger-Gene짯ra짯ti짯on und ent짯spre짯chend deut짯lich h철he짯re Hash짯ra짯ten errei짯chen. Was bleibt dann noch gro횩?

Daher ist es nicht ver짯wun짯der짯lich, dass die ers짯ten Kryp짯to짯mi짯ning-Bench짯marks unter Ran짯domX mit der Mining-Soft짯ware xmrig die Zen-3-Ryzens eher hin짯ter den Zen-2-Ryzens sehen. Der Ver짯gleich hinkt nat체r짯lich noch, zum einen, da die Anzahl der ein짯ge짯sand짯ten Wer짯te bei Zen 2 deut짯lich h철her liegt als bei Zen 3 und zum ande짯ren, da die Opti짯mie짯rung der Soft짯ware auf Zen 3 bis짯her nur rudi짯men짯t채r erfolgt ist.

7. Zen 2 ist deut짯lich bil짯li짯ger als Zen 3
Wenn von Zen 3 also sowie짯so kei짯ne gro짯횩en Hash짯ra짯te-Spr체n짯ge zu erwar짯ten sind und Zen-2-Pro짯zes짯so짯ren auch noch deut짯lich bil짯li짯ger zu bekom짯men und 체ber짯haupt zu bekom짯men sind; wes짯halb soll짯te sich eine Mining-Farm dann auf Zen 3 st체r짯zen? ROI ist schlie횩짯lich auch bei Kryp짯to짯mi짯nern ein Kriterium.

Eine gro짯횩e Unbe짯kann짯te ist bis짯her noch der neue Befehl VAES, der wie geschil짯dert bei Zen 3 als AVX2-Befehl aus짯ge짯f체hrt ist, also 256 Bit breit. Ran짯domX nutzt AES und theo짯re짯tisch bie짯tet der Umstieg von AVX (128 Bit) auf AVX2 (256 Bit) ein Per짯for짯mance-Plus-Poten짯zi짯al von +100%. Da das jedoch nur ein Befehl in einer gan짯zen Fol짯ge von Befeh짯len des Hash짯al짯go짯rith짯mus ist und Ran짯domX grund짯s채tz짯lich eher beim Speicher/Cache deckelt als bei den Rechen짯ein짯hei짯ten, wird der ganz gro짯횩e Sprung hier wohl eher aus짯blei짯ben, selbst wenn er irgend짯wann aktiv von der Mining-Soft짯ware genutzt wird.

Daher m체s짯sen End짯kun짯den der짯zeit eher kei짯ne Sor짯ge haben, dass das Ryzen-5000-Kon짯tin짯gent von 체ber짯eif짯ri짯gen Kryp짯to짯mi짯nern leer짯ge짯kauft wird. Daf체r ist Kryp짯to짯mi짯ning via CPU der짯zeit gene짯rell zu unpro짯fi짯ta짯bel. Selbst wenn die Top-Crun짯cher unse짯res BOINC-Teams ihre Dual-EPYC 7V12-Boli짯den mit 256 CPU-Threads auf Mone짯ro los짯las짯sen w체r짯den, w체r짯den sie pro Tag aktu짯ell nur ca. 6 EUR ersch체r짯fen Strom짯kos짯ten und Anschaf짯fung noch nicht ein짯ge짯rech짯net; Ryzen-Pro짯zes짯so짯ren ent짯spre짯chend noch deut짯lich weni짯ger. Nat체r짯lich gibt es immer Hod짯ler, die hof짯fen, dass der Wert ihrer Kryp짯to짯w채h짯rung in 2 Jah짯ren beim x1000-fachen ste짯hen wird, aber das sind nicht die Mining-Far짯men, die M채rk짯te leer짯kau짯fen wie vor 3 Jah짯ren bei den GPUs. Mining-Far짯men m체s짯sen ihre Inves짯ti짯tio짯nen zeit짯nah wie짯der her짯ein짯brin짯gen, daher wird dort nicht gehor짯tet und auf bes짯ser Zei짯ten gehofft, son짯dern gesch체rft und zu Geld gemacht. Und da ist bei Ryzen 5000 der짯zeit kein Anreiz vor짯han짯den. Also gute Nach짯rich짯ten f체r alle Endkunden.