News Erste Steamroller-APU bei Boinc gesichtet

Opteron

Redaktion
☆☆☆☆☆☆
Mitglied seit
13.08.2002
Beiträge
23.645
Renomée
2.254
  • SIMAP Race
  • Spinhenge ESL
  • BOINC Pentathlon 2012
<div class="newsfloatleft"><a href=""><img src="http://www.planet3dnow.de/photoplog/images/54308/1_AMD-Logo.png" border="0" alt="AMD-Logo"></a></div>In seinem eigenen Blog berichtet unser Forenmitglied Dresdenboy über einen Fund bei der Boincstats-Recherche. Dabei lief ihm ein nagelneues AMD-Sample einer APU mit Steamroller-Kernen über den Weg, die künftig in den Kaveri- und Berlin-APUs zum Einsatz kommen werden.

Wie wir bereits bei der <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?id=1371538033">Vorstellung der Server-Version Berlin</a> berichteten, wird der Chip über vier Steamroller-Kerne sowie 2 x 2 MB L2-Cache verfügen:

<center><a href="http://www.planet3dnow.de/photoplog/file.php?n=24902&w=o"><img src="http://www.planet3dnow.de/photoplog/file.php?n=24902&w=l"></a>
Kaveri/Berlin-APU-Architektur</center>

Durch die BOINC-Informationen sind nun weitere Details des Modells bekannt:

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=25090&w=o">
Systeminformationen von Boinc</center>

Dabei muss man die L2-Größe ignorieren, da diese nicht genau erkannt wird. Die restlichen Daten, insbesondere die CPU-Typ-Informationen, weisen den Chip als zur Familie 15h (dezimal 21) gehörig aus. Dies ist typisch für alle Chips, die auf der Bulldozer-Architektur basieren. Bei der Modellbezeichnung wird der Chip als Modell 30h (dezimal 48) identifiziert, bisher die höchste Einordnung nach den Richland-APUs, die die Modellnummer 13h aufweisen. Der große Sprung auf die Modellnummer 30h ist durch den Umstand zu erklären, dass AMD die Chips der Baureihe 20h schon vor längerem gestrichen hat (<a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1328302051">wir berichteten</a>).

Die Taktraten der APU lassen sich laut Dresdenboy dann aus den CPU-Typ-Informationen, die mit "2M186092H4467_23/18/12/05_1304" angegeben sind, extrahieren. Demnach betrüge der maximale Turbotakt 2,3 GHz, der Basistakt 1,8 GHz und der niedrigste Takt mit 1,2 GHz bezöge sich auf den Takt der Northbridge. Da bisherige APUs über keinen L3-Cache verfügen, der mit dem gleichen Takt betrieben werden würde, arbeiten deren Northbridges ebenfalls mit relativ niedrigen Taktfrequenzen, typisch sind 1,6 - 1,8 GHz. 1,2 GHz ist nun noch eine Stufe niedriger, allerdings lässt sich mit der Typenbezeichnung "1304" und dem im Internet durchgesickerten Kaveri-Typenschlüssel (siehe Links) dieser Umstand aufklären: Es handelt sich um eine 35-W-APU mit entsprechend niedrigen Taktraten. Die GPU würde laut Dresdenboys Untersuchung mit 500 MHz betrieben werden.

Als kleinen Bonus zum Schluß gibt es noch die üblichen BOINC-Mikrobenchmarks. Dabei werden im Integertest 2.544 Millionen Ops/Sekunde erzielt, die FPU-Leistung wird mit 504 Millionen Ops/Sekunde gemessen. Somit erreicht der Chip lediglich ein Viertel der Leistung, die wir für den FX-8350 bei 4 GHz in unserem <a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=408737&garpg=13#content_start">Vishera-Test</a> vermessen haben. Dies ist in Anbetracht der doppelten Thread-Anzahl und des beinahe doppelt so hohen Taktes realistisch. IPC-Verbesserungen würden bei dieser Betrachtung somit keine anfallen, jedoch verbieten sich genaue Leistungs-Spekulationen von vornherein, denn das Sample ist nur ein A0-Stepping, d.h. erstes Silizium, bei dem mit vielen, schwerwiegenden Fehlern gerechnet werden muss.

Zur weiteren Diskussion steht unser <a href="http://www.planet3dnow.de/vbulletin/showthread.php?p=4794864#post4794864">Kaveri-Forenthread</a> oder der Kommentarthread (s.u.) zur Verfügung.

<b>Links zum Thema:</b><ul><li><a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?id=1371538033">AMD aktualisiert Opteron-Roadmap bis 2014 - Berlin, Warsaw und Seattle sollen es richten [Update]</a></li><li><a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1328302051">AMD Analystentag 2012, der Tag danach: Piledriver 10h & 20h; Fragezeichen bei 28nm CPU-Updates</a></li></ul>Quellen:</b><ul><li><a href="http://citavia.blog.de/2013/07/02/amd-kaveri-engineering-sample-sighted-in-the-wild-16196102/" target="b">Dresdenboys Blog: AMD Kaveri engineering sample sighted in the wild</a></li><li><a href="http://www.rage3d.com/board/showthread.php?t=34001853" target="b">Leaked AMD Catalyst driver codenames for Volcanic Islands GPU's: Hawaii confirmed</a></li></ul>
 
Genau deswegen schau ich regelmäßig bei P3DN vorbei. Solche Berichte gibt es fast ausschließlich nur hier 8)
 
Als kleinen Bonus zum Schluß gibt es noch die üblichen Boinc-Microbenchmarks. Dabei werden bei dem Integertest 2544 Millionen Ops/Sekunde erzielt, die FPU wird mit 504 Millionen Ops/Sekunde gemessen. Damit ist der Chip ca. viermal langsamer als ein Vishera 8350 bei 4 GHz aus unserem Vishera-Test. Dies ist im Anbetracht der doppelten Threadanzahl und des beinahe doppelt so hohen Taktes realistisch.

Der Boinc Benchmark gibt doch immer nur die werte für einen CPU Kern an und nicht für alle. Der Wert ist mit 2500 / 500 übrigens deutlich Niederiger als bei meinem Laptop mit core i3 3217U:
Measured floating point speed 1751.19 million ops/sec
Measured integer speed 6170.84 million ops/sec

Edit: selbst ein Pentium M mit 1,86 GHz hatte schon 3100 / 1400 im Boinc Benchmark also hoffen wir mal dass das ein Modul mit 4 Threads ist was wir da sehen. Die Single Thread Performance ist offensichtlich unterirdisch. ( Turbo deaktiviert? )
 
Zuletzt bearbeitet:
Sehe Shadowtroopers Einwand ganz genauso, die Benchmarkwerte passen also eigentlich nicht zu den vermuteten Taktraten.

Hier die Werte meiner AMD APU E-450:
ermittelte Geschwindigkeit für Gleitkommazahlen 1416.97 Millionen Operationen/Sek
ermittelte Geschwindigkeit für ganze Zahlen 2992.94 Millionen Operationen/Sek

Und das für einen Bobcat bei 1,65 GHz Takt.
 
Das passt doch dann recht genau für den niedrigsten P-State bei 1,4GHz. Für ein E-Sample braucht man auch nicht mehr..
 
Das passt doch dann recht genau für den niedrigsten P-State bei 1,4GHz. Für ein E-Sample braucht man auch nicht mehr..

Der Niedrigste ist 1,8 GHz laut Text währe jetzt gut wenn mal jemand einen Vishera bei 1,8 GHz durch den Boinc Benchmark jagen könnte als vergleich... :)

Wobei sollte ein Steamroller Kern mit 1,8 GHz nicht wenigstens schneller sein als ein Bobcat mit 1,65 GHz ?
 
Zuletzt bearbeitet:
War früh heute morgen? :D
Normalerweise wird Korrektur gelesen (dabei kann natürlich auch was durchrutschen), aber gerade bei News ist die Aktualität doch wichtiger als ein paar Rechtschreibfehler, da gilt dann im Zweifel: Erst veröffentlichen, später glattbügeln^^
 
War früh heute morgen? :D
Nein nur sehr spät ^^
Normalerweise wird Korrektur gelesen (dabei kann natürlich auch was durchrutschen), aber gerade bei News ist die Aktualität doch wichtiger als ein paar Rechtschreibfehler, da gilt dann im Zweifel: Erst veröffentlichen, später glattbügeln^^
Jupp, ich wollte es wegen der Aktualität noch veröffentlichen, aber das Ergebnis haben wir jetzt gesehen ^^

Hab die Meldung jetzt überarbeitet. Danke an alle Tippgeber :)
 
die ersten Steamroller-Einheiten...wow...na dann gibts ja doch wieder neue Hoffnung für AMD. Zumindest arbeiten sie dran. Toll recherchiert und kommentiert! *great*
 
Bei dieser Gelegenheit sollte man vielleicht erwähnen, dass die Werte von BOINC-Version zu BOINC-Version schon auch mal differieren können und zudem der Test sowieso nur Single-Threaded ist.

Unter BOINC 7.0.28 for windows_x86_64 kann ich auf einem Vishera - gedrosselt auf 1,4 GHz - folgende Vergleichswerte beisteuern:
03.07.2013 15:04:58 | | 1022 floating point MIPS (Whetstone) per CPU
03.07.2013 15:04:58 | | 3522 integer MIPS (Dhrystone) per CPU
Umgerechnet auf 1,8 GHz wären das im günstigsten Fall damit
~ 1314 floating point MIPS (Whetstone) per CPU
~ 4528 integer MIPS (Dhrystone) per CPU
 
Bei dieser Gelegenheit sollte man vielleicht erwähnen, dass die Werte von BOINC-Version zu BOINC-Version schon auch mal differieren können
Jo leider, für die Boincversion bräuchten wir noch ne fertige WU, aber leider gibts keine mehr :(
War nur ein weiterer Grund, um sich nicht zu lange den Kopf zu zerbrechen, wir wissen nix, also kanns nichts besseres werden, als ein Schuß ins Blaue ^^
und zudem der Test sowieso nur Single-Threaded ist.
Ne, der FP-Teil ist Multithread, schau einfach mal im Taskmanager ;-)

Sollte das Steamroller Engineering-Sample wirklich ausgespuckt haben
Wo hast Du denn die Zahlen her? *noahnung*
 
Wo hast Du denn die Zahlen her? *noahnung*
War ein Missverständnis. Ich dachte die Zahlen von Shadowtrooper früher im Thread wären die Kaveri-Zahlen, dabei sind das seine eigenen ;)

Hab jetzt mal bei BOINC direkt nachgeschaut. Die Werte sind wirklich furchtbar schlecht, das kann kaum ein aussagekräftiger Entwicklungsstand sein. Da muss so ziemlich alles an Features in der CPU deaktiviert gewesen sein :P
 
Von der den int Werten her entspricht das ca. einem Llano (quad) @1,2GHz die FP Werte sind ca. die Hälfte davon.
 
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9830589&postcount=403
Der BOINC-Bench ist sowieso Schrott. Der reagiert nur auf bestimmte Architektursachen überhaupt und liefert typischerweise sogar über verwandte Architekturen (mit teils deutlich unterschiedlicher RealWorld-Leistung) hinweg praktisch ein Produkt aus einem konstanten Multiplikator und der Taktfrequenz als Ergebnis zurück. Die Korrelation mit der wirklichen Leistungsfähigkeit ist überaus schlecht bis kaum vorhanden.
 
Ich denke auch, dass uns die Absolutwerte erst mal wenig bis gar nichts sagen. Dafür sind sie zu schlecht. Da müsste das Sample schon mit deutlich unter 1 GHz getaktet haben. Was man wohl ausschliessen kann. Und langsamer als Piledriver wird Steamroller sicherlich nicht werden.

Interessant finde ich allerdings das Verhältnis von Integer zu FP. Kaveri scheint hier mehr bei Integer zuzulegen. Würde erst mal nicht gegen ein Aufbohren der Integer Cluster sprechen. So wie wir es ja auch beim angeblichen Steamroller Die Shot spekulieren. Zwar wurde dort auch die FPU aufgebohrt. Allerdings erfordert die spezielle Softwareoptimierungen, gerade was AVX betrifft. Weiss jemand, wie es da bei Cosmology@Home mit dem Softwaresupport bestellt ist? Ansonsten, die Integer Cluster machen sich dagegen bei jeder Art von Code bemerkbar.
 
Ich denke auch, dass uns die Absolutwerte erst mal wenig bis gar nichts sagen. Dafür sind sie zu schlecht. Da müsste das Sample schon mit deutlich unter 1 GHz getaktet haben. Was man wohl ausschliessen kann.
Wenn ich mich recht erinnere liefen die ersten K8 damals auch nur mit 800 Mhz. Aber naja, "etwas" andere Geschichte ^^
 
Wäre schön wenn AMD mal wieder eine richtige Bombe raus haut, die letzte war der X6!
Die können ruhig eine Baureihe streichen wie im Beitrag steht mein X6 erledigt alles bestens.
Ein 20nm CPU wäre schon (TSMC kündigt diese ja an für Apple, so mag GF dass ja wohl auch hinbekommen bis dahin oder?) Fein dafür warte ich auch noch bis 2014 aber dann wird es echt Zeit für ein neuen AMD CPU.

mfg
 
Ein 20nm CPU wäre schon (TSMC kündigt diese ja an für Apple, so mag GF dass ja wohl auch hinbekommen bis dahin oder?) Fein dafür warte ich auch noch bis 2014 aber dann wird es echt Zeit für ein neuen AMD CPU.

mfg
da muss ich dich enttäuschen. Erstmal wird es eine ganze Reihe 28nm geben. 2015 wohl dann erst 20nm oder ? . Dennoch es gibt Ideen und somit werden wir wohl auch Produkte sehen. Ich bin erstmal auf die neuen Desktop Modelle bis 65W gespannt (nicht Kaveri, der ist mir schon zu langsam)

P.S. kann man nicht mal in Ruhe seine CPUs testen, ohne das ihr das mitbekommt :D, nur gut das ihr die 45 und 65W noch nicht entdeckt habt.
 
Nun sollte es ein 28nm geben der etwas mehr Leistung bringt und weniger TDP hat würde ich auch ein 8 Core nehmen, solange die sich die FPU Teilen müssen nutzt mir so ein CPU halt wenig da ich Hauptsächlich x264 Encodes mache da sind die 8er wohl nicht sehr viel Schneller als mein X6, dass es sich Lohnen würde eine neue CPU zu Kaufen oder?
 
wichtiger als eine 2-Modul-APU (Family 15h Mod. 30h-3Fh) wären die 4-? Moduler CPUs (Family 15h Mod. 40h-4Fh) - die "Boincleaks" sind auch langsam überfällig
 
Im AT Forum meint jemand, dass das ein Prototyp sei, der schon einige Monate alt ist. Auf der Computex zB habe man eine aktuellere Version in Aktion gesehen. Keine Ahnung, ob der das nur so sagt oder ob der mehr weiss.
 
Zurück
Oben Unten