Ergebnis 1 bis 10 von 10

Hybrid-Darstellung

  1. Beitrag #1
    Themenstarter
    Administration Avatar von Nero24.

    Registriert seit
    01.07.2000
    Beiträge
    18.193
    Danke
    9
    Gedankt 5.835 Mal für 946 Themen
    Blog-Einträge
    20

    Aus dem Forum: AMD Piledriver-Kern zeigt sich stark verbessert

    AMD-LogoAls AMD im Herbst letzten Jahres endlich seine nagelneue Bulldozer-Architektur vorstellte, war die Enttäuschung groß. Das neue Konzept klang zwar auf dem Papier vielversprechend, in der Praxis jedoch mussten die FX-Prozessoren ordentlich Federn lassen. Zwar ließ sich die neue Architektur ganz gut takten, was eine Vorgabe bei der Entwicklung war, jedoch ging dies zu Lasten der IPC (Instruction per Clockcycle); der Bulldozer erledigte pro Kern pro Takt also weniger Arbeit, als sein Vorgänger K10. Das wurde auch bei unserem ausführlichen AMD FX-Review und vor allem der Analyse und dem Nachtest deutlich.

    In der Folge wurde viel spekuliert und analysiert, woran es denn liegen könnte, dass eine frische, auf einem weißen Blatt Papier konzipierte neue Architektur der fast 12 Jahre alten K7/K8/K9/K10 Evolutionsreihe nicht ordentlich um die Ohren fährt. Dazu existiert im Forum ein Spekulationsthreads namens Fehler, Bugs, mangelnde Performance - Woran liegt es? mit mittlerweile 28 Seiten, wo die Architektur auseinander genommen wurde.

    Anfang des Jahres erschien ein Patch für den Windows 7 Scheduler, nachdem deutlich war, dass Windows 7 mit der Modul-Bauweise des Bulldozers nicht so recht klarkommt und Threads/Prozesse auf die "falschen" Kerne verteilt. Auch dazu hatten wir einen Artikel, der zeigt, dass die Performance damit minimal besser wird; aber nicht die Welt.

    Als der AMD FX auf den Markt kam, war bereits klar, dass eine Version 2 des Bulldozer-Kerns namens Piledriver, der für 2012 geplant war, vieles besser können soll, als die Urversion. Zwar bleibt die Architektur im wesentlich gleich, jedoch soll an vielen Schwachpunkten gefeilt werden. Der Piledriver für den Desktop wird noch vermutlich bis Spätsommer/Herbst auf sich warten lassen, jedoch kann sich der geneigte Leser einen ersten Eindruck verschaffen, denn die Piledriver-Kerne stecken in den neuen Trinity-APUs, die gerade Einzug erhalten in Laptops.

    Allerdings ist es schwierig, daraus Schlussfolgerungen zu ziehen. Vom Ur-Bulldozer gab es keine mobilen Versionen und vom Piledriver gibt es derzeit nur APU-Versionen, denen z.B. der L3-Cache fehlt. Zudem hat der schnellste Trinity nur zwei Module (4 INT-Kerne), wohingegen Bulldozer mit zwei, drei und vier Modulen (4, 6, 8 INT-Kerne) auf dem Markt ist. Zudem sollen die Piledriver-FX-Prozessoren für den Desktop neben L3-Cache auch noch höher getaktet sein. Kurzum: ein 1:1 Vergleich fällt zum aktuellen Zeitpunkt schwer.

    Was man jedoch sehr wohl machen kann ist, die Versprechungen, die AMD bezüglich der Detailoptimierungen gegeben hat, in der Praxis zu überprüfen. Das tun unsere emsigen Community-Mitglieder derzeit in einem Forenthread namens Trinity nimmt Fahrt auf. Dort werden z.B. die Cache-Latenzen geprüft und diverse maschinennahe Codes auf deren Ausführungsgeschwindigkeit hin überprüft. Möglich ist das, da User "Herr Melin" bereits über ein Trinity-Notebook verfügt. Und was dort getestet wird, klingt nicht schlecht für künftige Piledriver Desktop-Prozessoren.

    Zum einen scheinen die Cache-Latenzen verkürzt worden zu sein.

    AMD FX-6100 (Zambezi; 3 Bulldozer-Module)


    AMD A10-4600M (Trinity; 2 Piledriver-Module)


    Wie man sieht liegen die L2-Latenzen mit 16 vs. 20 Zyklen bei "Pseudo-Random" deutlich niedriger. Ebenfalls besser liegen die Random-Werte, die gerade eben so noch in den 2 MB großen L2-Cache passen. Hier liegen im schlechtesten Fall 31 Zyklen an, während Bulldozer bei 39 liegt. Anschließend wird es schwierig, da Bulldozer noch über eine dritte Cachestufe verfügt, während Trinity nach dem L2 direkt auf den Speicher zugreifen muss.

    Auch ein Instruction Latency Dump mit AIDA zeigt durchaus Verbesserungen, wie Dresdenboy herausgefunden hat:
    Was da im Vergleich der Latenzen u. Durchsatzzahlen mit BDv1 schon auffällt:
    mov r32,r32 -> Durchsatz von 2 auf 4
    mov r64,r64 -> von 2 auf 3
    IDIV/DIV -> Latenzen deutlich runter, z.B. 96/63b: 80->44 Takte, 63/63b: 80->14 Takte
    Einige SSE2/AVX-Lade/Speicher-Ops: teils Durchsatz +100%, teils halbiert.
    Die niedrigeren Latenzen bei IDIV sind der endlich funktionierenden IDIV-Einheit geschuldet. Das sind nur ein paar wenige Aspekte, die derzeit bei uns im Forum von Usern analysiert und diskutiert werden. In jedem Fall lohnt es sich für interessierte Technikfans, das Prozessor-Forum samt Spekulations-Ecke im Auge zu behalten bzw. sich zu beteiligen. Sobald AMD Desktop-Prozessoren herausrückt, gibt's natürlich wie gewohnt auf Planet 3DNow! wieder einen ausführlichen Test. Spätestens dann wird klar werden, ob Piledriver das geworden ist, was Bulldozer bereits hätte werden sollen...

    Links zum Thema:

  2. Die folgenden 24 Benutzer sagen Danke zu Nero24. für diesen nützlichen Beitrag:

    2fast_speedy (21.06.2012), Andy06 (22.06.2012), Bartfratze (21.06.2012), Bobo_Oberon (21.06.2012), Denniss (21.06.2012), Elandur (21.06.2012), Gerby19 (21.06.2012), gruffi (22.06.2012), larsbo (21.06.2012), MrBad (21.06.2012), Opteron (21.06.2012), Raspo (21.06.2012), S.I. (21.06.2012), Sefegiru (21.06.2012), Shai Hulud (21.06.2012), SPawner (21.06.2012), Stonehedge (21.06.2012), The_crow (22.06.2012), TNT (23.06.2012), towatai (21.06.2012), wintermute_3dc (21.06.2012), yakon (21.06.2012), yasu (22.06.2012), [MTB]JackTheRipper (21.06.2012)

  3. Beitrag #2
    Admiral
    Special
    Admiral
    Avatar von Stonehedge

    Registriert seit
    04.07.2002
    Beiträge
    1.389
    Danke
    207
    Gedankt 90 Mal für 34 Themen
    Danke für die Zusammenfassung des Threads, für mich als nicht technischen Freak sehr lesenswert! Danke auch an alle Mitglieder in diesen Threads, die sich die Mühe machen!

  4. Beitrag #3
    Moderation
    Moderation
    Avatar von S.I.
    • Mein System
      Desktopsystem
      Prozessor: 1090T 10/03 B.E. @Sockel AM2+ [Bios 3702 !]@moderat~3330MHz+Turbo= 4033MHz; 2,61GHz NB
      Mainboard: Asus M4A79Deluxe =1.Rechner/2.Rechner: Gigabyte Ma790GP DS4h F6/7b:9850B.E.
      Kühlung: Luftkühlung:EKL Großglockner Alpenföhn =3Lüfter regelbar
      Arbeitsspeicher: PartríotDDR2-800@1071Mhz/ Vollbestückung@ ~11,5ns
      Grafikkarte: zwei 5850 Sapphire Toxic oc CF 2x2GB @850Mhz~ [entspricht etwa zwei 5870@Stock
      Display: 2x 22" |(Benq; LG) und 1x 23,6" Samsung TFTs
      Festplatte(n): 3x70GB Raptoren[Raid] =System(80 GB IDE-NotStart); Ein paar 750er WD Grenns (Tower voll!)
      Optische Laufwerke: LG SATA-DVD RW
      Soundkarte: Dolby home Theater (o.B.)2496 ! audiophile zu verkaufen!
      Gehäuse: ANTEC Twelfehundred 11 Lüfter regelbar(ohne Grakas)11 Laufwerke total
      Netzteil: Tagan 900W 82+ [CF-ready] 2xCF-Volllast ~620W
      Betriebssystem(e): V64 H.Prem.
      Browser: Opera &/ IEE64/ &Safari
      Sonstiges: Lukü/ geschl.Tower |V-CoreCPU =1,23 - 1,47V V Turbo//norm. VID= 1,45V~mit C&Q
    • Mein DC

      S.I. beim Distributed Computing

      Aktuelle Projekte: Spinhenge; Orbit; Milkyway
      Lieblingsprojekt: Orbit@home; Milkyway@home
      Rechner: Tuban, 3,8~ Ghz x6 /Turbo 4,095GHz [derzeit 1 Rechner] 2x Radeon HD 5850@5870 CFx.
      Mitglied der Kavallerie: Ja
      BOINC-Statistiken:

    Registriert seit
    18.11.2008
    Ort
    8685x <><
    Beiträge
    7.428
    Danke
    780
    Gedankt 304 Mal für 68 Themen
    dito. Da schließe ich mich gern an!

  5. Beitrag #4
    Grand Admiral
    Special
    Grand Admiral
    Avatar von SPINA
    • Mein System
      Notebook
      Modell: Dell Inspiron 8600 (Intel Pentium M 705; nVidia GeForce FX Go5650)
      Desktopsystem
      Prozessor: AMD Phenom II X4 945 PIB (HDX945WFK4DGM)
      Mainboard: ASUS M3N72-D (nForce 750a SLI)
      Arbeitsspeicher: (2x) Kingston KVR800D2E6K2/4G = 8GB
      Grafikkarte: HIS Radeon HD 7870 GHz Edition IceQ X
      Display: Hewlett-Packard Pavilion w2207h
      SSD(s): Crucial M500 2.5" SSD (CT240M500SSD1)
      Festplatte(n): Hitachi Travelstar EA 5K1000 (HTE541010A9E680)
      Optische Laufwerke: LG GH24NS70
      Gehäuse: Sharkoon Rebel9 Economy
      Netzteil: Seasonic M12II-520 Bronze
      Betriebssystem(e): Microsoft Windows 7 Professional (64-Bit)

    Registriert seit
    07.12.2003
    Beiträge
    14.932
    Danke
    135
    Gedankt 651 Mal für 111 Themen
    Zitat Zitat von Nero24 Beitrag anzeigen
    Zudem sollen die Piledriver-Prozessoren für den Desktop neben L3-Cache auch noch höher getaktet sein.
    Womöglich später auf dem Sockel AM3+. Auf dem Sockel FM2 sind der A8-5500 bis A10-5800K ohne L3 Cache angekündigt.

  6. Beitrag #5
    Themenstarter
    Administration Avatar von Nero24.

    Registriert seit
    01.07.2000
    Beiträge
    18.193
    Danke
    9
    Gedankt 5.835 Mal für 946 Themen
    Blog-Einträge
    20
    Zitat Zitat von SPINA Beitrag anzeigen
    Womöglich später auf dem Sockel AM3+. Auf dem Sockel FM2 sind der A8-5500 bis A10-5800K ohne L3 Cache angekündigt.
    Ja klar, mit Desktop war der FX-Piledriver für den Sockel AM3+ gemeint. Irgendwie sträubt sich's bei mir noch, Llano und Trinity zum Desktop zu zählen. Muss da vermutlich endlich mal umdenken...

  7. Beitrag #6
    Moderation MBDB
    Moderation
    Avatar von OBrian
    • Mein System
      Desktopsystem
      Prozessor: Phenom II X4 940 BE, C2-Stepping (undervolted)
      Mainboard: Gigabyte GA-MA69G-S3H (BIOS F7)
      Kühlung: Noctua NH-U12F
      Arbeitsspeicher: 4 GB DDR2-800 ADATA/OCZ
      Grafikkarte: Radeon HD 5850
      Display: NEC MultiSync 24WMGX³
      SSD(s): Samsung 840 Evo 256 GB
      Festplatte(n): WD Caviar Green 2 TB (WD20EARX)
      Optische Laufwerke: Samsung SH-S183L
      Soundkarte: Creative X-Fi EM mit YouP-PAX-Treibern, Headset: Sennheiser PC350
      Gehäuse: Coolermaster Stacker, 120mm-Lüfter ersetzt durch Scythe S-Flex, zusätzliche Staubfilter
      Netzteil: BeQuiet 500W PCGH-Edition
      Betriebssystem(e): Windows 7 x64
      Browser: Firefox
      Sonstiges: Tastatur: Zowie Celeritas Caseking-Mod (weiße Tasten)

    Registriert seit
    16.10.2000
    Ort
    NRW
    Beiträge
    13.014
    Danke
    0
    Gedankt 48 Mal für 31 Themen
    Kannst Dir ja den BigTower einfach auf die Knie stellen, dann ist es per definitionem ein Laptop

  8. Beitrag #7
    Cadet
    Avatar von Doppelschotte

    Registriert seit
    05.09.2008
    Beiträge
    37
    Danke
    1
    Gedankt 0 Mal für 0 Themen
    Schön zu sehen das der Bulldozer verbessert wurde!

    Gedämpft wird der Optimismus jedoch gleich, wenn man die Leistung der Piledriver Kerne mit den alten K10 Kernen vergleicht. Da wird sofort klar das der Leistungssprung doch eher klein ist. Ich besitze zwar ein AM3+ Board, darauf werkelt aber noch ein guter alter X4. Sofern es keine deutlichen Verbesserungen im 2 stelligen Bereich gibt, werde iich wohl Weihnachten auf deb blauen Zug aufspringen...

  9. Beitrag #8
    Commodore
    Special
    Commodore

    Registriert seit
    15.06.2007
    Beiträge
    365
    Danke
    11
    Gedankt 3 Mal für 1 Thema
    zusätzlich hat der AM3+ Piledriver (Vishera) ja auch 4 Module, also 8 Threads.
    Ist natürlich jetzt von der Anwendung abhängig, ob die daraus einen Nutzen ziehen kann,
    aber wenn sie alle Kerne auslastet, läuft der Vishera jedem K10.5 PhenomII x4 leicht 50% davon, aber das tat ein PhenomII x6 ja auch schon.

  10. Beitrag #9
    Vice Admiral
    Special
    Vice Admiral
    Avatar von deoroller

    Registriert seit
    18.12.2003
    Beiträge
    546
    Danke
    124
    Gedankt 0 Mal für 0 Themen
    Kommt keiner mit 140 Watt TDP?

  11. Beitrag #10
    Cadet
    Avatar von Doppelschotte

    Registriert seit
    05.09.2008
    Beiträge
    37
    Danke
    1
    Gedankt 0 Mal für 0 Themen
    @ Hitsche
    Ja, wenn alle Kerne ausgelastet werden! Das ist aber mit zunehmender Kernzahl immer seltener der Fall! 8 Kerne werden auch in Zukunft seltener ausgelastet sein als 4. Wenn dann noch die Leistung der einzelnen Kerne bei dem Quadcore höher ist, dann wird es halt eng. Ich kaufe mir sicher keinen neuen Proz um im alltäglichen Gebrauch 10% Mehrleistung zu haben, wenn das denn überhaupt der Fall wäre.

    Eine Fußheizung brauche ich in meinem zarten Alter auch noch nicht, deshalb bleibt extrem OC (wenn überhaupt) auch ausgeschlossen.
    So wie es derzeit aussieht ist ein Wechsel in das blaue Lager die sinnvollste Überlegung. Traurig aber wahr!

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •  
Single Sign On provided by vBSSO