Uraltprogramm zum Auslesen der Performance Counter

Opteron

Redaktion
☆☆☆☆☆☆
Mitglied seit
13.08.2002
Beiträge
23.645
Renomée
2.254
  • SIMAP Race
  • Spinhenge ESL
  • BOINC Pentathlon 2012
Hab grad dieses Uraltprogramm zum Auslesen der Performance Counter entdeckt:
http://www.cpuid.com/softwares/perfmonitor.html

Im Hintergrund läuft Simap, das Programm spuckt mir dazu ne IPC von 1,1 aus, und was auffällt ist die schlechte Trefferrate bei der Branch Prediction meines C2Ds, nur 85%.

Kann mal jemand interessehalber auf AMD K10 gegentesten ?

Das Programm ist kindereinfach, einfach aufrufen und dann bei einem der 4 Diagramme doppelklicken, und dann Branch Pred. Seccess rate auswählen. IPC ist schon per default dabei.

Thx

Alex

P.S: Nehalems funktionieren leider nicht :(
 
Hab extra ein paar fette SIMAPs runter geladen.

IPC liegt bei 1,1 (1,0-1,2) Branch Prediction success rate 89,8-91,8% simap only, mit milkyway sind die Wert konstant 0,5 höher...
 
Auf einem Athlon 2 X2 245 kommen ca. 90% für Branch Prediction success rate und 1,2 für IPC.
 
Cool, Danke. Da hat der AMD die bessere Branch Prediction - wer häts gedacht.

Aja vorsichtshalber noch die Nachfrage: Habt Ihr die 64bit Binary, oder noch die alte 32b ?
Eventuell liegts daran, die orginal 5.10, die bei mir noch läuft, ist mittlerweile recht angegraut.
 
Was ich da noch interessant fände: Wie sind denn da die Cache-Misses beim K10 und K8, bzw. die Cache-Success-Rate?

Die Liegt bei meinem C2Q (Penryn) bei 97%-99%, die branchprediction genau wie bei Opteron bei 85%-86%.

Besonders interessant finde ich jetzt natürlich AMDs Aussage bei Bulldozer die Branchprediction weiter verbessern zu wollen (wenn ich das nicht grad falsch in Erinnerung hab).
 
der Core i7-620m kackt ja ganz schön ab.. hätte mir von dem Ding mehr erwartet als 4 Wus pro 2 Stunden...
 
Batch 10. Der Q6600 braucht für die gleiche Serie (allerdings unter 64 Bit und mit ein paar Mhz mehr (2,666 zu 3,300) nur rund eine stunde für 4 stück.
 
Batch 10. Der Q6600 braucht für die gleiche Serie (allerdings unter 64 Bit und mit ein paar Mhz mehr (2,666 zu 3,300) nur rund eine stunde für 4 stück.
Naja, für den Mindertakt *und* Hyperthreading anstatt 4 echter Kerne ist das doch ok ?
 
Dafür das mein Subnotebook (Pentium SU4100, 2x1.3 Ghz) in 2 Stunden 2 Wus durchhaut ist das eigentlich ein Armutszeugnis ;-) Bei Gelegenheit muss ich mal ein paar andere Projekte testen.
 
Dafür das mein Subnotebook (Pentium SU4100, 2x1.3 Ghz) in 2 Stunden 2 Wus durchhaut ist das eigentlich ein Armutszeugnis ;-) Bei Gelegenheit muss ich mal ein paar andere Projekte testen.
Ah ok, verglichen damit, schauts dann wirklich schlecht aus ;-)
 
Auf meinem Core i3 530 @ 3,2 GHz brauchen die WUs etwa 1:34 Std.


Edit:
Die Berechnungsdauer der September WUs geht wieder deutlich schneller... Q9650@4GHz benötigt etwa 26min... bei der alten Batch waren es noch etwa 53min
 
Zuletzt bearbeitet:
@Opteron: Da ich da gerade unter WinXP32 fahre vermute ich mal es ist das 32b Binary, Datei hat am Ende "..intelx86" was auch noch dafür spricht.
 
Habe dann mal ein neues Thema eröffnet, passt besser so.


Gruß

D.U.
 
Zurück
Oben Unten