Pentium 4 wirklich derart schlecht?

TiKu

Administrator
Teammitglied
Mitglied seit
16.11.2001
Beiträge
21.665
Renomée
1.247
Standort
München
  • SIMAP Race
  • QMC Race
  • Spinhenge ESL
  • Docking@Home
  • BOINC Pentathlon 2021
Moin,

ich hab mal 2 Einstein-WUs auf einem Pentium 4 (mit Hyperthreading) mit 3200 MHz und 1024 MB RAM durchgejagt und die Ergebnisse dann auf Twodees Stats-Seite im C-Index eingetragen.
Etwas verwundert bin ich, dass lt. dieser Statsseite ein Dual-Sockel-Pentium 3 mit zwar 2048 MB RAM, aber nur 1400 MHz mehr Punkte pro Tag schafft als der Pentium 4. Kann das sein? :o

Die Zahlen in der letzten Spalte sind die mit dem System möglichen Punkte pro Tag.
 
Überprüf doch einmal mit ThrottleWatch ob der Thermal Monitor nicht wegen zu hoher Temperaturen (Schwellenwert war glaube ich in der Regel ~85 °C) den Prozessor immer wieder einige Taktzyklen aussetzen lässt und sich dies nachteilig auf die erzielten Werte durchschlägt.
 
Gesagt, getan. Da throttelt nix.

/edit: Ich hab mal mit SiSoft Sandra gebencht und mit einem P4 HT 3,2 GHz mit 1 MB L2 (meiner hat 2 MB, aber so einen gibts nicht) verglichen. Ergebnis: Die Benchmarks sind normal (meiner ist geringfügig schneller).
 
Das kann schon sein, wenn es ein hochgetakteter Dual P3 ist. Da der P3 gegenüber P4 sowieso die bessere Architektur war und auch die bessere ProMHzLeistung hat. Da aber die P3 Architektur nicht mehr für höhere Taktfrequenzen geeignet war, hat Intel es mit Netburst versucht, was ja mal gegenüber AMD seinerzeit ein Schuß nach hinten war.
 
Hi!

Eben, das hatte schon so seine Gründe dass Intel die dem P4 zugrunde liegende Microarchitektur ("Netburst") komplett eingestampft hat und sich entschieden hat, eine Generation zurückzugehen und bei der P III Microarchitektur (P6) wiederaufzusetzen. Technologisch sind die modernen Intel Core 2 CPUs dewegen viel enger mit dem von dir zitierten Pentium III 1.4 GHz (Tualatin-Kern) verwandt als mit dem Pentium 4. Das Speicherinterface wurde allerdings vom P4 übernommen.

Die Entwicklung war etwa so:

Tualatin (P III) ----> P 4 Kerne -> (exitus)
V
Banias (Pentium M)
V
Dothan (Pentium M)
V
Yonah (Core) -
V
Core 2 Kerne.



Du könntest mal probieren ob die aktuellen WUs nicht ohne Hyperthreading besser laufen, aber viel Hoffnung würde ich mir da nicht machen.

Ich habe selbst auch 2 Dual Pentium III-S a 1.4 GHz bei Einstein@Home und die schlagen sich wirklich nicht schlecht wenn man bedenkt, das die jetzt 5 oder 6 Jahre alt sein müssen:

http://einstein.phys.uwm.edu/show_host_detail.php?hostid=1025096

http://einstein.phys.uwm.edu/show_host_detail.php?hostid=1030636

Ich habe die noch nicht sooo lange so dass der RAC für die beiden Rechner derzeit noch steigt. 400 - 500 / Tag sollte es am Ende schon sein.

Jeder einzelne Prozessor verbraucht bis ca. 32 Watt unter Last, im Leerlauf allerdings kaum weniger. Aber Leerlauf ist eh was für Turnbeutelvergesser.


EDIT: ich sehe gerade, dass der Vergleichs-Pentium III aus Deiner Grafik jemandem hier aus dem Forum gehören muss, nämlich x86, der früher Murdock hieß, siehe seinen Thread hier im Forum! War das jetzt Zufall?

Ausserdem muss man beachten das die Laufzeit der WU bei Einstein@Home (auch bei gleichem Credit) im Moment relativ stark schwankt, und zwar um ca 10% nach oben und unten. Um wirklich vergleichbare Ergebnisse zu erhalten muss man also schon recht viele WUs mitteln.


CU
Bikeman
 
Zuletzt bearbeitet:
Eben, das hatte schon so seine Gründe dass Intel die dem P4 zugrunde liegende Microarchitektur ("Netburst") komplett eingestampft hat und sich entschieden hat, eine Generation zurückzugehen und bei der P III Microarchitektur (P6) wiederaufzusetzen. Technologisch sind die modernen Intel Core 2 CPUs dewegen viel enger mit dem von dir zitierten Pentium III 1.4 GHz (Tualatin-Kern) verwandt als mit dem Pentium 4. Das Speicherinterface wurde allerdings vom P4 übernommen.
Dass der P3 eine deutlich bessere Takteffizienz hat als der P4 war mir schon bekannt, ich hatte nur nicht erwartet, dass der Unterschied derart gravierend ist.
Du könntest mal probieren ob die aktuellen WUs nicht ohne Hyperthreading besser laufen, aber viel Hoffnung würde ich mir da nicht machen.
Werd ich wohl mal tun.
EDIT: ich sehe gerade, dass der Vergleichs-Pentium III aus Deiner Grafik jemandem hier aus dem Forum gehören muss, nämlich x86, der früher Murdock hieß, siehe seinen Thread hier im Forum! War das jetzt Zufall?
Nö. Auf die Stats-Seite von der die Grafik ist, haben nur Mitglieder von Planet 3DNow! Zugriff.
Seinen Thread hatte ich allerdings nicht gesehen.
Ausserdem muss man beachten das die Laufzeit der WU bei Einstein@Home (auch bei gleichem Credit) im Moment relativ stark schwankt, und zwar um ca 10% nach oben und unten. Um wirklich vergleichbare Ergebnisse zu erhalten muss man also schon recht viele WUs mitteln.
Ah, okay, das würde die Sache möglicherweise zum Teil erklären. Die Werte in der Grafik basieren jeweils auf nur 1-3 Ergebnissen.
 
also bei mir schwankt es zwischen ~ 2 stunden bei gleichen credits ... also zwischen 47k und 39k sekunden bei einem e6400 für ~ 240 credits :o
 
also bei mir schwankt es zwischen ~ 2 stunden bei gleichen credits ... also zwischen 47k und 39k sekunden bei einem e6400 für ~ 240 credits :o

Hallo!

Ich hatte im E@H Forum mal versucht die Ursachen für die Schwankungen zu visualisieren:

http://einstein.phys.uwm.edu/forum_thread.php?id=6252

(auf englisch). Wie dort beschrieben wird derzeit daran gearbeitet, die Schwankungen bezüglich credits/CPU Stunde Rechenzeit wieder kleiner zu bekommen,und zwar entweder dadurch, dass man die Anwendung etwas umschreibt und die Schwankungen in der CPU Zeit zurückgehen oder indem man die Credits entsprechend pro Workunit individuell vergrößert/verkleinert so dass es besser passt. Sollte nicht mehr allzu lange dauern bis das gelöst ist.

Aber ich denke mal im Mittel betrachtet kann man sich auch jetzt über das Verhältnis credits/CPU-Zeit bei Einstein@Home nicht beschweren, oder?

CU
Bikeman
 
Moin,

ich hab mal 2 Einstein-WUs auf einem Pentium 4 (mit Hyperthreading) mit 3200 MHz und 1024 MB RAM durchgejagt und die Ergebnisse dann auf Twodees Stats-Seite im C-Index eingetragen.
Etwas verwundert bin ich, dass lt. dieser Statsseite ein Dual-Sockel-Pentium 3 mit zwar 2048 MB RAM, aber nur 1400 MHz mehr Punkte pro Tag schafft als der Pentium 4. Kann das sein? :o

Die Zahlen in der letzten Spalte sind die mit dem System möglichen Punkte pro Tag.
Naja ... nachdem das 2 echte P3 Kerne gegen 2 simulierte P4 Kerne sind, und die boinc Programme durch die verschiedenen Instanzen gut skaliert, kann man Pi*Daumen die Milchmädchenrechnung 2x1400 = 2800 Mhz rechnen. Dann sinds also nur noch 400 MHz Mehrtakt. Wenn dann das Programm x87 Befehle benützt, und keine SSE2, dann sind die 400 Mhz sehr schnell verpufft ;-)

Ich kennen Einstein jetzt nicht, aber ich nehme es mal stark an, dass da x87 Code verwendet wird. Falls Athlons da recht gut sind, wäre das ein weiterers Indiz.

ciao

Alex
 
Naja ... nachdem das 2 echte P3 Kerne gegen 2 simulierte P4 Kerne sind, und die boinc Programme durch die verschiedenen Instanzen gut skaliert, kann man Pi*Daumen die Milchmädchenrechnung 2x1400 = 2800 Mhz rechnen. Dann sinds also nur noch 400 MHz Mehrtakt. Wenn dann das Programm x87 Befehle benützt, und keine SSE2, dann sind die 400 Mhz sehr schnell verpufft ;-)

Ich kennen Einstein jetzt nicht, aber ich nehme es mal stark an, dass da x87 Code verwendet wird. Falls Athlons da recht gut sind, wäre das ein weiterers Indiz.

ciao

Alex

Das ist etwas unterschiedlich.
  • Die Linux-Intel App (mit gcc übersetzt) verwendet ausschließlich x87 Befehle
  • Die Windows App benutzt in der Mathematik-Runtime-Bibliothek auch SSE(2) Befehle, falls der PC das unterstützt. Fällt aber insgesamt kaum ins Gewicht, der meiste Code ist x87
  • Mac-OS/Intel Standard App: hauptsächlich skalarer SSE(2) Code
  • MAC-OS/Intel Beta App 4.10: Auch Vektor-SSE-Code, deswegen auch recht fix

CU
Bikeman

P.S.: Einer meiner beiden Dual PIII-S 1.4GHz hat gerade die 400 credits/Tag Schwelle überschritten. Der in der Grafik im ersten Artikel angegebene Wert ist also eher konservativ geschätzt.
 
Es lag wohl daran, dass da nebenher eine ClimatePrediction-WU lief. Ich habe jetzt einige Einstein-WUs gerechnet, bei denen nebenher andere Projekte liefen und er ist nun deutlich schneller.

Bei anderen Projekten sind mir noch keine solch starken Unterschiede zwischen ClimatePrediction und einem anderen Zweitprojekt aufgefallen.*noahnung*
 
Es lag wohl daran, dass da nebenher eine ClimatePrediction-WU lief. Ich habe jetzt einige Einstein-WUs gerechnet, bei denen nebenher andere Projekte liefen und er ist nun deutlich schneller.

Bei anderen Projekten sind mir noch keine solch starken Unterschiede zwischen ClimatePrediction und einem anderen Zweitprojekt aufgefallen.*noahnung*

Naja, aber einen Dual P-III-S 1.4 Ghz macht der immernoch nicht platt, oder?

CU

Bikeman
 
Doch. Der P4 schafft nun lt. Statsseite ca. 525 Punkte am Tag, der Dual-P3 kommt auf ca. 385.
 
Doch. Der P4 schafft nun lt. Statsseite ca. 525 Punkte am Tag, der Dual-P3 kommt auf ca. 385.

Respekt, nicht schlecht. Unter Linux schaffen meine beiden Dual-PIII-S jeweils so um die 475 Credits pro Tag, ich hätte jetzt nicht gedacht dass die Windows App so viel langsamer ist??

http://einstein.phys.uwm.edu/show_host_detail.php?hostid=1025096

http://einstein.phys.uwm.edu/show_host_detail.php?hostid=1030636

Sei's drum, der p4 schlägt sich sehr achtbar!

CU
Bikeman
 
Kleines Update:

Durch zwischenzeitlich verbesserte ("Power User") Apps kann man bei E@H mit einem P-III-S inzwischen um die 700 credits/Tag und mehr holen (unter Linux, die neueste Windows App sollte nicht soo viel langsamer sein).

CU

Bikeman
 
Es wird verstärkt SSE eingesetzt, das hilft wohl ganz ordentlich...
 
Es wird verstärkt SSE eingesetzt, das hilft wohl ganz ordentlich...

Genau. Zum einen wird in den besagten "Power User Apps" jetzt SSE (ab Pentium III) eingesetzt, zum anderen wurde eine weitere performance-kritische Stelle der Anwendung jetzt in Assembler programmiert (sind nur ein paar Zeilen, macht aber viel aus).

Einzelheiten dazu gibt's in den "sticky" Threads im E@H Forum:

http://einstein.phys.uwm.edu/forum_forum.php?id=3

Happy Crunching

Bikeman
 
Dank Euch für die Antworten und Bikeman für den Link ;-)

feature-based App switching
Das hört sich ja mal wirklich gut an :) Da werde ich mal auch ein bisschen Testen ;-)

[STRIKE]Gibts schon irgendwelche Ergebnisse von Phenoms ? Eventuell laufen die wg. SSE128 jetzt auch schneller.
[/STRIKE]
Edit: Habs selbst im PowerApp thread gefunden, bringt wohl nichts :(

ciao

Alex
 
Zuletzt bearbeitet:
Hallo!

So, die Linux 4.38 App ist nun zur offiziellen App gemacht worden, vielen Dank an die Tester.

Die App ist eigentlich ein Bündel aus zwei Apps. Sie stellt selbständig fest ob die jeweilige CPU SSE unterstützt oder nicht und aktiviert dann entsprechend die ein oder andere App.

Somit ist erstmal wieder eine SSE optimierte App für Linux die Standardapp bei E@H.

CU
H-B
 
Zurück
Oben Unten