Optimierter client für Albert @Einhstein@home

Sir Ulli

Grand Admiral Special
Mitglied seit
06.02.2002
Beiträge
14.440
Renomée
202
Standort
Bad Oeynhausen
  • SIMAP Race
  • QMC Race
  • Spinhenge ESL
first Application of Albert is running at

1:36

incase of 4:00 Hours wirth the normal Application

that is a good Improvemet i think...

mfg
Sir Ulli
 
Super! Auf das habe ich gewartet!

Der crunsht sichtlich schneller.

Aber bekommt man hierfür auch weniger credits?
 
Hm - mein T23 hat immer >8h gebraucht, jetzt 4h ... :o

Und dabei hiess es bis jetzt immer, der E@H-Client sei schon optimiert.
 
Athlon64 3.200+ vorher ca 4 Stunden, jetzt nur noch 1:30 :o

das ist mal was...

da sieht man auch was möglich ist mit den richtigen Compilern etc, it ja fast wie bei Seti.. :)

und ganz wichtig, wenn sich externe leute mal der Sache annehmen, man kann diesen Leuten gar nicht genug danken, für ihre Arbeit die nicht bezahlt wird...

deswegen auch nochmal besonderen dank an Crunch3r für seine tolle Arbeit...und natürlich auch allen anderen

mfg
Sir Ulli
 
Und dabei hiess es bis jetzt immer, der E@H-Client sei schon optimiert.

Das stimmt auch. Nur waren dieses Optimierungen sehr vom Compiler und der Plattform abhängig. So werden die Linux-Apps mit GCC und Win-Apps mit dem MS Compiler erstellt. Letzterer scheint zumindest für die P4s einen bedeutend lahmeren Client zu produzieren; da braucht man sich nur mal die Zeiten anschauen, welche für die gleiche WU von P4s (gleiche Taktrate) auf Win und auf Linux benötigt worden sind ...

CU HiNuN
 
es gibt schon wieder ne neue Version

http://einstein.phys.uwm.edu/forum_thread.php?id=3895#28057

wenn auch über die optimierung wenig ausgesagt wird

aber was soll uns das sagen

C37 is better than A36 and 387, and it uses only 80386 compatible instructions.

sind die MS Compiler so schlecht das glaube ich nicht, der Mann ....

man siehe mein Posting, 80386 von 1991, auch wenn das buch von Pat Gelsinger ist...

mfg
Sir Ulli
 
Neue Version: S38 (nutzt SSE!!)

AMD XP 2600+ C37->S38 (approx 25%)increase - no probs - validating fine
AMD 64 X2 3800+ S37a->S38 (approx 26%)increase - no probs - validating fine
P3T 1.26GHz (512kB) C37:13250s; S38: 8510s -> -36%
P3mobile 1.0GHz (256kB) C37: 16230s; S38: 10720s -> -34%
Quelle: S38 Observation thread

AndyK
 
ich liege weiterhin bei gut 1:30 pro WU, mit Athlon64 3.200+

mfg
Sir Ulli
 
Amazing - 2:15h - und das auf einem P3 Mobile 1133 ... :o
 
57 min. with client S39L
on my
A64 3500+@2,5Ghz

teste ich auch gerade

mal sehen was der Athlon64 3.200+ da schafft, mit dem alten S39 Client war ich ja schon bei gut einer Stunde

mfg
Sir Ulli
 
Was ist den nun die bessere Applikation?

wenn der für 3Dnow! optimiert ist, geht dafür SSE2 nicht mehr?
Oder ist die Optimierung so, dass SSE2 und 3Dnow! gleichzeitig zur Berechnung der WU genommen werden?
 
Was ist den nun die bessere Applikation?

wenn der für 3Dnow! optimiert ist, geht dafür SSE2 nicht mehr?
Oder ist die Optimierung so, dass SSE2 und 3Dnow! gleichzeitig zur Berechnung der WU genommen werden?

SSE2 ist natürlich die bessere Version, 3DNow ist nur für die ältereren Prozessoren hinzugenommen worden,,,

mfg
Sir Ulli
 
So natürlich war das gar nicht.

akosf sagte heute noch:
akosf schrieb:
The comparison of 3DNow! against SSE is interesting, because SSE handles four numbers together in front of two, so 3DNow! needs about two times more instruction for the same task.

I hope that 3DNow! will be faster (D40 <-> S40), i like that. :-)
Aber später meinte er dann doch:
akosf schrieb:
The speed of S40 (SSE code with combined aligned/unaligned addresses) is same as S39L, so I don't release it. It was a useless thing from me. :-)
But D40 is faster than C40 so I will upload shortly.
Also ist S39L für aktuelle SSE2 fähige CPUs immer noch die schnellste Version.

Edit:
Wobei am 26.03. sagte er noch:
akosf schrieb:
I have measured these ratios on the same system with the same wu:
(Duron 2,03GHz, Win2000)

REF: 1.00
C01: 2.00 (first attempt)
A36: 2.37 (PPro+)
C37: 2.44
C40: 2.76
S39L:3.74 (SSE, accuracy is a bit worse than previous)
D40: 3.89 (3DNow, accuracy is a bit better than SSE)
Das würde heissen, D40 ist doch schneller als S39L??


Edit2:
Nach ersten Meldungen ist der D40 doch schneller als der S39L: D40 Observation Thread

AndyK
 
Zuletzt bearbeitet:
ich liege mit dem D40

bei gut 1 Stunde und ein paar Minuten

Athlon64 3.200+

also der Unterschied von D40 zu S39L sind ....

mfg
Sir Ulli
 
Ich bin gerade ein bisserl verwirrt. Mein System läuft standardmäßig mit 800 Mhz. Mit der Original albert.exe braucht er ca. 10 Stunden, mit S39L ca. 1 Stunde :o. *kopfkratz Ist eine solche Steigerung überhaupt normal?
 
Für ein 800 MHz eher verwunderlich. Sollte bei dir 2h dauern, da erst bei 2000 MHz 1 h erreicht wird.
 
Zurück
Oben Unten