PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : 64 Bit Linux App / Hilfe beim Testen gesucht



Bikeman
29.03.2009, 19:39
Hallo!

Ich bastel gerade daran die E@H App als native 64bit Linux App zu kompilieren/optimieren. Um es vorweg zu nehmen, großartige Performancesteigerungen gegnüber einer analog kompilierten 32 bit App konnte ich leider nicht erzielen, aber eine native 64 bit App hätte zumindest den Charme dass man sich die 32bit Kompatibilitäts-Libs sparen könnte, die in vielen Distributionen standardmäßig nicht installiert sind.

Dummerweise habe ich selbst nur einen Athlon 64 X2, Core 2 Duo und Core 2 Quad , ich würde den Prototypen (sollte nächste Woche fertig werden) aber gerne auch testen auf:

* Phenom
* Phenom II
* Core i7

Wenn also hier jemand einen solchen PC unter einem 64bit Linux betreibt und Spaß daran hätte beim Benchmarken zu helfen (dauert < 1 h) : bitte hier melden.


Grüße
Bikeman

Bikeman
01.04.2009, 18:41
Nicht doch so viele auf einmal :-) :-) :-)

Aaaalso : ihr müsst die Testapp nicht tagelang im Projekt mitlaufen lassen, ich stelle eine Test-Unit bereit und das ganze ist in ein paar Minuten "gebencht". Wer will kann sich die App auch selbst kompilieren, den Source code patch stelle ich gerne bereit.

CU
Bikeman

koschi
02.04.2009, 14:12
Ich wuerd ja helfen (Q6600,Q9550,64bit Linux), nur mangelt es an den gewuenschten Prozessoren ;-D Ich glaub allzu viele Linuxuser sind in der Kombination hier nicht unterwegs...

heavy-Ions@boinc
02.04.2009, 14:15
kann einen Phenom 9550 unter ubuntu64 zum testen anbieten.

Bikeman
02.04.2009, 18:03
Danke, ist ist doch mal ein Wort. Unter 32 bit waren die Phenoms bei E@H immer sehr lahm, mal sehen ....

Ich stelle (vermutlich heute abend) mal alle nötigen Dateien zusammen und schicke Dir dann einen Link zum Downloaden als PN. Erbebnisse können ruhig hier gepostet werden, ist ja alles "open" und keine Geheimsache, nur halt "work in progress" :-)

CU
Bikeman

sysfried
04.04.2009, 11:33
Phenom II 940 mit OpenSUSE 11.1 64 bit hier... pn an mich, wenn ich helfen soll....

Sysfried

Bikeman
04.04.2009, 11:40
Phenom II 940 mit OpenSUSE 11.1 64 bit hier... pn an mich, wenn ich helfen soll....

Sysfried

Danke, PN ist raus.

Zum Vergleich: Beim Phenom I von heavy-ions war die 64 bit app etwa 5% schneller, mal sehen wie das beim Phenom II ist.

CU
Bikeman

raptor-f-22
04.04.2009, 14:00
da ich sowas unterstütze, könnte ich dir einen Q9450 auf 3,2 unter ubuntu 64 anbieten.
falls interesse schick mir doch bitte eine pn in welcher du das dann erklärst :)

Opteron
05.05.2009, 23:45
Mit was compiliers Du eigentlich, GCC ?
Dann kannst Du vielleicht mal den neuen "AMD" Compiler ausprobieren.

Soll angeblich nicht soo schlecht sein, zumindest bei dem Projekt:
http://www.enigmaathome.net/forum_thread.php?id=109

und kostet tuts eh nichts :)
http://developer.amd.com/cpu/open64/pages/default.aspx

ciao

Alex

Bikeman
06.05.2009, 00:06
Mit was compiliers Du eigentlich, GCC ?
Dann kannst Du vielleicht mal den neuen "AMD" Compiler ausprobieren.

Soll angeblich nicht soo schlecht sein, zumindest bei dem Projekt:
http://www.enigmaathome.net/forum_thread.php?id=109

und kostet tuts eh nichts :)
http://developer.amd.com/cpu/open64/pages/default.aspx

ciao

Alex

Hmm....ja, das wäre interessant. Wunder darf man nicht erwarten, schließlich sind weite Teile der E@H App inzwischen in handgestricktem Assembler-Code geschrieben, daran verbessert ein anderer Compiler auch nichts mehr. Der Standardcompiler des Projektes ist gcc 4.0, für die 64 bit Experimente benutze ich gcc 4.3

Ich fürchte die Tatsache, dass die E@H App auf den meisten AMD CPUs überproportional langsam läuft (gegenüber den Intels) liegt größtenteils an den kleinen L2 Caches der Desktop-AMD CPUs. 512 KB pro Kern scheint der App einfach nicht zu schmecken. Bei den Phenom (I) Dingern kann der L3 Cache es auch nicht herausreißen.

Ich suche übrigens immernoch Leute die einen Phenom II unter 64 bit Linux haben, zwecks benchmarking einer 64 bit app.

CU
Bikeman

Opteron
06.05.2009, 10:30
Ach stimmt ja ... ihr hattet ja schon Assemblercode ^^
Na dann wird es kaum was bringen, ausser der Compiler hätte irgendeinen wunder-prefetch Algorithmus, der die L2 Größe verdenken könnte ^^

Würde gerne helfen, aber leider hab ich keinen Phenom2/Phenom1 :(

ciao

Alex

heavy-Ions@boinc
06.05.2009, 12:06
Ich suche übrigens immernoch Leute die einen Phenom II unter 64 bit Linux haben, zwecks benchmarking einer 64 bit app.

CU
Bikeman
Ich habe den PI 9550 den ich schon mit deinen apps durchgetestet habe kürzlich gegen einen PII920 getauscht. also kann ich dir nun auch einen PII unter 64bit linux anbieten ;)

Bikeman
06.05.2009, 20:04
Ich habe den PI 9550 den ich schon mit deinen apps durchgetestet habe kürzlich gegen einen PII920 getauscht. also kann ich dir nun auch einen PII unter 64bit linux anbieten ;)

Das wäre jetzt aber nicht nötig gewesen ;).

Ja, das wäre super, hast Du die PN mit der Anleitung und dem Download-Link noch, oder soll ich das nochmal schicken?

CU
Bikeman

heavy-Ions@boinc
06.05.2009, 21:37
den link hab ich noch. werde aber wahrscheinlich erst am wochenende dazu kommen es zu testen

Bikeman
06.05.2009, 22:07
den link hab ich noch. werde aber wahrscheinlich erst am wochenende dazu kommen es zu testen

Danke, kein Ding, eilt ja nicht.

CU
Bikeman

Bikeman
23.05.2009, 21:43
...mal vorsichtig erinnern....
Bikeman

heavy-Ions@boinc
26.05.2009, 21:55
sorry, bin nicht dazu gekommen. zur zeit bin ich auch am wochenende arbeiten ( und vatertag :( )
vergessen hab ichs nicht, nur erfolgreich nach hinten gelegt ;)

Bikeman
27.05.2009, 01:03
sorry, bin nicht dazu gekommen. zur zeit bin ich auch am wochenende arbeiten ( und vatertag :( )
vergessen hab ichs nicht, nur erfolgreich nach hinten gelegt ;)

Kein Ding :-)

CU
Bikeman

heavy-Ions@boinc
11.06.2009, 21:00
so, entschuldige die verspätung
hier die werte
PII 920@2.94ghz, 8Gig RAM, 64bit ubuntu 8.10

----------------------------------------------------------------------------------
./run_benchmark_min_S5R5.sh einstein_S5R5_0.02_64_x86_64-unknown-linux-gnu_2
real 1m26.710s
user 1m23.613s
sys 0m1.108s
---------------------------------------------------------------------------------
./run_benchmark_min_S5R5.sh einstein_S5R5_0.03_64_x86_64-unknown-linux-gnu_2
real 1m28.806s
user 1m25.945s
sys 0m0.864s
---------------------------------------------------------------------------------
./run_benchmark_min_S5R5.sh einstein_S5R5_1.01_i686-pc-linux-gnu_2
real 1m37.128s
user 1m33.966s
sys 0m1.172s
---------------------------------------------------------------------------------
./run_benchmark_max_S5R5.sh einstein_S5R5_0.03_64_x86_64-unknown-linux-gnu_2
real 3m10.039s
user 3m7.176s
sys 0m0.900s
----------------------------------------------------------------------------------
./run_benchmark_max_S5R5.sh einstein_S5R5_0.02_64_x86_64-unknown-linux-gnu_2
real 3m6.340s
u./run_benchmark_max_S5R5.sh einstein_S5R5_1.01_i686-pc-linux-gnu_2
ser 3m3.475s
sys 0m0.900s
----------------------------------------------------------------------------------
./run_benchmark_max_S5R5.sh einstein_S5R5_1.01_i686-pc-linux-gnu_2
real 3m19.098s
user 3m16.168s
sys 0m0.936s
----------------------------------------------------------------------------------
./run_benchmark_init.sh einstein_S5R5_0.03_64_x86_64-unknown-linux-gnu_2
real 0m5.038s
user 0m1.920s
sys 0m1.120s
----------------------------------------------------------------------------------
./run_benchmark_init.sh einstein_S5R5_0.02_64_x86_64-unknown-linux-gnu_2
real 0m5.088s
user 0m1.892s
sys 0m1.156s
----------------------------------------------------------------------------------
./run_benchmark_init.sh einstein_S5R5_1.01_i686-pc-linux-gnu_2
real 0m7.654s
user 0m4.368s
sys 0m1.208s
----------------------------------------------------------------------------------
----------------------------------------------------------------------------------
./run_benchmark_min_S5R5.sh einstein_S5R5_0.06_sse2_core2_chm_x86_64-unknown-linux-gnu
real 1m38.805s
user 1m35.662s
sys 0m1.156s
--------------------------------------------------------------------------------------
./run_benchmark_max_S5R5.sh einstein_S5R5_0.06_sse2_core2_chm_x86_64-unknown-linux-gnu
real 3m19.797s
user 3m16.336s
sys 0m1.108s
--------------------------------------------------------------------------------------
./run_benchmark_init.sh einstein_S5R5_0.06_sse2_core2_chm_x86_64-unknown-linux-gnu
real 0m7.553s
user 0m4.328s
sys 0m1.200s
===================================================================================== ==

Bikeman
11.06.2009, 21:48
Vielen Dank für die Messwerte.

Die letzten drei erscheinen mir allerdings verdächtig zu sein. Bist Du ganz sicher dass Du die Datei einstein_S5R5_0.06_sse2_core2_chm_x86_64-unknown-linux-gnu in das gleiche Verzeichnis getan hast wie die Skripte *.sh und die anderen executables, die in dem Tar.gz waren? Vielleicht hatte ich das in meiner PN auch nicht explizit geschrieben, aber alle einstein_* Dateien müssen im gleichen Verzeichnis sein (und ausführbar sein).

CU

Bikeman

heavy-Ions@boinc
11.06.2009, 22:33
ich hab die in denselben ordner kopiert wo auch die anderen drin sind.
Ich glaube ich hab alles richtig gemacht. aber ich hab nix "ausführbar" gemacht ;)
bin doch linux-noob ;)

Bikeman
11.06.2009, 22:40
ich hab die in denselben ordner kopiert wo auch die anderen drin sind.
Ich glaube ich hab alles richtig gemacht. aber ich hab nix "ausführbar" gemacht ;)
bin doch linux-noob ;)

Hi!

Ahhso :-)

Hmm... ein

chmod u+x einstein_S5R5_0.06_sse2_core2_chm_x86_64-unknown-linux-gnu

gefolgt von

./run_benchmark_max_S5R5.sh einstein_S5R5_0.06_sse2_core2_chm_x86_64-unknown-linux-gnu

wäre dann nochmal hilfreich

CU
Bikeman

heavy-Ions@boinc
11.06.2009, 22:46
so, erster wert
real 2m51.788s
user 2m46.290s
sys 0m0.908s
mit boinc im hintergrund :]

jetzt mal ohne....

real 2m51.429s
user 2m48.187s
sys 0m1.152s

Bikeman
11.06.2009, 23:04
so, erster wert
real 2m51.788s
user 2m46.290s
sys 0m0.908s
mit boinc im hintergrund :]

jetzt mal ohne....

real 2m51.429s
user 2m48.187s
sys 0m1.152s

Ahhhhhh...ok, das sieht schon anders aus, der ursprüngliche Messwert war:


real 3m19.797s
user 3m16.336s
sys 0m1.108s


Ich denke da war die einzeln downgeloadedte App noch nicht ausführbar und es wurde die zuvor ausgeführte app getestet (vermutlich die Stock app 1.01).

Ok, die 0.06 app ist bei den langen WUs also etwa 5% schneller, ähnliche Ergebnisse gibt's beim Phenom I, beim Athlon X2 ohne L3 Cache sind es etwa 15 %, bei einem etwas exotischen Centaur C7 mit nur 128 KB L2 Cache sind es etwa 25 %.

Danke nochmal,
Bikeman

Opteron
12.06.2009, 01:03
Ok, die 0.06 app ist bei den langen WUs also etwa 5% schneller, ähnliche Ergebnisse gibt's beim Phenom I, beim Athlon X2 ohne L3 Cache sind es etwa 15 %, bei einem etwas exotischen Centaur C7 mit nur 128 KB L2 Cache sind es etwa 25 %.

Der X2 skaliert also besser ? Ist das schon ein K10 X2 ?
Sehr interessant dann, da scheint das Workingset schön in den L2 zu passen und der Phenom schaut in die Röhre ^^

Insofern schade, dass Propus nur 512kB L2s bekommt ;)

ciao

Alex

Bikeman
12.06.2009, 08:01
Der X2 skaliert also besser ? Ist das schon ein K10 X2 ?
Sehr interessant dann, da scheint das Workingset schön in den L2 zu passen und der Phenom schaut in die Röhre ^^

Insofern schade, dass Propus nur 512kB L2s bekommt ;)

ciao

Alex

Mit skalieren hat das nichts zu tun und der X2 schneidet auh nicht besser ab, im Gegenteil. Die Prototyp App, die heavy-ions getestet hat, zeigt gegenüber der Stock App auf Systemen mit kleinerem Cache eine höhere Mehrleistung als auf solchen mit viel Cache (Level2+Level3 pro Core).

Offenbar ist der L2 Cache des X2 (kein K10, sondern ein 4850e) zu klein für die Standard Einstein@Home App, was auch erklärt warum die Intels bei E@H so viel besser sind als AMD CPUs. Der Prototyp schafft hier etwas Abhilfe, was sich umso deutlicher zeigt je kleiner der Cache ist.

CU
Bikeman