64 Bit Linux App / Hilfe beim Testen gesucht

Bikeman

Captain Special
Mitglied seit
07.06.2007
Beiträge
247
Renomée
31
Hallo!

Ich bastel gerade daran die E@H App als native 64bit Linux App zu kompilieren/optimieren. Um es vorweg zu nehmen, großartige Performancesteigerungen gegnüber einer analog kompilierten 32 bit App konnte ich leider nicht erzielen, aber eine native 64 bit App hätte zumindest den Charme dass man sich die 32bit Kompatibilitäts-Libs sparen könnte, die in vielen Distributionen standardmäßig nicht installiert sind.

Dummerweise habe ich selbst nur einen Athlon 64 X2, Core 2 Duo und Core 2 Quad , ich würde den Prototypen (sollte nächste Woche fertig werden) aber gerne auch testen auf:

* Phenom
* Phenom II
* Core i7

Wenn also hier jemand einen solchen PC unter einem 64bit Linux betreibt und Spaß daran hätte beim Benchmarken zu helfen (dauert < 1 h) : bitte hier melden.


Grüße
Bikeman
 
Nicht doch so viele auf einmal :-) :-) :-)

Aaaalso : ihr müsst die Testapp nicht tagelang im Projekt mitlaufen lassen, ich stelle eine Test-Unit bereit und das ganze ist in ein paar Minuten "gebencht". Wer will kann sich die App auch selbst kompilieren, den Source code patch stelle ich gerne bereit.

CU
Bikeman
 
Ich wuerd ja helfen (Q6600,Q9550,64bit Linux), nur mangelt es an den gewuenschten Prozessoren ;-D Ich glaub allzu viele Linuxuser sind in der Kombination hier nicht unterwegs...
 
Danke, ist ist doch mal ein Wort. Unter 32 bit waren die Phenoms bei E@H immer sehr lahm, mal sehen ....

Ich stelle (vermutlich heute abend) mal alle nötigen Dateien zusammen und schicke Dir dann einen Link zum Downloaden als PN. Erbebnisse können ruhig hier gepostet werden, ist ja alles "open" und keine Geheimsache, nur halt "work in progress" :-)

CU
Bikeman
 
da ich sowas unterstütze, könnte ich dir einen Q9450 auf 3,2 unter ubuntu 64 anbieten.
falls interesse schick mir doch bitte eine pn in welcher du das dann erklärst :)
 
Mit was compiliers Du eigentlich, GCC ?
Dann kannst Du vielleicht mal den neuen "AMD" Compiler ausprobieren.

Soll angeblich nicht soo schlecht sein, zumindest bei dem Projekt:
http://www.enigmaathome.net/forum_thread.php?id=109

und kostet tuts eh nichts :)
http://developer.amd.com/cpu/open64/pages/default.aspx

ciao

Alex

Hmm....ja, das wäre interessant. Wunder darf man nicht erwarten, schließlich sind weite Teile der E@H App inzwischen in handgestricktem Assembler-Code geschrieben, daran verbessert ein anderer Compiler auch nichts mehr. Der Standardcompiler des Projektes ist gcc 4.0, für die 64 bit Experimente benutze ich gcc 4.3

Ich fürchte die Tatsache, dass die E@H App auf den meisten AMD CPUs überproportional langsam läuft (gegenüber den Intels) liegt größtenteils an den kleinen L2 Caches der Desktop-AMD CPUs. 512 KB pro Kern scheint der App einfach nicht zu schmecken. Bei den Phenom (I) Dingern kann der L3 Cache es auch nicht herausreißen.

Ich suche übrigens immernoch Leute die einen Phenom II unter 64 bit Linux haben, zwecks benchmarking einer 64 bit app.

CU
Bikeman
 
Zuletzt bearbeitet:
Ach stimmt ja ... ihr hattet ja schon Assemblercode ^^
Na dann wird es kaum was bringen, ausser der Compiler hätte irgendeinen wunder-prefetch Algorithmus, der die L2 Größe verdenken könnte ^^

Würde gerne helfen, aber leider hab ich keinen Phenom2/Phenom1 :(

ciao

Alex
 
Ich suche übrigens immernoch Leute die einen Phenom II unter 64 bit Linux haben, zwecks benchmarking einer 64 bit app.

CU
Bikeman
Ich habe den PI 9550 den ich schon mit deinen apps durchgetestet habe kürzlich gegen einen PII920 getauscht. also kann ich dir nun auch einen PII unter 64bit linux anbieten ;)
 
Ich habe den PI 9550 den ich schon mit deinen apps durchgetestet habe kürzlich gegen einen PII920 getauscht. also kann ich dir nun auch einen PII unter 64bit linux anbieten ;)

Das wäre jetzt aber nicht nötig gewesen ;).

Ja, das wäre super, hast Du die PN mit der Anleitung und dem Download-Link noch, oder soll ich das nochmal schicken?

CU
Bikeman
 
sorry, bin nicht dazu gekommen. zur zeit bin ich auch am wochenende arbeiten ( und vatertag :( )
vergessen hab ichs nicht, nur erfolgreich nach hinten gelegt ;)
 
so, entschuldige die verspätung
hier die werte
PII 920@2.94ghz, 8Gig RAM, 64bit ubuntu 8.10

----------------------------------------------------------------------------------
./run_benchmark_min_S5R5.sh einstein_S5R5_0.02_64_x86_64-unknown-linux-gnu_2
real 1m26.710s
user 1m23.613s
sys 0m1.108s
---------------------------------------------------------------------------------
./run_benchmark_min_S5R5.sh einstein_S5R5_0.03_64_x86_64-unknown-linux-gnu_2
real 1m28.806s
user 1m25.945s
sys 0m0.864s
---------------------------------------------------------------------------------
./run_benchmark_min_S5R5.sh einstein_S5R5_1.01_i686-pc-linux-gnu_2
real 1m37.128s
user 1m33.966s
sys 0m1.172s
---------------------------------------------------------------------------------
./run_benchmark_max_S5R5.sh einstein_S5R5_0.03_64_x86_64-unknown-linux-gnu_2
real 3m10.039s
user 3m7.176s
sys 0m0.900s
----------------------------------------------------------------------------------
./run_benchmark_max_S5R5.sh einstein_S5R5_0.02_64_x86_64-unknown-linux-gnu_2
real 3m6.340s
u./run_benchmark_max_S5R5.sh einstein_S5R5_1.01_i686-pc-linux-gnu_2
ser 3m3.475s
sys 0m0.900s
----------------------------------------------------------------------------------
./run_benchmark_max_S5R5.sh einstein_S5R5_1.01_i686-pc-linux-gnu_2
real 3m19.098s
user 3m16.168s
sys 0m0.936s
----------------------------------------------------------------------------------
./run_benchmark_init.sh einstein_S5R5_0.03_64_x86_64-unknown-linux-gnu_2
real 0m5.038s
user 0m1.920s
sys 0m1.120s
----------------------------------------------------------------------------------
./run_benchmark_init.sh einstein_S5R5_0.02_64_x86_64-unknown-linux-gnu_2
real 0m5.088s
user 0m1.892s
sys 0m1.156s
----------------------------------------------------------------------------------
./run_benchmark_init.sh einstein_S5R5_1.01_i686-pc-linux-gnu_2
real 0m7.654s
user 0m4.368s
sys 0m1.208s
----------------------------------------------------------------------------------
----------------------------------------------------------------------------------
./run_benchmark_min_S5R5.sh einstein_S5R5_0.06_sse2_core2_chm_x86_64-unknown-linux-gnu
real 1m38.805s
user 1m35.662s
sys 0m1.156s
--------------------------------------------------------------------------------------
./run_benchmark_max_S5R5.sh einstein_S5R5_0.06_sse2_core2_chm_x86_64-unknown-linux-gnu
real 3m19.797s
user 3m16.336s
sys 0m1.108s
--------------------------------------------------------------------------------------
./run_benchmark_init.sh einstein_S5R5_0.06_sse2_core2_chm_x86_64-unknown-linux-gnu
real 0m7.553s
user 0m4.328s
sys 0m1.200s
=======================================================================================
 
Vielen Dank für die Messwerte.

Die letzten drei erscheinen mir allerdings verdächtig zu sein. Bist Du ganz sicher dass Du die Datei einstein_S5R5_0.06_sse2_core2_chm_x86_64-unknown-linux-gnu in das gleiche Verzeichnis getan hast wie die Skripte *.sh und die anderen executables, die in dem Tar.gz waren? Vielleicht hatte ich das in meiner PN auch nicht explizit geschrieben, aber alle einstein_* Dateien müssen im gleichen Verzeichnis sein (und ausführbar sein).

CU

Bikeman
 
ich hab die in denselben ordner kopiert wo auch die anderen drin sind.
Ich glaube ich hab alles richtig gemacht. aber ich hab nix "ausführbar" gemacht ;)
bin doch linux-noob ;)
 
ich hab die in denselben ordner kopiert wo auch die anderen drin sind.
Ich glaube ich hab alles richtig gemacht. aber ich hab nix "ausführbar" gemacht ;)
bin doch linux-noob ;)

Hi!

Ahhso :-)

Hmm... ein

chmod u+x einstein_S5R5_0.06_sse2_core2_chm_x86_64-unknown-linux-gnu

gefolgt von

./run_benchmark_max_S5R5.sh einstein_S5R5_0.06_sse2_core2_chm_x86_64-unknown-linux-gnu

wäre dann nochmal hilfreich

CU
Bikeman
 
so, erster wert
real 2m51.788s
user 2m46.290s
sys 0m0.908s
mit boinc im hintergrund :]

jetzt mal ohne....

real 2m51.429s
user 2m48.187s
sys 0m1.152s
 
Zuletzt bearbeitet:
so, erster wert
real 2m51.788s
user 2m46.290s
sys 0m0.908s
mit boinc im hintergrund :]

jetzt mal ohne....

real 2m51.429s
user 2m48.187s
sys 0m1.152s

Ahhhhhh...ok, das sieht schon anders aus, der ursprüngliche Messwert war:
real 3m19.797s
user 3m16.336s
sys 0m1.108s

Ich denke da war die einzeln downgeloadedte App noch nicht ausführbar und es wurde die zuvor ausgeführte app getestet (vermutlich die Stock app 1.01).

Ok, die 0.06 app ist bei den langen WUs also etwa 5% schneller, ähnliche Ergebnisse gibt's beim Phenom I, beim Athlon X2 ohne L3 Cache sind es etwa 15 %, bei einem etwas exotischen Centaur C7 mit nur 128 KB L2 Cache sind es etwa 25 %.

Danke nochmal,
Bikeman
 
Ok, die 0.06 app ist bei den langen WUs also etwa 5% schneller, ähnliche Ergebnisse gibt's beim Phenom I, beim Athlon X2 ohne L3 Cache sind es etwa 15 %, bei einem etwas exotischen Centaur C7 mit nur 128 KB L2 Cache sind es etwa 25 %.

Der X2 skaliert also besser ? Ist das schon ein K10 X2 ?
Sehr interessant dann, da scheint das Workingset schön in den L2 zu passen und der Phenom schaut in die Röhre ^^

Insofern schade, dass Propus nur 512kB L2s bekommt ;)

ciao

Alex
 
Zurück
Oben Unten