PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Optimierte einstein-app 4.17 ???



hollyhart
26.05.2007, 12:21
Tach,
wie hier zu lesen:
http://www.heise.de/foren/go.shtml?read=1&msg_id=12793472&forum_id=74338
gibt es wohl eine optimierte version von der 4.17 einstein applikation.
Nur in dem genannten Links:
http://einstein.phys.uwm.edu/forum_thread.php?id=4373
und
http://einstein.phys.uwm.edu/forum_thread.php?id=4373#68838

finde ich keinen link zum Download.
Auf der Beta seite von einstein ist auch nichts.*noahnung*
Koennt ihr helfen??

mfg
hollyhart

TAL9000
26.05.2007, 14:39
Hmm, soweit mein Englisch es hergibt, ist in der Erweiterungen Erkennung ein Fehler bzw. ist nicht gerade doll Programmiert.
Findet die App einen AMD Prozi werden die SSE2 Befehle nicht verwendet, auch wenn er es könnte.
Mit SSE2 fähigen AMD-Prozessor und einer kleinen Manipulation mit dem HexEditor an der Application kann mann das umgehen. Ist aber eher noch im Experimental-Status!

Mod: mit Hexedit "AuthenticAMD" in "AuthenticABC" (z.B.) ändern. Damit wird der SSE2 Befehlssatz dann verwendet.

>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
http://einstein.phys.uwm.edu/forum_thread.php?id=4373&nowrap=true#68863 :
It's easy. :-)

I googled for an hex editor(had one, but got lost), found HEX-Editor MX, downloaded, virus-checked an installed it.
Opened Admin Cmd window and typed "net stop boinc".
Started the editor and open the einstein.exe. Searched with the text search for Authentic and found AuthenticAMD. Edited that to AuthenticABC, saved file and started boinc again. Voila.

37:48 min - 3,38% could end up around 15h. WU is 408.50. Wingman has had some of them and got 318.02 credits. Rough guess: FASTER!
Remember, the same host got ~14 cr/h under Windows.
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

Bringt scheinbar ca. 1c/h 25% mehr. :o

Komische Art der Befehlssatzerkennung von den Einstein-Team *noahnung*

TAL9000

hollyhart
26.05.2007, 15:12
Hmm, soweit mein Englisch es hergibt, ist in der Erweiterungen Erkennung ein Fehler bzw. ist nicht gerade doll Programmiert.
Findet die App einen AMD Prozi werden die SSE2 Befehle nicht verwendet, auch wenn er es könnte.
Mit SSE2 fähigen AMD-Prozessor und einer kleinen Manipulation mit dem HexEditor an der Application kann mann das umgehen. Ist aber eher noch im Experimental-Status!

Mod: mit Hexedit "AuthenticAMD" in "AuthenticABC" (z.B.) ändern. Damit wird der SSE2 Befehlssatz dann verwendet.

Bringt scheinbar ca. 1c/h mehr. :P

Komische Art der Befehlssatzerkennung von den Einstein-Team *noahnung*

TAL9000
Danke.
Da war ich nun zu faul um mir den gesamten Betrag durchzulesen, und habe es glatt uebersehen.
Wird zeit meine AMD's wieder auf Einstein loszulassen.

mfg
hollyhart

fogzone
27.05.2007, 13:28
diese riesigen wu's die es zur zeit gibts sagen mir eigentlich nicht sonderlich zu ... aber was solls =)

TAL9000
27.05.2007, 13:36
diese riesigen wu's die es zur zeit gibts sagen mir eigentlich nicht sonderlich zu ... aber was solls =)

QMC ist teilweise auch verdammt groß, SIMAP hat noch nichts zu tun und Spin ist nur MHz abhängig und damit Verschwendung von Power bei Modernen CPUs

Da bleibt nicht viel, wenn man sich auf sinnvolle deutsche Projekte konzentriert. Mit Chess baucht mir keiner zu kommen, auch wenn ich diese Variante von Schach sehr interessant finde.

TAL9000

Surfer76
27.05.2007, 16:20
Gibt es da jetzt eine optimierte Anwendung oder wird die autom. geladen und benutzt, hat aber nur einen Bug, den man dann selber ändern muss?
Hab keinen Direktlink gesehen.

TAL9000
27.05.2007, 17:24
Gibt es da jetzt eine optimierte Anwendung oder wird die autom. geladen und benutzt, hat aber nur einen Bug, den man dann selber ändern muss?
Hab keinen Direktlink gesehen.


Es gibt einen "Fehler" in der Standard Anwendung. Durch Modifikation wird die App. dann bei AMD CPUs mit SSE2 schneller, um ca. 1c/h. 25% :o

Steht alles doch da ^^

TAL9000

hollyhart
31.05.2007, 01:29
Bringt scheinbar ca. 1c/h mehr. :P

TAL9000
Bei mir braucht er jetzt immer so 70 bis 75 % der rechenzeit wie ohne "Optimierung". Lohnt sich doch ganz gut.

mfg
hollyhart

TAL9000
31.05.2007, 11:20
Bei mir braucht er jetzt immer so 70 bis 75 % der rechenzeit wie ohne "Optimierung". Lohnt sich doch ganz gut.

mfg
hollyhart

Auf was für ein System?

Ich selber kann nichts damit erstmal Anfangen, da keiner meiner AMDs SSE2 kann.:(


TAL9000

hollyhart
03.06.2007, 01:14
Auf was für ein System?

TAL9000
eigentlich auf allen 64bit AMD's die ich habe. Gibt keinen unterschied ob athlon oder sempron. *noahnung*

gruss
hollyhart

PS: bei dem sieht man es gut:
http://einstein.phys.uwm.edu/results.php?hostid=769685

TAL9000
03.06.2007, 13:16
eigentlich auf allen 64bit AMD's die ich habe. Gibt keinen unterschied ob athlon oder sempron. *noahnung*

gruss
hollyhart

PS: bei dem sieht man es gut:
http://einstein.phys.uwm.edu/results.php?hostid=769685

Wow!
ja, das lohnt sich...;D

Also Einstein´er mit SSE2 AMDs... ran an Hexedit, bzw. vielleicht kann Hollyhart einen download link zu seiner Version anbieten.

TAL9000

Bikeman
07.06.2007, 10:16
Komische Art der Befehlssatzerkennung von den Einstein-Team *noahnung*

TAL9000

Ich habe damals die Diagnose des Problems im E@H Forum gepostet und damit indirekt die Anleitung zum Hex-editieren :-(, eigentlich sehen es die Verantwortlichen bei E@H nicht gerne wenn man in ihren Anwendungen "rummacht".

Zur Ehrenrettung der Einstein-Programmierer muss man aber betonen, dass die fehlerhafte CPU Erkennung nicht deren Code ist, sondern Bestandteil einer etwas älteren Version der C-Runtime des Microsoft Visual Studio C(++) Compilers ist!!

Das erinnert etwas an die Unsitte des Intel C Compilers, AMD-CPUs zu benachteiligen, siehe z.B. die Seite, die Google zum Stichwort "naughty Intel" als erste ausspuckt . Bei Microsoft hat es aber möglichweise einen anderen Hintergrund:

Es kann sein dass frühe Versionen des K8 (z.B. die mit Clawhammer Kern) eine so schlechte SSE2 Performance haben dass diese für die Funktionen der C-Runtime keinen Vorteil bringen. Deswegen kann es auch sein, dass auf einigen frühen Clawhammer Chips der oben beschriebene Hex-edit keinen Vorteil sondern sogar einen Performance-Nachteil bringt. Jedenfalls sieht der CPU Erkennungscode so aus als hätte man vielleicht nur bei bestimmten K8 CPUs SSE2 nicht nutzen wollen, und dabei ist man wohlmöglich über das Ziel hinausgeschossen und hat für alle K8 CPUs den SSE2-Befehlssatz links liegengelassen, auch wenn er unterstützt wird.

Neuere Versionen von Visual Studio scheinen das Problem nicht mehr zu haben.

Den AMD-Crunchern bei Einstein@Home, die einen nicht-SSE2 fähigen K6 oder K7 haben, kann ich eigentlich nur den Umstieg auf Linux empfehlen :-). Der zum Bau der Linux Anwendung verwendete Compiler erzeugt auch ganz ohne SSE oder SSE2 einen recht fixen Code, gegenüber der Windows-Anwendung sollten K6 und K7 unter Linux ebenfalls nur 75 - 70% der Rechenzeit benötigen.

CU

BRM