Projekte und Tools, Hammersoftware, Opteron, AMD64

Bokill · 04.08.2003

Frisch von http://www.amdzone.com/index.cfm#1

AMD64 Code Optimization Project
Reported by: Chris Tom At: 2:49 AM Source: BBS
Dresdenboy has created a Sourceforge project for AMD64 code optimization.
This project is meant to create or optimize algorithms for other open source projects to make them run faster on AMD64 compatible systems by making optimal use of the available hardware.
http://sourceforge.net/projects/optimizer/

und

AMD64 Devsource
Reported by: Chris Tom At: 2:42 AM Source: e-mail
Adnaan Sikandar sent in word of AMD64 Devsource.
How to Automate Your 64-Bit Migration
—Part 1
Your Windows apps need the address capacity, file size, or multi-processor advantages they can only get from 64-bit computing? Then it's time to port some code! In the first of our two-part series on code migration, the experts at MigraTEC, maker of 32-to-64-bit migration tools, explain the issues and complexities involved in 32-to-64-bit porting.

There are a number of other topics and tutorials
http://www.devx.com/amd/Door/16009

Da kann man hoffen, dass noch mehr Schub für den Hammer erzeugt wird.
Jedenfalls scheint doch einen grössere Unterstützung da zu sein als für 3DNow!

Interne Links:
Software für 3DNow! im Vergleich!
http://www.planet3dnow.de/vbulletin/showthread.php3?threadid=94347

SSE2-Verbreitung
http://www.planet3dnow.de/vbulletin/showthread.php3?threadid=89839

Nachtrag
Spezielle P3D Opteronlinksammlung Dort sind weitere Links zum Hammer enthalten... auch zu Softwarefragen

in Englisch aber wirklich immer noch lesenswert:
SSE Technology in New Intel Prescott Processors
http://www.xbitlabs.com/articles/cp...escott-sse.html

SSE Technology in New Intel Prescott Processors
Category: CPU
by Lev Dymchenko
03/25/2003 | 10:30 PM
Deutsche Übersetzung
Bokill

In dieser Betrachtung der SSE/3dNow! Technologie, welche ebenso auf dem Opteron, OpteronFX, Athlon64 vorhanden ist, werden die kommenden Intel Prescott Processoren vorgestellt, es wird ihre aufregende Geschichte, mit ihren Eigenheiten erzählt. Sie bieten besondere Vorzüge für Software- Entwickler. Ferner werden die besonderen Vor- und Nachteile der neuen SSE Instruktionen gegenüber des AMD64- Instruktionssatzes erzählt.

Der bei der letzten Intel Developer Forum neuen vorgestellten Prozessoren von Intel, ist dieser Artikel gewidmet, dort wurden sie der Öffentlichkeit offiziell vorgestellt (see this news story for more information on the new solution). Sie sind der “next generation processor”, hergestellt in der 90nm technologie. Diese erlauben Taktfrequenzen von bis zu 4-5GHz Frequenczen. Der neue Herstellungsprozess ermöglicht wirtschaftlich das Anwachsen des L2 Cache auf bis zu 1MB, die Verdopplung betrifft ebenso den L1 Cache:. Der FSB wird ebenso anwachsen auf 800MHz. Nahezu alle Einheiten wurden überarbeitet und verbessert. Was bringt aber diese komplette Überarbeitung den Softwareentwicklern? Ein großer Cache ist immer eine nette Sache: Man macht sich weniger Sorgen über Lese/Schreibzugriffe in den Speicher, dieser ist und bleibt der limitierende Faktor. Der vergrößerte Cache behebt aber nicht grundsätzlich das Speicherproblem; Bei einer Riesenmenge Daten hilft auch kein verdoppelter Cache.
...that the new Intel’s processor will be rather well-balanced, free from evident bottlenecks, unlike some previous processor models,...
But things like the new seven-layer CPU design are hardly of ...

Soll halt ein Teaser sein

Bokill · 05.08.2003

solche Tuningmassnahmen sind, zeigt der folgende Heiseartikel:

Linux für Itanium erreicht Meilenstein

Die Unterstützung der 64-Bit-Eigenschaften und des neuen Befehlssatzes vom Intel-Itanium-Prozessor im Linux-Kernel steht kurz vor der Vollendung. Wie der Entwickler David Mosberger am gestrigen Montag mitteilte, soll der aktuelle 2.6er-Kernel (Version 2.6.0-test2) "out of the box" auf den 64-Bit-CPUs von Intel laufen, also ohne nachträgliches Einspielen von Patches in die Kernel-Sourcen.

SuSE und Red Hat bieten bereits Linux-Distributionen an, die den Itanium unterstützen. Allerdings verlassen sich die Distributoren auf ein Linux "Marke Eigenbau", um die nötige Stabilität und Performance für den Produktivbetrieb zu erzielen. Dieses Vorgehen empfiehlt auch Mosberger. Wer aber auf ein bisschen Stabilität zugunsten etwas mehr Bequemlichkeit bei der Installation eines Linux-Itanium-Rechners verzichten könne, so Mosberger, der liege bei der aktuellen Version des Entwickler-Kernels jetzt schon auf der sicheren Seite. (ola/c't)

http://www.heise.de/newsticker/data/ola-05.08.03-002/

Eigentlich dachte ich, dass mit der Aussage: XY läuft mit dem OS YZ. Bedeutet: "Es läuft ohne Probleme."

In der Realität bedeutet die erstmalige Aussage: "CPU läuft erstmals mit YZ OS wirklich."
[wahre Bedeutung]
Es wurde von hinten durch die Brust programmiert, und keiner weiss warum dies tatsächlich funktioniert, aber egal es läuft und wird deswegen erstmals veröffentlicht und angepriesen.
[/wahre Bedeutung]

Moritz · 06.08.2003

Was den Intanium64-Befehlssatz angeht, so möchte ich den Kernel-Entwicklern zu Gute halten, dass es wohl eine Fülle von unübersichtlichen Befehlen handelt. Selbst Linus sagte in der Kernel-Mailingliste, dass er den Befehlssatz vom Opteron eindeutiger und leichter finde.
Ausserdem muss man sehen, dass nicht alle Entwickler über die entsprechende Hardware verfügen, so alles "auf blauen Dunst" programmieren (sie sind halt entsprechend gut 8))

Ich denke es wird auch in einiger Zeit noch leichte Probleme mit den neuen Standards geben. Zum Beispiel IPv6 wird bereits seit Jahren entwickelt und ist immernochnicht produktiv im Einsatz. Trotzdem sieht man in den ChangeLogs häufig kleine Änderungen in dem Code.

Grüße,
Moritz

PS: Hat jemand "einfache" Tutorials oder Beschreibungen, zur Optimierung von Code an CPU-Features (z.B. 3dNow, 3dNow+, SSE, SSE2, etc.)

Seemann · 06.08.2003

Zur Codeoptimierung bieten sich entsprechende Dokumente von Intel un d AMD an. Zu finden auf deren Internetz-Seiten.

Bokill · 11.09.2003

Dieser Thread hat mitlerweile schon 2000 Hits, jedoch liess ich diesen Thread verschimmeln, wie eigentlich alle anderen Forenteilnehmer auch.

Wie ist es möglich, dass dennoch der Thread so lange auf der Hauptseite ist?
Die besuchte Anzahl kann`s auch nicht sein, da habe ich wirklich noch andere Threads promotet (nicht nur eigene).

Wie gesagt ist mir irgendwie echt rätselhaft.

Desti · 11.09.2003

redhat taroon beta http://planet64bit.de/modules.php?name=News&file=article&sid=132

gentoo x86-64 http://planet64bit.de/modules.php?name=News&file=article&sid=128

Bokill · 21.11.2003

Ich habe zwar 0 Ahnung von Software und erst recht keine vom Programmieren...

Eines des grössten Geheimnisse von P3D war auch, weswegen der Thread auch in den "Liste der Aktuellen Diskusionen" drin war...
Diskutiert wurde praktisch gar nicht...
auch wennn tatsächlich über 2000 Hits zu verzeichnen waren...egal,

P3D hat einen Hinweis auf Mathematische Bibliotheken zu AMD CPUs herausgebracht.
Man kann wirklich hoffen, dass durch Optimierten Code (Handgeschrieben gar?) wirklich viel aus AMD CPUs herausgequetscht wird.
Mit diesem Hilfsmittel für Programmierer, konnen verbesserte Programme geschrieben werden...

Also sind diese Tools keine "Pätsche" oder Upgrades wie die Flicken für den Windowsanwender...
Für Mausfellnutzer wie mich sind diese vollkommen ungeeignet...

Is eher was für den Programm- Spezis wie Seemann oder gar für intelhasser

Eine Sache ist mir jedoch unklar... Ist dies Hammeroptimiert- oder mögen die auch den Athlon/AthlonXP?

Neue AMD Core Math Library (ACML) 1.5

Dresdenboy · 21.11.2003

Übrigens zieht das Code Optimization projekt um. Irgendwer hat den Namen "Optimizer" für ein JPG-Optimierungs-Tool beansprucht und bei mir hat es die SF-Mails ins Spam sortiert.. nix mitbekommen und nach 14 Tagen ohne Reaktion gehört das Projekt einem anderen. Die Leute bei SF versuchen, die Daten (war zum Glück nicht viel *g*) wiederherzustellen.

Der neue Name wird dann Optimizer64 sein.

Da können alle mitmachen, die sich dafür interessieren und Lust haben, vorhandene Open-Source-Projekte etwas zu optimieren (meist ist das nur für Kernalgorithmen notwendig).

Zur Zeit "kümmere" ich mich um eine neue FFT für Prime95. George Woltman optimiert die vorhandene für den Opteron, soweit machbar ist. Die Members von mersenneforum.org haben Geld gespendet, um einen Opteron für George und andere Entwickler zu kaufen. Das ist doch mal was!

Dresdenboy · 21.11.2003

Original geschrieben von Bokill
Eine Sache ist mir jedoch unklar... Ist dies Hammeroptimiert- oder mögen die auch den Athlon/AthlonXP?

Die ACML Bibliotheken wurden in der 32-bit-Version für Athlon-XP-Architektur compiliert. Das könnte also gehen. Auf Arbeit kann ich ja mal schauen (das sind über 20MB), ob da x87-Code drin ist.

Aber sie sind nicht die schnellsten (siehe http://www.fftw.org/speed/ - die Opteron-Tests, ACML wird in Schwarz mit Dreieck-Symbolen in den Diagrammen dargestellt). Das liegt aber auch daran, das FFTW neue Verfahren einsetzt. Es wird in einem längeren Durchlauf einfach viel Code getestet und variiert und dann der schnellste verwendet. Bei ACML sind die Funktionen einmal programmiert und optimiert worden und sind für verschiedene Parameter immer die gleichen. Manchmal ist das auch steuerbar - dazu habe ich aber zuwenig in ACML reingeschaut (da vor-aussortiert

).

Bokill · 21.11.2003

Merkwürdig

Der Thread verschimmelte auf höchstem Niveau...wochenlang...hab den selbst schmählich nicht "gegossen" und nun eine Infoexplosion sondergleichen?!

Die Benchmarks sehen aber nicht nur positiv für den Opteron aus...

habe allerdings auch keine Ahnung, wofür die diversen Kurven stehen...sehe den Wald vor Bäumen nicht...sind ja nicht zwei SANDRA Benchmarks *grins*

PS: Sehr bemerkenswerter Thread über Sinn und Unsinn von MS`s WOW64...
ich nenne solch eine Umsetzung HÄ?64

Athlon 64 16bit Codeunterstützung?
Sehr bemerkenswert, da die Linuxgemeinde wesentlich mehr Goodies aus dem Hammer herausquetscht als MS!

Seemann · 22.11.2003

@Dresdenboy:
Du erwähntest da gerade was von optimieren und OpenSource. Das ist doch genau mein Ding. Hast du einen Link als Anlaufstelle parat?

Dresdenboy · 23.11.2003

Ich hatte einen Link parat und muß jetzt warten, bis das Sourceforge-Team die neue alte Projekt-Seite wiederhergestellt hat.

Als Einstiegspunkt (für die Art der Performance-Probleme beim Prime95-Code auf Opteron) empfehle ich: http://mersenneforum.org/showthread.php?s=&threadid=1072

MOVAPD ist ein ernster Flaschenhals. Den kann man nur mit Tricks umschiffen (mehr memory operands verwenden).

Zur Zeit arbeite ich mich von der anderen Seite heran - einen Algorithmus zu implementieren mit paralleler FFT und Integer-Transformation. Damit werden die meist brachliegenden Integer-Einheiten genutzt (meist ist die FPU mit Adds beschäftigt) und man kann die Transformationen kombinieren um die mit Doubles erreichbare Genauigkeit drastisch zu erhöhen.
Nach der Implementation kommt Assembler-Optimierung. George Woltman hat die Berechnungen von Prime95 zu 99% in Assembler. Das ist ein sehr großer Aufwand bei größeren Änderungen. Da habe ich schon angefangen, Scripte zu schreiben, um Optimierungen am Code vorzunehmen %)

Eine fertige neue FFT, die prima auf Opteron (und ähnlich gut ausgestatteten CPUs - im Prinzip die meisten 64bit CPUs) läuft, wäre bei Erfolg noch für viele andere Projekte nützlich.

Es gab schon Anfragen/Vorschläge an das Optimizer-Projekt, z.B. die Codecs von XVID zu optimieren oder gar die Code-Optimierung von GCC. Aber da muß man erst einmal schauen, ob nicht schon so eine Arbeit im Gange ist (bei GCC sowieso schon lange).

Interesse geweckt?

PS: Es gibt ja schon einige nutzbare Entwicklungs-Opteron-Systeme (Sourceforge (4x), AMD DevCenter usw.). Aber ein Athlon 64 daheim auf dem Tisch ist auch praktisch (wird bei mir bald sein).

Bokill · 06.10.2004

Endlich Offiziell; intel-Kompiler für AMD-64?!

Intels Compiler unterstützen AMD64
Entwickler-Werkzeuge von Intel in neuer Version

Intel hat seine Entwickler-Software überarbeitet und bietet jetzt neue Versionen seines C++- und Fortran-Compilers, der Programmbibliotheken "Integrated Performance Primitives", des Vtune Performance Analyzers und der Intel Math Kernel Library. Neu ist vor allem die Unterstützung der AMD64-Plattform, die bei Intel EM64T heißt.

Zum Vergrößern anklicken....

Auch wenn ich kein Freund der intel-Technologie bin ... deren Compiler sind Spitzenklasse.

Nun ist auch AMD64 fit gemacht worden, mit einem Compiler der AMD64 nutzen kann! So wie IA32 auch vorher ordentlich (vor allem für intel-CPUs) damit "gedopt" wurde. Mit den intel-Kompiler war es aber unter IA32 möglich alle möglichen Feintuningmassnahmen zu ergreifen (bis auf 3DNOW!).

Dass andere Compiler auch tunen können, zeigt seit längerer Zeit ja auch intel_hasser mit seinem IA32-Benchmarkthread . Jedes Familienmitglied der IA32 Familie bekam für AMBiX86 seine eigene Optimierung ... leider gehen da andere Benchmarks nicht so offen damit um, mit welchem optimierten arbeiten. Bei AMBiX86 kann man seinen CPU-Spezifischen-Kernel sogar umstellen

PS: Weil die Compiler von intel nun mal Spitze sind, und weil intel nun eifrig Schuhe verspeist "Mmmmm shoes are tasty" *, war es meiner Meinung nach einen eigenen Thraed wert.

* Weitere Bemerkungen im Opteronthread unter Das Ende ist nah?! Statt eines Schlusswortes ... so ein "Zufall" ( wer ist Rainer Zufall? ) aber auch, dass nach 18 Monaten Opteronstart nun doch entsprechende Compiler von intel zur Hand sind.

MFG Bokill

Die entsprechende Meldung bei P3D lautet Intel veröffentlicht x86-64 Compiler

Bokill · 10.10.2004

Da warten wir auf die Eignung des aktuellen intel-Kompilers Intel 8.1/EM64T ... und da sind schon erste Ergebnisse raus.

1. Er funktioniert.
2. Auch mit dem K8.

Aber solch eine Statement ist doch erstmalig für einen Kompiler von intel:

On the whole gcc and PGI are not that bad, in some tasks they demonstrate a good speed. Intel/EM64T (so far?) is outscored by its predecessor and can be now considered only as a potentially interesting compiler.

Ist die Linux-gemeinde mit dem gcc so gut geworden, oder hat intel wegen des Plattformnachteils (Referenzplattform ist nun mal AMD64) nun eindeutig Standortnachteile?
-> Zeitnachteil, da der Infofluss nun nicht mehr intern ist.
-> Performancenachteil, da die Hardware nun mal nicht aus dem gleichen Hause stammt.

Die Testplattform war ein K8:

* AMD Athlon 64 3500+ CPU (2,2 GHz, 512 KB L2, Socket 939)
* Gigabyte K8NSNXP-939 mainboard
* 2 x Kingston HyperX KHX4000/512 (operating as DDR400)
* Operating system: SuSE Linux 9.1 x86-64 (Kernel 2.6.5-7.108, gcc 3.3.3-33 compiler)

We used the following compilers:

* GNU gcc
* PGI Workstation 5.2-2
* Pathscale EKO Compiler Suite 1.3-108
* Intel Compilers 8.0 (C/C++ 8.0.070, Fortran 8.0.050)
* Intel Compilers 8.1 for EM64T (C/C++/Fortran 8.1.020)

dabei ist auffällig, dass andere Kompiler nicht mehr so stark absacken, wenn sie von intel auf die Plätze verwiesen werden. Auffällig ist auch, dass auch eine intelplattform den Code annimmt, allerdings sind die Leistungsprofile von AMD und intel deutlich anders:

PGI performed quite well on the Intel processor in the 64-bit mode. Alas, this combination cannot be recommended for calculation tasks. Though it should be noted that the compiler may be "corrected" with the advance of EM64T processors. CFP2000 tests of the product from Portland Group on the AMD processors demonstrated performance gains in most tasks.

Ein sehr lesenswerter Test von Kirill Kochetkov von Digit-Life... auch wenn ich nicht alles verstanden habe

.
Alles und noch viel mehr (Leistungs-Vergleichs-Tabellen) bei SPEC CPU2000. Part 17.
AMD64/EM64T and 64-bit code.
The third attempt.

MFG Bokill

PuckPoltergeist · 10.10.2004

Original geschrieben von Bokill
In der Realität bedeutet die erstmalige Aussage: "CPU läuft erstmals mit YZ OS wirklich."
[wahre Bedeutung]
Es wurde von hinten durch die Brust programmiert, und keiner weiss warum dies tatsächlich funktioniert, aber egal es läuft und wird deswegen erstmals veröffentlicht und angepriesen.
[/wahre Bedeutung]

Womit belegst du diese Aussage? Was du hier meinst, ist daß das System überhaupt erstmal bootet und in irgendeiner Form ansprechbar ist. Das wird aber auch meist so dargestellt. Ich kann mich jetzt nichtmal an Meldungen von MS erinnern, daß Windows angeblich irgendwo drauf läuft, und es im Endeffekt noch nicht so war.

edit: Ok, war diesmal echt zu blind, den "tieferen Sinn" hinter den Zeilen zu erkennen. Satire ist aber manchmal auch was feines

Dresdenboy · 10.10.2004

Ich schätze Kirill Kochetkov als einer der besten Artikelautoren im Bereich Compiler+SPEC. Das AMD64 dabei öfters unter die Lupe genommen wird, ist ebenfalls sehr günstig.

Zum ICC 8.0 & 8.1:
Ich sehe da nur ein Problem für den Einsatz von ICC 8.1 als K8-Compiler: Während die Version 8.0 aufgrund der 32bit-Code-Erzeugung auch das Instruction-Scheduling für PPro-Architekturen (also auch P-M) beherrschen muß, ist das für den ICC 8.1 für 64bit-Code zur Zeit nicht notwendig, da es ja noch keinen 64bittigen P-M gibt. Resultierend daraus optimiert er für den Prescott/Nocona-Kern und verwendet entsprechend geeignete Befehle bei für diese CPUs optimierter Anordnung. Nur - wie schon von P4-Code bekannt - sind solche Befehlsfolgen u. auch Optimierungen auf die andere Cache-Architektur nicht optimal für den K8. Damit rücken auch bisher als weniger gut optimierend bekannte Compiler (GCC) immer weiter vor, da ICC auf dem K8 durch anders optimierten Code zurückfällt.

Die anderen kommerziellen Compiler haben natürlich auch viel Erfahrung und Können auf ihrer Seite. Pathscale sticht da geradezu heraus und dürfte allein durch seine guten Ergebnisse zusätzliche Verkäufe des Opteron initiieren. Ein 10% schnellerer Compiler bringt schließlich etwa soviel, wie ein Opteron mit höherem Speedgrade.

Und an GCC arbeiten auch sehr viele gute Entwickler. Diese müssen sich allerdings nicht alle mit dem K8 beschäftigen, damit der GCC guten Code erzeugt. Dafür reicht ein gutes K8-Backend, während schon vor der CPU-spezifischen Code-Generierung viel passiert, was schließlich zu schnellerem Code führt.

Bleibt als Fazit:
Da der K8 dank dem ICC 8.1 nur noch Nocona/Prescott-optimierte Befehlssuppe bekommt, mag er diese nicht ganz so schnell verspeisen, da zuviele kleine Bröckchen den Kauprozess aufhalten..

PuckPoltergeist · 10.10.2004

Original geschrieben von Dresdenboy
Damit rücken auch bisher als weniger gut optimierend bekannte Compiler (GCC) immer weiter vor, da ICC auf dem K8 durch anders optimierten Code zurückfällt.

Seit Version 3 der gcc ist der Unterschied zum icc so zusammen geschrumpft, daß es nicht mehr weit zur Meßungenauigkeit ist. Wenn ich nicht irre, dürfte im Moment auch der/die gcc der schnellst Compiler für den K8 sein.

Bokill · 10.10.2004

@PuckPoltergeist

In der Realität bedeutet die erstmalige Aussage: "CPU läuft erstmals mit YZ OS wirklich."
[wahre Bedeutung]
Es wurde von hinten durch die Brust programmiert, und keiner weiss warum dies tatsächlich funktioniert, aber egal es läuft und wird deswegen erstmals veröffentlicht und angepriesen.
[/wahre Bedeutung]

Öhemm das war eine satirischer Beitrag ... sollte ich bei technischen Threads wirklich folgende Tags verwenden?
[satire][/satire] ... aber nett zu wissen, dass du gar MS in Schutz nimmst ... ist bei kompetenten Linux-Anwendern ja eine echte Seltenheit

*friedens-taube-überreich*

MsFG Bokill

@Dresdenboy
THX für die Info, sollte man wohl mal weitere Artikel von dem erforschen

MFG Bokill

Dresdenboy · 10.10.2004

Original geschrieben von PuckPoltergeist
Seit Version 3 der gcc ist der Unterschied zum icc so zusammen geschrumpft, daß es nicht mehr weit zur Meßungenauigkeit ist. Wenn ich nicht irre, dürfte im Moment auch der/die gcc der schnellst Compiler für den K8 sein.

Bei SPEC-Messungen wird für die meisten Integer-Codes im 64bit-Modus mittlerweile GCC eingesetzt. Allerdings zeigen zumindest bei diversen SPEC-Result-Trackings GCC 4.0 (SSA) und ältere Versionen noch viele Bereiche, wo selbst ICC 7 besser ist. Aber die Arbeit an GCC steht ja nicht still.

mtb][sledgehammer · 10.10.2004

Interessanter Test, verlangt noch ein wenig Leserbedarf bei mir

Zwischenfrage: Was macht der Test "179.art". Dieser Test profitiert sowohl mit dem icc als auch gcc deutlich. Dabei fällt aber besonders das Ergebnis des Nocona mit icc auf: über 200 % Vorteil gegenüber dem 32 Bit Compiler.

Dresdenboy · 10.10.2004

Original geschrieben von mtb][sledgehammer
Interessanter Test, verlangt noch ein wenig Leserbedarf bei mir
Zwischenfrage: Was macht der Test "179.art". Dieser Test profitiert sowohl mit dem icc als auch gcc deutlich. Dabei fällt aber besonders das Ergebnis des Nocona mit icc auf: über 200 % Vorteil gegenüber dem 32 Bit Compiler.

Der Test arbeitet im Bereich der KI:

http://www.specbench.org/cpu2000/CFP2000/179.art/docs/179.art.html

PuckPoltergeist · 16.10.2004

Original geschrieben von Bokill
Öhemm das war eine satirischer Beitrag ... sollte ich bei technischen Threads wirklich folgende Tags verwenden?
[satire][/satire]

Ist eigentlich nicht notwendig. Ich haue ja auch selbst genug damit um mich.

Die Woche war wohl doch zu anstrengend, daß ich hier nicht mehr mit gekommen bin. ]

... aber nett zu wissen, dass du gar MS in Schutz nimmst ... ist bei kompetenten Linux-Anwendern ja eine echte Seltenheit

Naja, ich muß mich ja nicht auf deren Niveau runter begen, und pauschal alles von denen durch den Dreck ziehen.

*friedens-taube-überreich*

Nehm ich.

Bokill · 18.10.2004

http://planet64bit.de/modules/news/article.php?storyid=314

Mit Hinweis auf das AMD PDF 32035

THX Desti von planet64bit.de

MFG Bokill

PuckPoltergeist · 18.10.2004

Original geschrieben von Bokill
http://planet64bit.de/modules/news/article.php?storyid=314

Mit Hinweis auf das AMD PDF 32035

THX Desti von planet64bit.de

MFG Bokill

Das Paper halte ich durchaus für nicht ungefährlich. Der Schalter -ffast-math beim gcc erzeugt mitunter nicht korrekten Code, bzw. fehlerhafte Genauigkeit, was bei manchen Programmen fatal sein kann. Es wird darauf auch in dem Paper nochmal etwas eingegangen, nur finde ich, daß das gleich bei der ersten Erwähnung von -ffmast-math aufgezeigt werden sollte. Wenn man nicht aufpaßt, kann das ganz böse in die Hose gehen.
Außerdem wird funit-at-a-time anders als dort angegeben, schon bei -O2 angeschalten.

Alles in allem ist es aber trotzdem lobenswert, daß hier von AMD Optimierungsmöglichkeiten bei verschiedenen Compilern für Softwareentwickler zusammengetragen werden, insbesondere da AMD keine eigenen Entwicklungstools (Compiler) herstellt. Hoffentlich pflegen sie das auch ordentlich.

PS: zum -ffast-math

-ffast-math
Sets -fno-math-errno, -funsafe-math-optimizations,
-fno-trapping-math, -ffinite-math-only, -fno-rounding-math and -fno-signaling-nans.

This option causes the preprocessor macro __FAST_MATH__ to be defined.

This option should never be turned on by any -O option since it can result in incorrect output for programs which depend on an exact implementation of IEEE or ISO rules/specifications for math functions.

Bokill · 18.10.2004

@Puck

Von Programmieren habe ich keinerlei Dunst ... das überlasse ich lieber intel_hasser, Seemann und anderen. Da ich aber in grauer Vorzeit diesen und auch noch einen weiteren Thread zu 3DNOW! gemacht hattem ist`s zumindest für einige Geeks und Mutanten erwähnenswert, die sich damit beschäftigen.

Man kann ja nicht alles wissen & finden. Gut möglich dass heutige Noobs, in ein zwei Jahren sich auf bestimmte Anlaufstellen besinnen.

An sich gehört dieser Thread eher in das Programmier-Forum ... zu seiner Entstehungszeit gabs das ja noch nicht.

MFG Bokill

Projekte und Tools, Hammersoftware, Opteron, AMD64

Gesperrt

Gesperrt

Commander

Admiral Special

Gesperrt

Moderator☆☆☆☆☆☆

Gesperrt

Redaktion☆☆☆☆☆☆

Redaktion☆☆☆☆☆☆

Gesperrt

Admiral Special

Redaktion☆☆☆☆☆☆

Gesperrt

Gesperrt

Grand Admiral Special

Redaktion☆☆☆☆☆☆

Grand Admiral Special

Gesperrt

Redaktion☆☆☆☆☆☆

Grand Admiral Special

Redaktion☆☆☆☆☆☆

Grand Admiral Special

Gesperrt

Grand Admiral Special

Gesperrt

Ähnliche Themen

Moderator
☆☆☆☆☆☆

Redaktion
☆☆☆☆☆☆

Redaktion
☆☆☆☆☆☆

Redaktion
☆☆☆☆☆☆

Redaktion
☆☆☆☆☆☆

Redaktion
☆☆☆☆☆☆

Redaktion
☆☆☆☆☆☆