Neue CPU-Fehler in Opteron und Athlon 64 gelistet

Nero24

Administrator
Teammitglied
Mitglied seit
01.07.2000
Beiträge
24.066
Renomée
10.446
  • BOINC Pentathlon 2019
  • BOINC Pentathlon 2020
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2021
Seit etlichen Jahren pflegen die CPU-Hersteller Intel und AMD ausführliche Listen ("Erratalist" genannt), in denen die bekannten Fehler in ihren Prozessoren peinlich genau dokumentiert sind; unter welchen Umständen sie auftreten, wie man (sprich: Compiler- und BIOS-Programmierer) sie umgehen kann und ob Fixes geplant sind. Angefangen damit hat damals Intel, als der legendäre FPU-Bug in der Öffentlichkeit ausgeschlachtet wurde und der Ruf nach transparenten Ressourcen für die Entwickler laut wurde.

Fehler in derart komplexen Gebilden wie Prozessoren, wo mehrere Millionen Transistoren Dienst schieben und möglichst genau das tun sollen, was die Entwickler damit im Sinn hatten, sind unumgänglich. Schon beim Start waren beispielsweise beim Pentium 4 über 40 Bugs bekannt. Beim Opteron sind es zwar nicht ganz so viele (oder zumindest sind nicht so viele bekannt), aber blütenrein ist natürlich auch er nicht. Trotzdem: wäre Software so bugfrei wie Prozessoren, unser Support-Forum wäre wohl menschenleer.

Seit unserem <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1065623578">letzten Bericht</a> zu den Erratalisten der K8-Prozessoren im Januar hat sich wieder einiges getan. Zwei neue Bugs mit den Nummern #109 und #111 wurden in den letzen zwei Monaten gefunden und in der <a href="http://www.amd.com/us-en/assets/content_type/white_papers_and_tech_docs/25759.pdf" TARGET="b">Juni-Version 3.25 der Erratalist</a> dokumentiert. Die Bugs im Detail:<ul><b>#109: Certain Reverse REP MOVS May Produce Unpredictable Behavior</b>
Ein ziemlich tückischer Bug, da das System nicht einfach "nur" abstürzt, wenn der Fehler auftritt, sondern unter Umständen auch falsche Ergebnisse geliefert werden können! Glücklicherweise tritt der Fehler nur in Kombination mit ganz bestimmten, seltenen Konstellationen auf. AMD plant einen Fix in einer der nächsten CPU-Revisionen.

<b>#111: Rtt Specification Violation</b>
Vergleichsweise harmlos dagegen ein Verhalten, welches die Spannungsspezifikationen des HyperTransport-Pins verletzt. Ausfälle oder Folgefehler dadurch seien nicht bekannt, heißt es bei AMD. Trotzdem ist ein Fix geplant.</ul>Bereits mit dem April-Update wurden die Fehler #105-#108 hinzugefügt, wobei #108 lediglich eine fehlerhafte Rückmeldung der CPUID beim System beschreibt, wenn Sockel 754 CG-Stepping Prozessoren zum Einsatz kommen. #105-#107 dagegen können Systemabstürze hervorrufen. Für alle genannten Bugs plant AMD einen Fix.

Der Anwender selbst dagegen kann gegen diese Fehler nichts tun. Mit "ganz bestimmte Kombinationen" ist nicht gemeint, dass ein Fehler immer dann auftritt, wenn er beispielsweise gleichzeitig Taste "n" drückt und dabei die Mouse bewegt. Damit sind Kombinationen von Maschinenbefehlen, Register- und Cacheline-Belegungen gemeint, die in der Folge zu Fehlern führen können. Umgehen können das nur Compilerbauer, indem sie als kritisch bekannte Befehlsfolgen einfach nicht verwenden oder BIOS-Programmierer, indem etwa fehlerhafte Features kurzerhand deaktiviert werden. Somit ist alles was der Anwender gegen solche Fehler tun kann immer das aktuelle BIOS auf dem System zu haben, aktuelle Treiber und aktuelle Programm-Updates zu verwenden - stets unter Berücksichtigung des alten Spruchs "never touch a running system" natürlich...
THX Marc für den Hinweis

<b>Update</b>
Für Erratum #109 hat AMD mittlerweile einen BIOS-Patch erarbeitet, welches Mainboard-Hersteller auf Anfrage erhalten und in ihre eigenen BIOS-Versionen einfließen lassen können! Der Fix ist für alle Besitzer von Athlon 64 Systemen interessant, da der Fehler bei Revisionen ab C0 auftritt. Ältere B3-Revisionen, die diesen Bug nicht aufweisen, wurden nur bei ersten Opteron-Systemen eingesetzt.
 
Original geschrieben von McTNT
Ich wuste gar nicht dass es ein B0 Stepping gab...
Gab es auch nicht - zumindest nicht auf dem Markt. War ein Tipfehler und sollte B3 heißen. Ist korrigiert. Danke für den Hinweis :)
 
hmm die fixes in späteren revisionen sind in prinzip doch wirkungslos - welche software macht sich schon die mühe und liest das stepping aus?

was ich eigentlich fragen wollte: ist das eigentlich noch aktuell, dass der k7 nur 2 bekannte bugs hat? beim k8 sinds ja dann doch um einiges mehr geworden....
 
Original geschrieben von ThePsycho
hmm die fixes in späteren revisionen sind in prinzip doch wirkungslos - welche software macht sich schon die mühe und liest das stepping aus?
Software in diesem Fall wohl nicht, aber evtl. BIOS-Versionen. Angenommen: das C0-Stepping des K8 hat einen Bug in der ECC-Verwaltung, wenn die Burstlength auf 8 steht. Dann kann ein BIOS-Programmierer veranlassen, dass entweder ECC deaktiviert wird oder die Burst-Length auf 4 gesetzt wird, sofern das BIOS eine C0-Stepping Revision findet. Bei CG-Stepping CPUs kann das BIOS Burstlength 8 wieder zulassen.

was ich eigentlich fragen wollte: ist das eigentlich noch aktuell, dass der k7 nur 2 bekannte bugs hat? beim k8 sinds ja dann doch um einiges mehr geworden....
Also beim Palomino waren es schon 10, diesen Link hab ich im Kopf ;)
http://www.amd.com/us-en/assets/content_type/white_papers_and_tech_docs/24332.pdf
Für Thoroughbred und Barton müsste ich suchen, sollte aber kein Problem sein die auf der AMD-Seite zu finden wen's interressiert :)
 
Original geschrieben von Nero24
Also beim Palomino waren es schon 10, diesen Link hab ich im Kopf ;)
http://www.amd.com/us-en/assets/content_type/white_papers_and_tech_docs/24332.pdf
Für Thoroughbred und Barton müsste ich suchen, sollte aber kein Problem sein die auf der AMD-Seite zu finden wen's interressiert :)

Wobei AMD in der Vergangenheit relativ schlampig in der Dokumentation von Fehlern war. Da können sie auf jeden Fall noch bei Intel lernen. (Die hatten ihr Waterloo ja schon ;D)
 
Kann es sein, dass Asus den patch schon im neuen beta-bios für das K8V D (1008d.001) implementiert hat?
 
Original geschrieben von Nero24
Die Fehlerliste ist doch in der Meldung bereits verlinkt *kopfkratz

..war wohl ein wenig spät....
sleeping.gif


mfg
 
Zurück
Oben Unten