In den letzten Monaten und Jahren hat in den Entwicklungsabteilungen vieler IT-Unternehmen eine neue Offenheit Einzug erhalten. Während Bugs des eigenen Produkts früher selbst dann noch verleugnet wurden, wenn sie durch unabhängige Stellen bereits öffentlich nachgewiesen waren, sind die Buglisten etwa der Prozessoren von Intel und AMD heute für jedermann frei zugänglich und nachzulesen.
Intel hat mit diesen Erratalisten angefangen und dafür nicht selten zu Unrecht Häme und Spott geerntet, als z.B. beim Pentium 4 am Tage der Vorstellung schon über 40 Bugs bekannt waren. Sinn dieser Fehlerlisten ist es, Bugs zu dokumentieren, um den BIOS-Programmierern und Compilerbauern die Möglichkeit zu geben, ein Workaround in ihr BIOS/Compiler einzubauen, welches das Problem geschickt umschifft. Wenn eine Befehlsfolge fehlerhaft arbeitet, darf ein Compiler die kritische Kombination eben nicht verwenden, sondern muß die Befehlsfolge mit einer alternativen Schreibweise realisieren. Damit wird der Kunde von diesem Bug nicht behelligt, obwohl er nach wie vor in der Hardware steckt.
Inzwischen pflegt auch AMD eine solche Liste über seine Prozessoren und Chipsätze. Ende vergangener Woche hat AMD die Errataliste (dort Revision Guide genannt) für den Athlon 64, den Athlon 64 FX und den Opteron veröffentlicht. So sind dort derzeit 37 Bugs dokumentiert, die entweder Athlon 64, Athlon 64 FX/Opteron oder beide betreffen. Interessant ist, daß in der aktuellen C0-Revision des Kerns bereits 14 Bugs der ursprünglichen Revision gefixt wurden. Für 6 Bugs ist kein Fix geplant und 3 Bugs sind in der Revision C0 neu dazu gekommen.
So findet sich in dem Dokument als Erratum #86 z.B. ein Fehler mit der Beschreibung "DRAM Data Masking Feature Can Cause ECC Failures". In der Tat hatten wir bei unseren Opteron- und Athlon 64 Reviews zwei Mal kritisiert, daß das Asus SK8N Mainboard mit aktiviertem ECC-Modus abstürzte oder unzuverlässig arbeitete. Zwar hatten wir uns schon damals gewundert, weshalb das Mainboard an diesem Fehler schuld sein kann, wenn der Speicher-Controller in der CPU steckt, aber da es von der Serverfront, wo der Opteron bereits seit April zuverlässig Dienst schiebt und ECC an der Tagesordnung ist, keine Klagen gab, schoben wir den Fehler auf das Mainboard. Die Errataliste dagegen entlastet Asus: der Fehler steckt wohl in der CPU und die Tatsache, daß es bisher keine Klagen von Serverbetreibern gab, liegt wohl einzig daran, daß der Bug erst mit der neuen Revision C0 "eingeführt" wurde. Ein Fix ist laut AMD geplant.
Interessant auch #58, welche einen Bug dokumentiert, der zu langen Latenzzeiten führen kann, wenn das System die CPU in den C1 (HALT) oder C2 (STOP) Modus schickt. AMD empfahl den BIOS-Programmierern deshalb, die Stromspar-Modi nicht zu nutzen (die Athlon/Athlon XP User kennen das ja, wenn auch aus anderen Gründen). Mit dem neuen C0-Stepping dagegen ist dieses Problem gefixt.
Alles in allem eine sehr interessante Lektüre für Technikfreaks. Der normale Anwender wird davon in der Regel - wie bei Intel auch - nichts mitbekommen, da die Workarounds normalerweise schon eingebaut sind, noch ehe der Ottonormal-User davon Wind bekommt. Der ECC-Fehler stellt hier eine Ausnahme dar. Mal sehen, was die nächsten Core-Revisionen so bringen...
Diesen Artikel bookmarken oder senden an ...
