ECC Speicher

Allfred

Grand Admiral Special
Mitglied seit
11.11.2001
Beiträge
7.874
Renomée
98
Standort
Tyskland
Ich habe auf einem ASUS M4N78-VM ECC Speicher. Welche dieser vielen eskalierenden Attribute soll ich sinniger Weise setzen? Ich kann auch unter "Super"-ECC einen Timing Parameter setzen - da ich keine Ahnung habe, wählte ich etwas aus dem Mittelfeld: 320ns.

Was habe ich da gemacht? Gibts irgendwo HowTo für ECC? Wird ein ECC Error irgendo geloggt?
 
Sprich eine Auto-Option hat das Board nicht, um dem Ram optimal einzustellen ?
 
Nein, nur 4 oder 5 eskalierende Attribute. Vorletztes was "Super" (was etwas von AUTO suggerierte) und danach Max. Im Helptext dazu stand etwas von 8 Stunden...
 
Puhh dann kann ich dir auch nicht wirklich helfen, die letzten Parameter der Art fand ich auf einem Asus K8V-SE Deluxe das zwar DDR-1 aber recht viele ECC-Optionen im Bios integriert hatte. Mal unabhägig vom nutzen, da Reg Ram eh net läuft, und ECC Module mit Chipkill dürften nicht billig sein. Multibitfehler korrigieren zu können, ist im heutigen Servern Std.
 
Zuletzt bearbeitet:
Hallo

"wenn ich das bei mir richtig mit dem ECC geblickt habe das schrubbt die kiste alle 8h den RAM durch. "Bei mir ist Basic eingestellt.
Habe aber keinen Asus Unterbau sondern Tyan. Bin mir nicht sicher ob ECC Fehler überhaupt vom Board geloggt werden.Bei mir stand jedenfalls noch nie was drinnen.
 
könnte mir vorstellen, das windows das in der ereignisanzeige loggt. unter linux tauchen solche meldungen jedenfalls im kernellog auf.
 
Schade, daß es keinen Screenshot im BIOS gibt...

Also unter Advanced - Chipset - Northbridge - ECC gibts:

ECC Mode [Disabled/Basic/Good/Super/Max]
"The Super ECC Mode dynamically sets the DRAM Scrub rate so all of memory is scrubbed in 8 hours"

DRAM ECC Enabled [Enabled]
DRAM SCRUB REDIRECT [Enabled]
4-bit ECC Mode [Enabled]
DRAM BG Scrub [320ns]
Data Cache BG Scrub [Disabled]
L2 Cache BG Scrub [Disabled]
L2 Cache BG Scrub [Disabled]

Übrigens, wenn ich EC Mode [Max] wähle sind die Voreinstellungen für
Data Cache BG Scrub [Enabled]
L2 Cache BG Scrub [Enabled]
L2 Cache BG Scrub [Enabled]

====> und der WinRAR Stresstest läuft 5% schneller :-X
 
Hi, sorry das ich den Thread ausgrabe, aber er passt so schön...
Habe hier ein ASUS M4A77D mit Opteron 1352 und Samsung ECC RAM. Will natürlich das ECC richtig einstellen.

Wisst ihr mittlerweile mehr?
Werden eigentlich die 72-Bit-Datenleitungen für Nutzdaten statt Korrekturen benutzt, wenn man ECC deaktiviert und ECC-RAM hat? (Ihr wisst sicher was ich meine)
 
Ich bin mir nicht 100% sicher, aber aus ungenutzten ECC Leitungen werden keine Datenleitungen: Will sagen, es bleibt ein normales 64bit Speicherinterphase. Der Rest sind explizite ECC Leitungen.
 
Wie hast denn Du jetzt dein ECC eingestellt?
Bin jetzt nicht sicher ob [Basic/Good/Super/Max] (Disabled wirds nicht)

Gibts ein FAQ von ASUS dazu?
 
Ich würde alle ECC-Features aktivieren. Wenn ich schon Geld ausgebe für ECC-RAM, dann auch bitte die volle Dröhnung. Sollten dabei ein paar Prozent Leistung draufgehen - was soll's? :)
 
====> wird der WinRAR Stresstest 5% schneller :-X
Darauf würde ich nicht allzuviel geben. Der WinRAR Benchmark schwank sowieso enorm, je nachdem wie kurz nach einem Reboot er gestartet wurde, wie oft er schon gestartet wurde, etc. Einfach mal mit dem integrierten Benchmark von 7-zip gegentesten, und es wird sich als Sturm im Wasserglas herausstellen ;)
 
Ich würde alle ECC-Features aktivieren. Wenn ich schon Geld ausgebe für ECC-RAM, dann auch bitte die volle Dröhnung. Sollten dabei ein paar Prozent Leistung draufgehen - was soll's? :)

Naja, es können eh nur Single-Bit-Fehler korrigiert werden...von daher.
Richtiges ECC wie in nem Server mit Registered RAM ist es ja nicht.
 
Naja, es können eh nur Single-Bit-Fehler korrigiert werden...von daher.
Richtiges ECC wie in nem Server mit Registered RAM ist es ja nicht.

ECC hat mit registered gar nichts zu tun. Es ist schon das selbe wie im Server. Ja, ECC kann nur 1-Bit Fehler korrigieren und 2-Bit Fehler erkennen. Das sollte aber schon für die meisten Fälle ausreichen, da selbst 1-Bit Fehler sehr selten sind. Es ist ja auch nur eine zusätzliche Absicherung, dass wenn so ein Fehler auftritt, er nicht gleich großen Schaden anrichtet.
 
Ob man nun Scrubbing braucht, muss jeder für sich selbst ausmachen. Eigentlich ist es nicht zwingend erforderlich.
Bitfehler werden zwar schneller erkannt, aber ohne Schrubbing fällt ebenfalls kein (1-Bit) Fehler durch das Raster.

Nur wird der Fehler dann erst beim Auslesen der Speicherzelle gefunden und nicht schon bei einem der "Wartungszyklen".
So kann der Administrator schneller reagieren und das fehlerhafte Modul (bei einer Häufung der Fehler) früher austauschen.

In der Voreinstellung des BIOS ist Scrubbing übrigens oft deaktiviert, weil es den Idle Stromverbrauch in die Höhe treibt.
Je nach Prozessor macht das schon ziemlich viel aus. Tiefere C-States werden jedenfalls nicht mehr eingenommen.

ChipKill braucht man übrigens bei keinem AMD Prozessor kleiner als ein Phenom II X6 im E0 Stepping zu aktivieren.
Erst dieser Prozessor bringt die nötige Symbol Size für die (auf dem Desktop) bei Unbuffered DIMMs üblichen x8 Chips mit.
 
Also ich kann bei mir nur von Easy bis Super und User einstellen, unter User kann ich dann ECC aber nur an oder aus schalten, keine Ahnung was ich da jetzt so wirklich einstellen soll, weder die Performance noch noch die runtertaktung hat sich jetzt verändert.
 
Das ist schon richtig am Takt der CPU Cores ändern sich auch nichts. Cool 'n' Quiet und so weiter klappt auch mit Scrubbing.
Aber für den IMC spielt es eine große Rolle, ob er nur Refresh Cycles fährt oder fortwährend Paritätsdaten berechnen muss.

Es betrifft also in erster Linie den Uncore Bereich. Es sei denn du aktivierst auch noch das Scrubbing von L1 und L2 Cache.
Dann wird die gesamte CPU beansprucht. Das könnte dann sogar dauerhaft den C1E State und so weiter unterbinden.

Nimm einfach - wenn vorhanden - ein Energiekostenmessgerät zur Hand. Dann siehst du wieviel es bei dir konkret ausmacht.
Und wie gesagt: Durch DRAM Scrubbing werden nicht mehr Fehler erkannt oder behoben. Dies erfolgt nur zeitnäher.
 
Das ist schon richtig am Takt der CPU Cores ändern sich auch nichts. Cool 'n' Quiet und so weiter klappt auch mit Scrubbing.
Aber für den IMC spielt es eine große Rolle, ob er nur Refresh Cycles fährt oder fortwährend Paritätsdaten berechnen muss.

Es betrifft also in erster Linie den Uncore Bereich. Es sei denn du aktivierst auch noch das Scrubbing von L1 und L2 Cache.
Dann wird die gesamte CPU beansprucht. Das könnte dann sogar dauerhaft den C1E State und so weiter unterbinden.

Okay, das habe ich verstanden

So kann ich ja eigentlich Super (was wohl der Beste Modus zu sein scheint) aktiviert lassen und mich freuen, bzw, brauche zumindest keine Negativ veränderung zu erwarten.

Und wie gesagt: Durch DRAM Scrubbing werden nicht mehr Fehler erkannt oder behoben. Dies erfolgt nur zeitnäher.

Ein paar fragen dazu,

1. Was genau ist DRAM Scrubbing ? (Höre ich jetzt von die das erste mal zusammen mit ECC, Wiki hilft mir da auch irgendwie nicht.
2. Aktiviere ich dieses Scrubbing in meinem falle durch das einstellen von Basic - Super und im User Mode ist es aus ?
 
1. Was genau ist DRAM Scrubbing ?
Also bei ECC-RAM werden beim Schreiben einer Speicherzelle vom Memory Controller so genannte Paritätsdaten berechnet. Diese werden im zusätzlichen neunten DRAM Chip abgelegt. Dadurch wächst der Datenbus von 64 auf 72 Bit an. Obwohl es sich genau genommen nicht mehr um Paritätsdaten im engeren Sinne handelt. Früher wurde nur erfasst ob die Summe aller Speicherzellen einer Spalte einen geraden oder ungeraden Wert ergeben. Heute ist das ganze etwas komplexer. Aber das zu erörtern führt jetzt zu weit und ist wohl auch je nach CPU Hersteller verschieden. Für gewöhnlich werden die Paritätsdaten dann jedenfalls erst beim Lesen der Speicherzelle abgerufen. Also wenn die Daten vom Betriebssystem angefordert werden. Beim DRAM Scrubbing dagegen checkt der Memory Controller auf Anweisung des Mainboards fortwährend alle Speicherzellen nach einem festen Muster durch und erkennt so einen Speicherfehler bevor die Speicherzelle überhaupt regulär abgefragt werden würde und behebt ihn. Ein defektes Modul (zu erkennen an der Häufung von Fehlern) taucht damit zeitlich eher im Error Log auf. Aber auch bei deaktiviertem Scrubbing würde der Fehler gefunden werden und nicht untergehen. Aber eben erst, wenn ein regulärer Zugriff auf die Speicherzelle erfolgt und nicht schon bei einem dieser - nennen wir es mal - Wartungszyklen. Scrubbing prüft also fortwährend den DRAM und auf Wunsch auch den L1/L2/L3 Cache.
 
Eines darf aber bei dynamischen RAM nicht vergessen werden: Jede Speicherzelle behält ihre Daten nur ein paar wenige µ-Sekunden bevor diese "vergessen" werden. Also frischt der Memorycontroller sowieso alle paar µ-Sekunden durch lesen und rückschreiben jede einzelne Zelle (vollkommen unabhängig ob von der CPU gebraucht oder nicht) den Speicherinhalt auf.

Die Frage ist nun, ob er diesen Automatismus mit ECC macht oder ohne.
 
Dies belastet die CPU jedoch kaum, wie man daran sieht, dass es im Suspend-to-RAM (ACPI S3) äußerst sparsam vor sich geht.
Dort allerdings mit reduzierter Versorgungsspannung. Für Refresh Cycles braucht es nur die so genannte "Erhaltungsspannung".

Auch im Betrieb benötigt es deutlich weniger Energie als "richtige" E/A-Operationen, für die vermutlich sogar der L3 Cache geweckt wird.
Für Refresh Cycles braucht jedenfalls der Memory Controller nicht in einem aktiven Zustand zu verharren. Siehe dazu: Klick*

*Kurzfassung: Die DDR3 Schnittstelle bei Intels Ivy Bridge ist power-gated und das wird man nicht nur für einige Mikrosekunden nutzen.
 
Zuletzt bearbeitet:
Und wie gesagt: Durch DRAM Scrubbing werden nicht mehr Fehler erkannt oder behoben. Dies erfolgt nur zeitnäher.
Durch die zeitnähere Korrektur lassen sich theoretisch größere Fehler verhindern. Fehler früher erkannt -> nur wenige Fehler -> noch korrigierbar. Fehler erst später erkannt -> mehr Zeit, dass mehr Fehler hinzu kommen -> nicht mehr korrigierbar.

Aber wenn man an dem Punkt angekommen ist, ist die Hardware eh ein Fall für den Schrott.
 
Das stimmt natürlich, aber wenn es zu einer solchen Häufung kommt, würde ich rasch den Geigerzähler und Strahlenschutzanzug hervorkramen. *buck*
 
Zurück
Oben Unten