App installieren
How to install the app on iOS
Follow along with the video below to see how to install our site as a web app on your home screen.
Anmerkung: This feature may not be available in some browsers.
Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
Verständnisfrage zum Memory Scrubbing
- Ersteller SPINA
- Erstellt am
SPINA
Grand Admiral Special
- Mitglied seit
- 07.12.2003
- Beiträge
- 18.122
- Renomée
- 985
- Mein Laptop
- Lenovo IdeaPad Gaming 3 (15ARH05-82EY003NGE)
- Prozessor
- AMD Ryzen 7 3700X
- Mainboard
- ASUS PRIME X370-PRO
- Kühlung
- AMD Wraith Prism
- Speicher
- 2x Micron 32GB PC4-25600E (MTA18ASF4G72AZ-3G2R)
- Grafikprozessor
- Sapphire Pulse Radeon RX 7600 8GB
- Display
- LG Electronics 27UD58P-B
- SSD
- Samsung 980 PRO (MZ-V8P1T0CW)
- HDD
- 2x Samsung 870 QVO (MZ-77Q2T0BW)
- Optisches Laufwerk
- HL Data Storage BH16NS55
- Gehäuse
- Lian Li PC-7NB
- Netzteil
- Seasonic PRIME Gold 650W
- Betriebssystem
- Debian 12.x (x86-64)
- Verschiedenes
- ASUS TPM-M R2.0
Benötige ich Memory Scrubbing (als Redirect oder Background), damit ECC vollfunktionsfähig ist und mehr als Parity angewandt wird?
Irgendwie sind die Quellen, die man so bei Tecchannel, Wikipedia und so weiter findet, in dem Punkt nicht ganz eindeutig.
Mir reicht eigentlich simples ECC. Ich brauche kein ChipKill und andere Finessen. Aber ich möchte schon eine Fehlerkorrektur haben.
Also es soll nicht nur Fehler erkannt und gemeldet werden, sondern sie sollen auch gleich (wenn möglich) behoben werden.
Wie kann ich sicherstellen (ohne Pins an den DIMMs abzukleben), dass mein Speicher auch genauso arbeitet?
Prozessor ist ein AMD Phenom X4 9550 auf einem ASUS M3N72-D mit Kingston KVR800D2E6K4/8G.
Irgendwie sind die Quellen, die man so bei Tecchannel, Wikipedia und so weiter findet, in dem Punkt nicht ganz eindeutig.
Mir reicht eigentlich simples ECC. Ich brauche kein ChipKill und andere Finessen. Aber ich möchte schon eine Fehlerkorrektur haben.
Also es soll nicht nur Fehler erkannt und gemeldet werden, sondern sie sollen auch gleich (wenn möglich) behoben werden.
Wie kann ich sicherstellen (ohne Pins an den DIMMs abzukleben), dass mein Speicher auch genauso arbeitet?
Prozessor ist ein AMD Phenom X4 9550 auf einem ASUS M3N72-D mit Kingston KVR800D2E6K4/8G.
SPINA
Grand Admiral Special
- Mitglied seit
- 07.12.2003
- Beiträge
- 18.122
- Renomée
- 985
- Mein Laptop
- Lenovo IdeaPad Gaming 3 (15ARH05-82EY003NGE)
- Prozessor
- AMD Ryzen 7 3700X
- Mainboard
- ASUS PRIME X370-PRO
- Kühlung
- AMD Wraith Prism
- Speicher
- 2x Micron 32GB PC4-25600E (MTA18ASF4G72AZ-3G2R)
- Grafikprozessor
- Sapphire Pulse Radeon RX 7600 8GB
- Display
- LG Electronics 27UD58P-B
- SSD
- Samsung 980 PRO (MZ-V8P1T0CW)
- HDD
- 2x Samsung 870 QVO (MZ-77Q2T0BW)
- Optisches Laufwerk
- HL Data Storage BH16NS55
- Gehäuse
- Lian Li PC-7NB
- Netzteil
- Seasonic PRIME Gold 650W
- Betriebssystem
- Debian 12.x (x86-64)
- Verschiedenes
- ASUS TPM-M R2.0
Ich habe gerade herausgefunden, dass ChipKill doch möglich ist. Dafür muss man nur von Unganged auf Ganged umstellen. Warum auch immer.
Nun kann ich mich nur nicht entscheiden, ob mir Unganged oder ChipKill wichtiger ist. Da ich viele multithreaded Anwendungen nutze, wohl Unganged.
Und dann bleibt noch die Frage danach, wie wichtig das Scrubbing ist. Also mein L1 und L2 Cache wird gescrubt. L3 Cache und DRAM dagegen nicht.
Also wie ich es bisher verstanden habe ist Memory Scrubbing ein fortlaufender Test, aber welche Auswirkungen der Verzicht hat, ist mir noch unklar.
Denn wenn die Fehlerkorrektur bei jeder E/A-Operation greift, dann frage ich mich wieso es überhaupt so etwas wie Scrub Redirect gibt.
Bei den Workstation Boards, die ich kenne, wählt man einfach Basic, Super,... und das wars. Da war ECC bisher immer viel feiner zu konfigurieren.
Ich frage nur, weil ich hier mit dem M3N72-D ein normales Desktop Board habe. Da macht man sich mehr Gedanken über die korrekte Implementierung.
Nun kann ich mich nur nicht entscheiden, ob mir Unganged oder ChipKill wichtiger ist. Da ich viele multithreaded Anwendungen nutze, wohl Unganged.
Und dann bleibt noch die Frage danach, wie wichtig das Scrubbing ist. Also mein L1 und L2 Cache wird gescrubt. L3 Cache und DRAM dagegen nicht.
Also wie ich es bisher verstanden habe ist Memory Scrubbing ein fortlaufender Test, aber welche Auswirkungen der Verzicht hat, ist mir noch unklar.
Denn wenn die Fehlerkorrektur bei jeder E/A-Operation greift, dann frage ich mich wieso es überhaupt so etwas wie Scrub Redirect gibt.
Bei den Workstation Boards, die ich kenne, wählt man einfach Basic, Super,... und das wars. Da war ECC bisher immer viel feiner zu konfigurieren.
Ich frage nur, weil ich hier mit dem M3N72-D ein normales Desktop Board habe. Da macht man sich mehr Gedanken über die korrekte Implementierung.
Zuletzt bearbeitet:
- Mitglied seit
- 18.11.2008
- Beiträge
- 11.404
- Renomée
- 724
- Standort
- 8685x <><
- Aktuelle Projekte
- Spinhenge; Orbit; Milkyway
- Lieblingsprojekt
- Orbit@home; Milkyway@home
- Meine Systeme
- Tuban, 3,8~ Ghz x6 /Turbo 4,095GHz 2x Radeon HD 5850@5870 CFx. // Rechner 2: 5900x B02 //3= 9850 /4 = Rasp
- BOINC-Statistiken
- Mein Desktopsystem
- 5900xt (bis 5,2Ghz); 3900x; Thuban 1090x
- Mein Laptop
- P-
- Prozessor
- siehe oben. alles Lukü mit max Anzahl ausgesuchter sehr starker Lüfter. (Rechner 3 = R 9 3900x
- Mainboard
- Asus MSI b 550 Tomahawk/; M4A79Deluxe für Thuban / MSI b 550 Tomahawk für R 9
- Kühlung
- ausgesklügelte Luftkühlung mit starkem Airflow
- Speicher
- vollbelegung
- Grafikprozessor
- Midrange oc 12GB /8 GB / 3GB
- Display
- 2x 22" |(Benq; LG) und 1x 23,6" Samsung TFTs Eyefinity
- SSD
- 3x
- HDD
- (Tower voll!)
- Optisches Laufwerk
- Asus SATA-DVD RW
- Soundkarte
- o.b.
- Gehäuse
- ANTEC Twelfehundred 11 Lüfter regelbar(ohne Grakas)11 Laufwerke total / be Q für R 9
- Netzteil
- Tagan 900W 82+ [CF-ready] 2xCF-Volllast ~620W // System 1: 650Watt bronce
- Tastatur
- ja
- Maus
- ja
- Betriebssystem
- Win 7 V 64 / alternativ
- Webbrowser
- Opera &/ IEE64/ &Safari
- Verschiedenes
- Thuban: |V-CoreCPU =1,23- 1,47V Turbo//norm. VID= 1,45V System läuft mit 4 Upgrades seit 2008 stabil!
und wenn du mal mit nem kompetenten Ma. von Asus sprichst?
DU findest sicher schnell heraus, ob er auch kompetent ist...
so würde ich das machen.
DU findest sicher schnell heraus, ob er auch kompetent ist...
so würde ich das machen.
SPINA
Grand Admiral Special
- Mitglied seit
- 07.12.2003
- Beiträge
- 18.122
- Renomée
- 985
- Mein Laptop
- Lenovo IdeaPad Gaming 3 (15ARH05-82EY003NGE)
- Prozessor
- AMD Ryzen 7 3700X
- Mainboard
- ASUS PRIME X370-PRO
- Kühlung
- AMD Wraith Prism
- Speicher
- 2x Micron 32GB PC4-25600E (MTA18ASF4G72AZ-3G2R)
- Grafikprozessor
- Sapphire Pulse Radeon RX 7600 8GB
- Display
- LG Electronics 27UD58P-B
- SSD
- Samsung 980 PRO (MZ-V8P1T0CW)
- HDD
- 2x Samsung 870 QVO (MZ-77Q2T0BW)
- Optisches Laufwerk
- HL Data Storage BH16NS55
- Gehäuse
- Lian Li PC-7NB
- Netzteil
- Seasonic PRIME Gold 650W
- Betriebssystem
- Debian 12.x (x86-64)
- Verschiedenes
- ASUS TPM-M R2.0
Da habe ich noch was gefunden (AMD macht es aber auch spannend):
Mein Phenom X4 (B3) unterstützt nur eine Symbol Size von x4. Bei den verwendeten x8 DIMMs gibt es somit kein ChipKill.
Oder allenfalls nur ein "ChipKill-Lite" auf Standard ECC Niveau. Anders sähe es mit einem Phenom II X6 (E0) aus.
Zumindest steigert es die Erkennbarkeit von 2-Bit Fehlern von 99,5% auf 100%. Aber eine Korrektur ist weiter nicht möglich.
Bleibt nur die Frage, wieso das Status Register (ChipKillECCEn) meiner CPU jetzt meldet, der x4-Mode wäre aktiv.
Ergänzung: In einem älteren BIOS & Kernel Developer Guide stand es noch einmal etwas deutlicher:
Jedenfalls bei den meist verwendeten 128M x 8-bit (bei 2GB UDIMMs) oder 256M x 8-Bit (bei 4GB UDIMMs) Chips.
Erst der Thuban würde die nötige x8 Symbol Size mitbringen, um die zur Verfügung stehende DRAM Width abzudecken.
Deswegen kann man also beim Agena und Deneb getrost bei Unganged bleiben und hat dadurch keine Nachteile.
Eigentlich ein ziemlicher Lapsus seitens AMD. Beim Barcelona und Shanghai ist das schon ein gewichtiger Nachteil.
Zwar gibt es hochkapazitive x4 RDIMMs, aber da wäre immer noch die geringere NUMA Effizienz durch Ganged.
Mein Phenom X4 (B3) unterstützt nur eine Symbol Size von x4. Bei den verwendeten x8 DIMMs gibt es somit kein ChipKill.
Oder allenfalls nur ein "ChipKill-Lite" auf Standard ECC Niveau. Anders sähe es mit einem Phenom II X6 (E0) aus.
Zumindest steigert es die Erkennbarkeit von 2-Bit Fehlern von 99,5% auf 100%. Aber eine Korrektur ist weiter nicht möglich.
Bleibt nur die Frage, wieso das Status Register (ChipKillECCEn) meiner CPU jetzt meldet, der x4-Mode wäre aktiv.
Übrigens sehe ich gerade, dass das was AMD oben in der Tabelle als ChipKill bezeichnet, gar kein ChipKill ist.
AMD spricht dort nur von der Behebbarkeit von 1-Bit Fehlern. Das beherrscht selbst Standard ECC-RAM.
ChipKill sollte aber in der Lage sein bis zu 4-Bit (!) Fehler zu beheben und bis zu 8-Bit (!) Fehler zu erkennen.
Aber scheinbar stellt AMD lediglich auf die Ausgleichbarkeit des Defekts einzelner DRAM Chips ab.
AMD spricht dort nur von der Behebbarkeit von 1-Bit Fehlern. Das beherrscht selbst Standard ECC-RAM.
ChipKill sollte aber in der Lage sein bis zu 4-Bit (!) Fehler zu beheben und bis zu 8-Bit (!) Fehler zu erkennen.
Aber scheinbar stellt AMD lediglich auf die Ausgleichbarkeit des Defekts einzelner DRAM Chips ab.
Das heißt ChipKill ist beim Agena und Deneb nur eingeschränkt mit den zur Zeit gängigen Unbuffered Modulen möglich.In certain configurations, the ECC provides “chipkill” functionality; all single symbol errors caused by a failed DRAM device are corrected.
Chipkill recovery is only possible when indicated in F3x44[ChipKillEccEn], and requires a symbol size greater than or equal to the DRAM device width.
When a DRAM device fails, the code is able to correct the entire lost symbol, as long as there are no other symbols with errors.
In cases where the symbol size is smaller than the DRAM device width, DRAM device failures result in multiple symbol errors, and cannot be corrected.
Jedenfalls bei den meist verwendeten 128M x 8-bit (bei 2GB UDIMMs) oder 256M x 8-Bit (bei 4GB UDIMMs) Chips.
Erst der Thuban würde die nötige x8 Symbol Size mitbringen, um die zur Verfügung stehende DRAM Width abzudecken.
Deswegen kann man also beim Agena und Deneb getrost bei Unganged bleiben und hat dadurch keine Nachteile.
Eigentlich ein ziemlicher Lapsus seitens AMD. Beim Barcelona und Shanghai ist das schon ein gewichtiger Nachteil.
Zwar gibt es hochkapazitive x4 RDIMMs, aber da wäre immer noch die geringere NUMA Effizienz durch Ganged.
Zuletzt bearbeitet:
larsbo
Grand Admiral Special
- Mitglied seit
- 20.06.2003
- Beiträge
- 5.864
- Renomée
- 62
- Prozessor
- Ryzen 5 3400G
- Mainboard
- Gigabyte B450I Aorus pro Wifi
- Kühlung
- Noctua NH-L9a
- Speicher
- 32 GB, 2x ADATA 16GB single rank PC4-3200 1,2V (Samsung 16Gbit 2666-Chips)
- Grafikprozessor
- APU
- SSD
- Samsung 970Pro 1TB NVMe PCIe3
- Optisches Laufwerk
- Pioneer BD-RE slim-line
- Soundkarte
- on-board
- Gehäuse
- SilverStone ML08-H
- Netzteil
- Corsair SF450 (80PlusGold)
- Betriebssystem
- Win10pro 64
Also um doch nochmal auf die ursprüngliche Frage nach dem memory scrubbing zurückzukommen:
So wie ich das verstehe, wird beim scrubbing im Hintergrund nach und nach jede Speicheradresse abgefahren und geprüft, obs nen ECC Fehler gibt bei Zugriff oder nicht. Das kann wohl mit unterschiedlicher Priorität und Intensität erfolgen, was die in so manchem Bios reichhaltigen und leider nur kryptisch beschriebenen Optionen erklärt. Grundsätzlich sollte ECC aber auch ohne scrubbing funktionieren und das tun, was es soll, nämlich bei jedem Schreiben die Paritäts bzw. ECC-Zusatzbits mitschreiben und beim Lesen vergleichen, ob das immer noch passt. Mindestens single-bit Fehler werden dann auch korrigiert. So wie ich das sehe, machen die Asus-Desktop-Boards das still und heimlich. Vermutlich muss man die entsprechenden MSRs auslesen, wenn man wissen will, ob ein Bit faul ist und dauernd korrigiert wird.
Zum Chipkill, finde ich jetzt nicht sooo einen großen Lapsus. In Servern dürften in der Tat meist buffered dimms mit x4 chips stecken, da wird der Chipfehler ja immerhin dann sicher erkannt auch im unganged mode. Muss dann halt reichen, dass das System dann stehen bleibt und sich nicht weiter verrechnet.
Im Desktop/Workstation würde ich nie auf unganged verzichten. Ich denke, mit normalem ECC sind wir da wunderbar unterwegs.....
So wie ich das verstehe, wird beim scrubbing im Hintergrund nach und nach jede Speicheradresse abgefahren und geprüft, obs nen ECC Fehler gibt bei Zugriff oder nicht. Das kann wohl mit unterschiedlicher Priorität und Intensität erfolgen, was die in so manchem Bios reichhaltigen und leider nur kryptisch beschriebenen Optionen erklärt. Grundsätzlich sollte ECC aber auch ohne scrubbing funktionieren und das tun, was es soll, nämlich bei jedem Schreiben die Paritäts bzw. ECC-Zusatzbits mitschreiben und beim Lesen vergleichen, ob das immer noch passt. Mindestens single-bit Fehler werden dann auch korrigiert. So wie ich das sehe, machen die Asus-Desktop-Boards das still und heimlich. Vermutlich muss man die entsprechenden MSRs auslesen, wenn man wissen will, ob ein Bit faul ist und dauernd korrigiert wird.
Zum Chipkill, finde ich jetzt nicht sooo einen großen Lapsus. In Servern dürften in der Tat meist buffered dimms mit x4 chips stecken, da wird der Chipfehler ja immerhin dann sicher erkannt auch im unganged mode. Muss dann halt reichen, dass das System dann stehen bleibt und sich nicht weiter verrechnet.
Im Desktop/Workstation würde ich nie auf unganged verzichten. Ich denke, mit normalem ECC sind wir da wunderbar unterwegs.....