Wie rausfinden warum Daten korrupt

ghostadmin

Grand Admiral Special
Mitglied seit
11.11.2001
Beiträge
25.208
Renomée
189
Standort
Dahoam Studios
Problem war das ein Server plötzlich nicht mehr ging. Eine Disk war noch lesbar, die andere überhaupt nicht. Wobei ich die Daten mit testdisk noch lesen konnte, also vielleicht hat nur der RAID controller die Disk "ausgeblendet".
Am Server leuchtete die Overheat LED und es war massig Staub drin.
Beim laden von Windows Setup ist immer der Installer abgestürzt wegen inaccessible disk.
RAID status war degraded.
Mir ist aufgefallen das beim booten manchmal eine Disk nicht angezeigt wurde.

Der Staub ist weg und ich habe einen Gehäuselüfter eingebaut. Die Platten sind nun wesentlich kühler.

Es ist Software RAID1 mit Intel onboard SATA und Win2003.

Windows neu installiert und man sieht 4 Eventlog Fehler ftdisk id 57 (kann Transactionlog nicht schreiben)

Disks sind WD RE 320GB SATA.
Der WD DLG Test sagt bei beiden sei kein Fehler.

Das seltsame ist, ich hatte die Platte von der man normal lesen konnte, mal in einem PC, da ist diese komplett ausgestiegen weil es wohl zu heiss wurde. Danach zeigte SMART einen pending sector. Jetzt steckt die Platte wieder im Server und die SMART Werte sind alle in Ordnung, DLG Test ebenfalls.

Kann es sein das die Disks bei zu hoher Temp zu spinnen anfangen?
Problem mit Kabel? Eigentlich lief das Ding vorher jahrelang aber ich glaube er wurde mal umgestellt.

Vor allem ist ja toll das diese ftdisk Fehler sehr selten auftreten.
 
Wurde ein Oberflächenscan durchgeführt bei beiden Platten, danach mit Nullen beschreiben?
 
Meist wird nach dem Schreiben der Null auch der korrekte Inhalt des Sektors geprüft, kann ggf noch versteckte Fehler finden.
Je nachdem wie heiß die Platten wurden, kann durchaus eine andere Komponente einen knacks abbekommen haben und nicht mehr in allen Bedingungen zuverlässig arbeiten.
Sind denn bei den Platten schon Reservesektoren zugewiesen worden ?
 
Server hat auch ECC-Ram?
 
Zurück
Oben Unten