Vorsicht vor Samsung HD501LJ Festplatten im Raid-Betrieb

Nero24

Administrator
Teammitglied
Mitglied seit
01.07.2000
Beiträge
24.066
Renomée
10.446
  • BOINC Pentathlon 2019
  • BOINC Pentathlon 2020
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2021
Hallo liebe Gemeinde,

anfang des Jahres 2008 habe ich einem Kunden ein AMD-System verkauft: Athlon X2 BE-2400, nForce520 Mainboard und weil es in sein Anwendungsgebiet passt 2 Samsung HD501LJ T166 500 GB Festplatten im Raid-0 statt einer einzelnen TB-Festplatte. Das System hat all meine Stabilitätstests überstanden vor der Auslieferung. So weit, so gut.

Vor ein paar Wochen jedoch meldete sich der Kunde bei mir, dass das System im SysTray sporadisch Raid-Fehler meldet:

attachment.php


Ferner war das Windows System-Eventlog voll von Fehlermeldungen vom NV-Raid-Controller und vom System bzgl. Datenträger:
- NVRAIDSERVICE: Schwerer Zugriffsfehler auf SAMSUNG HD501LJ (Port 1.0)
- Das Gerät \Device\SCSI\nvgts hat innerhalb der Fehlerwartezeit nicht geantwortet
- als Folge davon etliche 'disk' Fehler

Um irgendwelche Larifari-Fehler auszuschließen wies ich ihn an (nach einer ausführlichen Datensicherung) die Ports für die Platten auf dem Board zu tauschen und im BIOS umzustellen, sowie einen Oberflächentest des Arrays zu veranlassen. Der Test durch ChkDsk war fehlerfrei, die sporadischen Raid-Fehler jedoch blieben :(

Also holte ich das System zwecks Gewährleistung zu mir, um das Phänomen zu untersuchen. Ich löste das Raid auf, um die Platten einzeln mit dem Samsung ESTool zu überprüfen. Dabei stellte sich heraus, dass die Platten für sich völlig fehlerfrei waren, sowohl via SMART, als auch bei der ausführlichen LBA-Diagnose. Ergo sind die Fehler auf den Raid-Betrieb einzugrenzen.

Grundsätzlich hat der SATA-Controller sowohl des NVIDIA nForce520 Chipsatzes im allgemeinen, als auch das Board MSI K9N Neo V2 im speziellen, das ich schon mehrfach auch mit Raid-0 verkauft habe, bisher keine Probleme bereitet mit Raid. Allerdings habe ich bisher immer Seagate Barracuda 7200.10 Platten dafür verwenden, keine Samsungs. Ergo beschloss ich die Fehlersuche auf Raid in Kombination mit der Samsung HD501LJ zu beschränken - und wurde fündig.

Anscheinend ist das Problem bei diesen Platten bekannt. In mehreren Threads im Web stolperte ich über ein "urgent" Firmware-Update mit der Nummer CR 100 13 für die HD501LJ - datiert auf Ende März 2008 (also dummerweise nach der Auslieferung des Systems) - das ein Problem mit dieser Platte im Raid-Betrieb beheben soll:
This firmware update corrects a feature that inadvertently causes "RAID degraded" messages on supported platforms. This firmware will update the Samsung 320GB HD321KJ DP/N (CW026) to firmware CP100-13. This firmware will update the Samsung 500GB HD501LJ DP/N (DN133) to firmware CR100-13.
Was mich jedoch irritierte war die Tatsache, dass dieses Firmware-Update nirgendwo auf den Webseiten von Samsung zu finden ist, sondern lediglich über Dell (!) bezogen werden kann:
http://support.euro.dell.com/suppor...1&impid=-1&formatcnt=2&libid=41&fileid=246131

Ich habe das Firmware Update daraufhin auf die beiden Platten geflasht. War etwas tricky, da das Board nach dem Flash das Array als fehlerhaft meldete :o Ich musste ins Raid-BIOS und das Stripeset neu anlegen (die Frage nach dem Löschen der Platten natürlich unbedingt mit "N" beantworten). Anschließend war das Raid-0 zum Glück wieder voll da. :) Seitdem ist bei den zwei-tägigen Tests der Fehler auch nicht mehr aufgetreten, was aber noch nichts heißen muss, da das System auch bisher teils über Tage hinweg problemlos gelaufen ist, hin und wieder jedoch auch mehrmals täglich mit diesem Problem "daher kam".

Ich habe daher heute eine Support-Anfrage an Samsung gestellt, das Problem beschrieben und auch die Vermutung mit Hinweis auf die zahlreichen Threads im Internet geäußert, dass es an der Firmware liegen könnte, um a.) die Supportler ein wenig aus der Reserve zu locken und b.) vielleicht weitere Hinweise auf die mögliche Ursache zu erhalten. Die erste Antwort darauf fiel jedoch wie erwartet aus: Kabel checken, Ports wechseln und eine Frage wie oft bzw. ab wann die Fehler aufgetreten seien. Kein Sterbenswort über das Firmware-Update. Da frag ich mich schon, was das soll?! *noahnung* :[

Ich habe jetzt noch einmal eine Antwort geschrieben und einige Sachen nochmal präzisiert. Wenn jetzt wieder nicht auf das vorhandene Firmware-Update eingegangen bzw. es verschwiegen wird (zusätzlich dazu, dass es bei Samsung auch nirgendwo zum Download angeboten wird), dann laust mich der Affe :( :[ *zweifel* *motz*
 
stellt sich die frage ob das nur speziell bei dieser Platte passiert aber gut zu wissen das ich mir keine 2.te Platte besorgen muss ...
 
Misteriös, kann ja wirklich nur an der Firmware dann wohl liegen bzw. generell an der Platte.

Sehe ich das richtig, daß die Firmware für gleich zwei Platten verwendet werden soll?

Gibts da vielleicht auch Probleme mit SATA1 und SATA2-Modi..?
 
Grundsätzlich hat der SATA-Controller des NVIDIA nForce520 Chipsatzes (...) bisher keine Probleme bereitet mit Raid.
Bei des Festplatten der Diamond Max 10 Serie von Maxtor kam es damals auch nur zu einem Datenverlust im Zusammenspiel mit dem nVidia nForce 4. Nicht bei anderen Chipsätzen.

Als Erinnerungsstütze: http://www.computerbase.de/news/har...2005/dezember/sata-ii-platten_nforce4-boards/

Also ist nicht gesagt, dass die Samsung SpinPoint HD501LJ die Alleinschuldige ist, aber ich kann es mir bei Samsung durchaus vorstellen. Dieser Hersteller muss unbedingt mehr bei der Qualitätssicherung tun.
 
nero24

ich habe ein ganz ähnliches thema wie du.

betreibe 2 samsung hd501lj 500 gb 7200 an einem gigaybate ga-ep35-ds3p in RAID 1 unter xp home sp3 undtel matrix storage manager 8.x.

das System ist instabil. im gegensatz zu deinem kunden bekomme ich keine raid fehler gemeldet, sondern manchmal nach der windows anmeldung den bluescreen, oder seltener findet windows die platte gar nicht mehr. habe den fehler ebenfalls auf RAID eingegrenzt.

verstehe ich dich richtig dass du firmware update aufgeflasht hast, ohne das RAID aufzulösen? dass dabei die daten im RAID voll erhalten geblieben sind? ich würde gerne eine komplette neuinstallation vermeiden...

danke und gruß
garry



. ist die anmeldung erstmal erfolgreich, ist das System dagegen stundenlang stabil und schafft zB auch ein plattenimage.
- seltener findet windows beim booten auch die platte gar nicht. dann muss ich von cd booten, den raid treiber einspielen und auf die platte, um von dort einen warmstart zu machen.
- nach bluescreen hat das System auch schon mehrfach den sync der platten verloren und raid 1 erst wieder herstellen müssen.
 
also ich hab 3 Stück davon laufen, allerdings nicht im Raid und absolut keine Probleme...

Raid hab ich allerdings noch nicht getestet, könnte durchaus sein dass auch ich damit Probleme bekomme..

Was mich interessieren würde, ob das Firmware Update auch so was bringt (im Bezug auf Performance und Stabilität) oder nur den Raid Fehler fixed?
 
verstehe ich dich richtig dass du firmware update aufgeflasht hast, ohne das RAID aufzulösen?
Nicht direkt! Beim NVIDIA nForce Raid-"Controller" musst Du das Raid nicht explizit auflösen, sondern nur im BIOS den SATA-Mode von "Raid" auf "IDE" schalten. Das löst das Raid nicht auf Platten-Ebene auf, sondern lediglich auf BIOS-Ebene. Die Platten werden dann wieder wie zwei einzelne IDE-Platten behandelt. Natürlich kann man so weder von Festplatte booten, noch sonst irgendwas davon lesen. Aber das braucht's ja auch nicht. Hauptsache das Flash-Tool findet die Platten einzeln. Ich habe zuerst HDD2 abgeklemmt, um HDD1 zu flashen, anschließend HDD1 abgeklemmt, um HDD2 zu flashen. Anschließend hab ich wieder beide angesteckt, den SATA-Mode wieder von IDE auf Raid gesetzt und die entsprechenden Ports, wo die beiden Platten angeschlossen sind, wieder auf Raid "Enabled" gesetzt. Allerdings musste ich anschließend im separaten Raid-BIOS das Raid-0 wieder neu anlegen, weil eine der beiden Platten offenbar "vergessen" hatte, dass sie zu einem Raid gehört. Danach war das Raid-0 wieder "Healthy" und ich konnte sofort wieder vom Stripeset booten.
Wie das beim Intel-Raid aussieht, kann ich Dir natürlich nicht sagen *noahnung*
Was mich interessieren würde, ob das Firmware Update auch so was bringt (im Bezug auf Performance und Stabilität) oder nur den Raid Fehler fixed?
Was ich bisher dazu gelesen habe, ist das Firmware-Update ausschließlich für den Raid-Betrieb relevant, sonst nicht.
 
Ich weiß, das hilft in diesem Fall nichts mehr, aber wozu hat Western Digital RAID-Edition Festplatten? Für den RAID-Betrieb gibt es nichts Besseres!

Reguläre SATA/IDE Platten für RAID zu verwenden hat bei mir und der Firma meines Vaters häufig zu Arrayausfällen geführt, obwohl die Platten selbst meistens nichts hatten.

Die WD RE Platten sind für 24/7 Betrieb gebaut, haben 5 Jahre Garantie und bewahren den RAID-Controller vor solchen Situationen. Wer stromsparend und leise unterwegs sein will (war wohl das Argument auf Samsung umzusteigen?), greift dann zu den WD RE GP (GreenPower) Platten.

Das sind wirklich 1A-Produkte!
 
Zurück
Oben Unten