Supermicro H11DSi Rev. 1.01 startet nach dem runterfahren nicht mehr

thorsam

Grand Admiral Special
Mitglied seit
05.04.2003
Beiträge
2.722
Renomée
890
Seit April 2018 habe ich per RMA 2x ein neues Board bekommen.
Beim dritten Mal kam das eingeschickte Board zurück, mit der Feststellung, dass mit dem Board alles in Ordnung sei.
Die Kopie vom beigefügten Reparaturbericht hat mich dann auf die Spur des Fehlers gebracht, der auch beliebig oft reproduzierbar ist.

Beschreibung des Problems:
Zusammenbau aller Komponenten. Einschalten des Netzteils. Power-LED auf dem Board leuchtet. Rechner startet durch.
Solange ich nur Neustarts ausführe, startet das System durch.
Fahre ich den Rechner komplett runter, startet er nicht wieder. Power-LED geht nicht an.

Lösung des Problems:
Lüfter von den CPU-Kühlern abbauen; die CPU-Kühler demontieren; aufschrauben der Niederhalter;
CPU 1 in den Sockel 2, und die CPU 2 in den Sockel 1; die Niederhalter festschrauben; CPU-Kühler wieder montieren; die Lüfter an die Kühler dranbauen.
Netzteil einschalten, Power-LED leuchtet, System startet durch.
RAM und Festplatte brauchen nicht ausgebaut werden.

Auf dem Board ist das aktuelle BIOS 1.1a, die aktuelle IPMI Firmware 1.34.

Da der Rechner mir nur als Rechenknecht bei BOINC-Projekten dienen soll, bleibt es nicht aus, dass ich ihn öfters runterfahre.

Weil sich das Ganze nun schon über 4 Monate hinzieht, würde ich es gerne vermeiden, das Board schon wieder in die Niederlande zu schicken.

Im nächsten Schritt würde ich mich an den Supermicro-Support wenden wollen, wenn ich von meinen Englisch-Künsten überzeugter wäre.

Oder Einer von Euch hat einen Tip, den ich vorher noch ausprobieren könnte?

99% von den BIOS-Einstellungen sind für mich böhmische Dörfer. Zumal auch in Englisch.

BTW, in der Meldung von Nero vom 19.07.2018 steht, dass ausführliche Reviews derartiger Server rar gesäht sind.
Wenn mein Rechner zuverlässig arbeitet, stelle ich ihn gerne dafür zur Verfügung.

EDIT: Wenn beide CPUen raus sind, und ich das Netzteil einschalte, leuchtet die Power-LED auf. Lasse ich die CPUen an ihren Plätzen und baue
alles wieder zusammen, funktioniert es nicht. Nur der Wechsel führt zum Erfolg.

--- Update ---

@Sightus
Wir hatten uns zuletzt im Juni über BIOS-Probleme der H11-Baureihe geschrieben.
Hat sich aus Deinem Schriftverkehr mit Supermicro etwas handfestes ergeben?

Our usa team did find the issue. Seems that one bit is placed wrong in some situations. When you read out ECC functionality, it tells you it is not active, while infact it is working. See information below from product manager.

" The BIOS team and AMD found the AMD CPU access the ECC enable status from SMBIOS will be wrong when ECC memory channel C & D are empty.
The AMD had an investigation and tested, There is no functional impact, only the ECC status shown in SMBIOS is incorrect.
ECC is actually enabled and the function is worked when the ECC DIMMs are installed even the Channel C/D are empty. "

We here at support have to find out if this is going to be solved with a bios update. We will let you know.
 
Zuletzt bearbeitet:
Kann das verwendete Netzteil als Fehlerquelle ausgeschlossenen werden, bzw. ist das für den Betrieb eines Serverboards mit 2 CPUs zugelassen für das Problem das der Rechner nicht mehr einschaltet wenn er komplett aus war.

Hat das Board einen 5VSB Jumper, bei Desktop Boards kann er dafür sorgen das der Rechner nicht in den Ruhe-Zustand geht, wenn USB Geräte angesteckt sind und entsprechend umgestellt wird.

Für den Betrieb ist ein Server-BS zu verwenden, nehme an das du Windows 2016 Server, Linux OS verwendest.

Für W10 ist es keine Freigabe gibt, laut Handbuch. Kann laufen muss aber nicht, daher auch kein Support.

Wenn das Problem gar nicht in den Griff zu bekommen ist, den Hersteller wechseln und eine andere Platine besorgen es gibt ja nicht nur SM als Hersteller.
 
Zuletzt bearbeitet:
@thorsam
Das Problem mit dem BIOS wurde noch nicht gefixt, offensichtlich dauert der Vorgang noch an. Man hat mir aber durch die Blume gesagt, dass nur wenige Leute an dieser Serie arbeiten und man auch immer ein Stück weit von AMD abhängt, wie die da Man-Power freigeben.
Im Moment läuft das System ohne größere Probleme unter Server 2019 (Beta). Auch Windows 10 läuft einwandfrei. Das Einzige, was ich nie richtig konsistent zum Laufen bringen konnte waren Grafikkarten. Wenn IPMI an ist und man eine GPU verbaut, dann gibt es manchmal Startprobleme oder aber auch nicht. Das war sogar OS-unabhängig (MS allerdings). Der Support konnte in meinem Fall übrigens Deutsch, auch wenn ich der Einfachheit wegen auf Englisch gepostet hatte, da mein Rumgeheule ja weitergeleitet werden musste.
 
Eigentlich ist es zu bedauern das ein Serverboard-Hersteller halbfertige Produkte auf den Markt wirft, bzw. den Eindruck hinterlässt nicht mal selbst Ahnung von Ihren Produkten zu haben. Da die Kriterien dort weitaus höher liegen, als bei einem 100 Euro Desktop-Board der Marke XYZ.
 
Das Herumgenöle bringt thorsam aber auch nicht weiter; unabhängig davon, dass Kunden mittlerweile überall Beta-Tester sind.

@thorsam
Die Frage nach dem NT ist aber berechtigt. Grundsätzlich muss ein System laufen (vor der OS-Ebene), wenn man die default values des UEFI lädt.
 
Zuletzt bearbeitet:
Ich weiß das manche Netzteile je nach Konfiguration sehr empfindlich reagieren aber nicht den Grund, bzw. schon kann mich aber nicht mehr dran erinnern. Da das Netzteil ja ein quasi Power-Good Status hat und in einer bestimmten Zeit in ns eine gewisse Leistung beim Starten (Kurzfristig) benötigen. Wird diese nicht geliefert kommt es zu genau diesen Probleme, meist sind es Gamer-System mit Potenten Grafikkarten und CPUs.

Hier wäre nicht auch nicht verkehrt ein Netzteil zu verwenden, was eine echte 12V Schiene hat kein Multirail Murks da man nicht weiß wie der Mainboard Hersteller die Lasten Anschlussbezogen verteilt, behaupte mal das reine Server-Netzteile auf diesen ganzen Marketing Kram nicht setzen. Das Netzeil hat nur einen Trafo aus dem ALLE Spannungen mittlerweile generiert werden.
 
Erstmal vielen Dank an Zidane für die Anregungen, um das Problem einzugrenzen bzw. Probleme auszusortieren.

Vorweg noch eine Info die ich vergessen habe zu geben. Wenn ich das Board dann wieder zum starten gebracht habe,
und ins BIOS gegangen bin, war jedesmal das zuvor eingestellte aktuelle Datum und die Uhrzeit weg. Ein Batteriewechsel
hat aber auch nichts an der Sache geändert.

Zu den Netzteilen kann ich sagen, da ich auch ein Gläubiger der Monorail bin, dass ich es mit dem Seasonic 1200 Platinum,
als auch mit dem Corsair AX1200i, versucht habe.
Die Watt-Klasse aus dem Grunde, weil in meinen Rechenknechten noch potente Grafikkarten für Folding@Home drinstecken habe.
Da der ganze Kram nur in ein ATX-Gehäuse paßt, habe ich auch ein ATX-Netzteil dazu.
Meinst Du, dass es mit einem Netzteil mit der EPS-Spezifikationen funktionieren würde?

Das Board hat zwar einiges an Jumper, aber einen für "5VSB" ist nicht dabei. Ich meine irgendwo im BIOS entsprechende Einstellungen
gesehen zu haben. Sämtliche BIOS-Einstellungen, mit Ausnahme des Datums und der Uhrzeit, habe ich auch den default-Einstellungen
gelassen.

Bezüglich der Betriebssysteme habe ich es mit openSUSE Leap 42.3, Linux Mint 19 und mit Windows 10 Enterprise versucht.
Im Augenblick lasse ich den Rechner per Windows 10 Pro verschiedene BOINC-Projekte rechnen. Bisher ohne Probleme.
Naja, bis halt auf das Startverhalten. ;-)

Was den Wechsel des Board-Hersteller anbetrifft, habe ich auch bis zuletzt gehofft, dass Tyan ein 2-Sockel-Board rausbringt,
darum ist mit Wechseln ein bißchen Essig, weil ich aus Platzgründen nicht einfach 2 1-Sockel-Systeme hinstellen kann.

Soweit dazu.

Ansonsten habe ich Gestern noch den SM-Support angemailt, und denen mein Problem auf Englisch geschildert.
Wie ich aus dem Repair Report sehe, hat der Händler hier aus Deutschland, meine Fehlerbeschreibung in Deutsch,
verkehrt ins Englische übersetzt, sodaß vom Support in den Niederlanden, der Test nicht entsprechend durchgeführt
wurde.
Mal sehen wann ich eine Antwort aus den Niederlanden oder USA bekomme.
 
Wenn das Board gewisse Anforderungen an das Netzteil hat bezüglich EPS etc, würde ich auch ein Netzteil suchen was den Normen entspricht. Nicht das man sowas erlebt wie bei Intel, und später bei den Netzteilherstellern die Intel-Spezifikationen mit angegeben waren.

Das das Board die UEFI Daten trotz frischer Zelle verliert ist ein Manko, und deutet auf einen defekt hin womit das Board reklamiert werden sollte.
 
Das mit dem Batteriewechsel war aber mehr die Verzweifelung die mich dazu getrieben hat.
Laut Meßgerät beträgt der Ladezustand 3,0V.

Ich warte dann erstmal auf die, hoffentlich zeitnahme, Anwort von Supermicro.
Was mich daran am meisten nervt ist, dass die Garantie mit Kaufdatum zu laufen beginnt.
Das heißt, 4 von den 24 Monaten sind schon mal rum.
 
Hoffen wir mal das die einen guten Support haben, und man da als Kunde nicht in die Röhre schaut egal ob Geschäfts oder Privat Kunde. Viel Daumen Drück *great*
 
Auf der Suche im BIOS, um das Boot-Logo zu deaktivieren, bin ich IT-Legastheniker,
über folgenden Eintrag gestolpert:



Standardeinstellung war Last Stade. Warum auch immer.
Nachdem ich es versuchsweise auf Power-On geändert habe, ist mein Problem behoben.

Dann werde ich mal dem Supermicro-Support bescheid geben, dass sie sich wieder hinlegen können.
 
Naja, "Last State" ist ja eigentlich sinnvoll. Ist denn "Power-On" das, was du willst? Sprich, sobald du das Teil an die Steckdose steckst, fährt es hoch.
 
@thorsam,

Eigentlich hat theoretisch diese Einstellung aber nix mit deinem Problem zu tun. Je nach Einstellung bei z.b Stromausfall bleibt der PC dann aus oder schaltet sich selbst ein.

Guck zudem nach ob die gespeicherten Daten nun im UEFI wenn der PC komplett stromlos war verbleiben.
 
Zur Gegenprobe habe ich die BIOS-Einstellung wieder auf default gesetzt.
Mit dem Ergebnis, dass der Rechner nicht wieder starten wollte.
Um wieder ins BIOS zu kommen, mußte ich wieder alles demontieren, und so weiter.
Als ich den Rechner ein paarmal an- und ausgeschaltet habe, das Netzteil stromlos gesetzt habe,
verblieben die geänderten Daten im UEFI.

Da der Rechner, nach bestandenem Streßtest, in einen Raum kommt, zu dem ich nicht jederzeit Zutritt habe,
ist es aus der Erfahrung der letzten 15 Jahre für mich einfacher, wenn der Rechner nach Stromausfall wieder
alleine hochfährt.
Da der Rechner 24/7 in Betrieb sein wird, werde ich also den Rechner einmal händisch mit der Steckdose
verbinden, und das wars. Er läßt sich ja auch wie gewohnt runterfahren, und per Knopfdruck am Gehäuse,
wieder starten.

Klingt nicht logisch, aber was soll ich machen, ausser auf die Antwort vom Support warten.
 
Der Support aus den Niederlanden hat sich jetzt gemeldet.

Sie bieten mir an, dass ich das Board einschicken kann, damit sie vor Ort den Fehler nachstellen können.

Als Antwort habe ich geschrieben, dass ich grundsätzlich das Angebot annehmen möchte, aber nur im Tausch mit einem neuen/anderem Board,
weil jetzt schon 4 Monate rum sind, und ich noch nicht einen Tag mit dem System richtig arbeiten konnte.

Mal sehen, was sie antworten.
 
Hoffe mal das die das machen, darf man ja bei dem Preis des Produktes auch erwarten, da SM ja keine Hinterhofklitsche ist.
 
Zurück
Oben Unten