News Wichtiger Nachtrag zu "OpenSolaris Home-Server"

Nero24

Administrator
Teammitglied
Mitglied seit
01.07.2000
Beiträge
24.066
Renomée
10.446
  • BOINC Pentathlon 2019
  • BOINC Pentathlon 2020
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2021
<div class="newsfloatleft"><img src="http://www.planet3dnow.de/photoplog/file.php?n=7861&w=o" alt="" border="1" height="150"></div> Ende Oktober hatten wir einen <a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=370637">ausführlichen Artikel veröffentlicht</a>, der zeigt, wie man mit geringem finanziellen Aufwand auf Basis von ausgesuchten Desktop-Komponenten mit Hilfe des Betriebssystems <a href="http://www.opensolaris.org" target="_blanK">OpenSolaris</A> einen möglichst schlagkräftigen Home-Server bauen kann, der nicht nur Datei-Freigaben für verschiedene Benutzer beherrscht, sondern sogar virtuelle PCs mit Hilfe von VirtualBox bereitstellen kann.

Kurz nach der Veröffentlichung des Artikels und einer für ausreichend befundenen Testphase mit zahlreichen Stabilitätstests (hauptsächlich für CPU, RAM und Storage-Subsystem) wurde der Server seinem Bestimmungszweck zugeführt. Leider gab es schon kurz darauf die ersten Probleme: beim Kopieren von großen Datenmengen (100 GB oder mehr) in einem Rutsch brach - nicht 1:1 reproduzierbar, aber immer mal wieder - der Kopiervorgang mit unerklärlichen Fehlerrmeldungen ab. Mal soll der Pfadname zu lang gewesen sein, mal sei die Netzwerkressource nicht mehr erreichbar. Letztendlich waren das aber nur Erklärungsversuche der Windows-Clients "ins Blaue hinein". Zuerst hatte wir ein Problem mit dem Sun-eigenen SMB-Server in Verdacht und probierten den aus der Linux-Welt bekannten Samba. Ohne Unterschied.

Tatsächlich gönnte sich zwischendurch der rge-Treiber von OpenSolaris immer wieder ein Nickerchen, denn auch vom Server aus konnte man keine Netzwerk-Komponente mehr erreichen. Wenn man ein paar Minuten wartete oder den Server einfach neu startete, war wieder alles ok; bis zum nächsten Abbruch bei hoher Last.

Für unseren Home-Server hatten wir das <a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=370637&garpg=3">ASUS M3A76-CM</a> Mainboard gewählt, das als NIC einen Wald- und Wiesen-Chip von Realtek, den RTL8111C in der PCI-Express Variante mit 1 GBit/s Transferrate trägt. Zwar waren wir während der Recherche für das Projekt "Home-Server" auf zahlreiche Probleme von Solaris mit den Realtek Gigabit-Chips gestoßen, doch datierten die alle auf Anfang 2008, während wir die OpenSolaris-Version 2009.06 einsetzten. Da das Netzwerk sofort out-of-the-box funktionierte, wähnten wir das Problem als nicht mehr existent.

Nun, offenbar waren wir da zu voreilig und wie schon das <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1175032844">Solaris-Abenteuer mit unserem Webserver</a> damals gezeigt hat, offenbart oft erst praxisbezogene Dauerlast eventuelle Schwächen. Mit dem Realtek-Problem sind wir nicht alleine. Wer sich die Mühe macht ein paar Stunden die einschlägigen Foren zu lesen (u.a. bug ID 6807184), stößt auf unzählige Beiträge, in denen dieses Problem geschildert wird, auch auf Lösungsvorschläge und leider auch auf die Quintessenz, dass keiner der Workarounds rundum zufriedenstellend ist. Aber der Reihe nach.

Die Ursache für das Problem liegt wohl irgendwo in der Hardware-Routine für die Checksummen-Prüfung. Bei vielen Usern - darunter auch bei uns - waren die Verbindungsabbrüche vorbei, wenn man die Checksummen-Kontrolle nicht dem Netzwerk-Chip, sondern der CPU aufbürdet. Dazu öffnet man als "su" die Datei /etc/system und fügt am Ende der Datei die Zeile<blockquote>set ip:dohwcksum = 0</blockquote>hinzu. Dann Reboot und das Problem sollte behoben sein. Leider jedoch ging dieser Fix bei uns auch mit einer eklatant niedrigeren Transferrate einher. Während große Dateien vorher (bis zum Abbruch) mit etwa 80 MB/s auf den Server geschoben werden konnten, schlich das System nun mit 20 MB/s dahin. Das ist nicht akzeptabel.

Als nächstes probierten wir sämtliche Patches für den rge-Treiber, die <a href="http://opensolaris.org/jive/thread.jspa?messageID=435273" target="_blanK">in diesem Thread</a> veröffentlicht wurden. Da das Problem von Haus aus unregelmäßig und nur unter extremer Netzwerk-Last auftrat, ist es unmöglich zu sagen, ob einer davon das Problem gelindert hat. Behoben hat es leider keiner.

Als nächstes wurden wir auf ein <a href="http://homepage2.nifty.com/mrym3/taiyodo/eng/" target="_blank">Netzwerk-Projekt für Solaris</a> aufmerksam, das von einem gewissen Masayuki Murayama betrieben wird. Es handelt sich dabei um eine Sammlung freier Netzwerk-Treiber für Solaris, die offenbar ihren Ursprung in der <a href="http://de.wikipedia.org/wiki/Berkeley_Software_Distribution" target="_blank">BSD-Welt</a> haben. Allerdings klagten einige Foren-User dabei über komplette Systemabstürze in Form von kernel panics (vergleichbar einem Bluescreen unter Windows). Transferrate gegen Stabilität? Ein schlechter Tausch bei einem Server.

Nach nun zwei Wochen lesen und probieren müssen wir zu dem Schluss kommen - und damit die Ratschläge des Großteils der Postings aus der OpenSolaris-Szene wiederholen - von den Realtek-Gigabit-Netzwerk-Chips die Finger zu lassen, wenn Solaris zum Einsatz kommen soll. Es ist unverständlich, wieso es offenbar seit fast zwei Jahren nicht möglich ist, die Probleme mit einer kompletten NIC-Familie in den Griff zu bekommen (betrifft wohl auch 8168), die millionenfach weltweit im Einsatz ist und unter anderen Betriebssystemen fehlerfrei arbeitet. Das Problem ist im übrigen nicht Hersteller spezifisch, denn eine uralte Realtek RTL-8139 Fast-Ethernet PCI-Karte arbeitet als zweite NIC (für ein separates Teilnetz via WLAN) in unserem Home-Server völlig problemlos.

Im Zweifel wurde von der OpenSolaris-Community immer wieder eine Intel PCI-Express Karte empfohlen. In der Praxis wird es wohl auch jede andere Netzwerkkarte tun, die mit einem Chip bestückt ist, der auf der <a href="http://www.sun.com/bigadmin/hcl/data/os/components/views/networking_all_results.mfg.page1.html" target="_blanK">offiziellen Kompatibilitätsliste von OpenSolaris</a> steht.

Dieses Problem zeigt, in welche Fallen man laufen kann bei einem verglichen mit der Linux-Welt oder gar dem Windows-Imperium vergleichsweise kleinen Nischenprodukt wie OpenSolaris. Selbst das inoffizielle Prädikat "Massenware" (sprich: "dafür MUSS es doch was geben") ist kein Garant dafür, dass es dafür auch in exotischen Betriebssystem-Welten wie Solaris brauchbaren Treibersupport gibt. Von Realtek selbst kommt nichts, ergo hängt der Support an freiwilligen Programmierern, die meist via Reverse-Engineering oder gar Trial-and-Error oder über irgendwelche irgendwo ergatterte, teils veraltete Unterlagen versuchen Treiber zu programmieren. So uneigennützig und bewundernswert so ein Community-basierendes Open-Source Projekt ist, so frustrierend kann es für den Endanwender sein, wenn es eigentlich funktioniert, aber unter kritischen Bedingungen dann eben doch nicht.

Wir für unseren Teil haben uns nun eine eben solche hochgelobte Intel Netzwerk-Karte bestellt und werden prüfen, ob das Problem damit wie versprochen aus der Welt ist. Falls ja, werden wir den Artikel entsprechend aktualisieren.

<b>Links zum Thema:</b><ul><li><a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=370637">Anleitung: Wir bauen einen AMD Home-Server mit OpenSolaris </a></li><li><a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1172067659">Eine neue Sonne für den grünen Planeten</a></li><li><a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1175032844">Sonnenuntergang auf dem grünen Planeten</a></li><li><a href="http://opensolaris.org/jive/thread.jspa?messageID=435273" target="_blank">OpenSolaris-Forum: any work on bug ID 6807184 </a></li><li><a href="http://forums.opensolaris.com/message.jspa?messageID=1317" target="_blank">OpenSolaris-Forum: Network problem with realtek RTL8168</a></li><li><a href="http://homepage2.nifty.com/mrym3/taiyodo/eng/" target="_blank">Solaris Gani Netzwerk-Treiber</a></li><li><a href="http://www.sun.com/bigadmin/hcl/data/os/components/views/networking_all_results.mfg.page1.html" target="_blank">OpenSolaris Kompatibilitätsliste für Netzwerkkarten bzw. Controller</a></li></ul>
 
Planet3DNow und Solaris, a never ending story ;D

Trotzdem sehr löblich, dass die Leute, die den Server nachgebaut haben nicht im Stich gelassen werden!
 
Es ist zwar jetzt nicht Solaris, aber mit einer Realtek Gigabit NIC hatte ich auch schon unter Linux meine Probleme.

Unter Windows lief sie ohne Probleme auf Gigabit, unter Linux (CentOS5) nicht, da wollte sie nur auf 100 Mbit/s laufen.

Also einen Treiber für die Karte gesucht und installiert.
Dann lief die Karte zwar, war aber sehr langsam.

Ende vom Leid:
Eine Intel NIC gekauft und gut war.

Zuerst eine PCI, später dann eine PCI-E und seit dem ist Ruhe.

Also nicht nur unter Solaris kann das einem passieren.
 
Mann mann mann ... wird Zeit dass die 800er SBs mit integrierter Netzwerkarte rauskommen ...
 
Ja, die Treiber für RTL8168 und 8111 bzw. der gesamten Gigabit-PCIExpress-Familie (die Chips ja alle mehr oder weniger identisch) machen auch bei vielen Linux-Distributionen Probleme. Abhilfe schafft da eigentlich immer der Hersteller-Treiber - der allerdings nicht OpenSource ist und deswegen den meisten Distris nicht beiliegt. Allerdings existieren wohl keine Hersteller-Treiber für Solaris... Nun ja
 
eine frage sei mir erlaubt
warum versteift sich das p3dnow team so auf (open)solaris
grad (z.b.) beim forum wo jeder weiss dass solaris lahmt mit mysql datenbanken?
ebenso ist opensolaris wesentlich waehlerischer was hw angeht als ein linux, und selbst da gibts massigst probleme mit billig nics wie realtek (vor allem unter 64bit)
welchen vorteil seht ihr gegenueber einem ubuntu-server?
 
...für die es dann sicherlich bereits 2016 brauchbare Treiber für Solaris geben wird... ;)
Naja, da wird AMD schon was drehen, hoff ich, die Dinger und deren Server Derivate werden ja (hoffentlich) nach ner gewissen Zeit auch auf den G34 Boards verlötet ;D
Da könnte es sich AMD nicht leisten, keine OpenSolaris treiber anzubieten.

Aber Restrisiko besteht ... die aktuellen Boards haben ja alle noch SB7xx Abkömmlinge und bei Servern tauscht man nicht gerne "mal schnell" was aus ... :(

eine frage sei mir erlaubt
warum versteift sich das p3dnow team so auf (open)solaris
grad (z.b.) beim forum wo jeder weiss dass solaris lahmt mit mysql datenbanken?
ebenso ist opensolaris wesentlich waehlerischer was hw angeht als ein linux, und selbst da gibts massigst probleme mit billig nics wie realtek (vor allem unter 64bit)
Das ist einfach: Weils bei Linux kein ZFS gibt ;-)

ciao

Alex
 
die ganzen abstriche fuer zfs?
lol!
ich bin sprachlos
 
eine frage sei mir erlaubt
warum versteift sich das p3dnow team so auf (open)solaris(...)
Ganz einfach: Lin sucks, außerdem stinkt Linux und ist reinste Frickelware. *renn*

Ne, mal im Ernst: Ich finde das Open Solaris Projekt echt klasse und kleinere Unstimmigkeiten sind bei derartigen Projekten nichts Ungewöhnliches. Super ist, das diese Problematiken so gut diagnostiziert wurden und Nero24 einen workaround versucht (Intel NIC), man wird sehen, ob und wie es läuft.

Ein OpenSolaris Server reizt mich auch erheblich mehr, als eine Linuxkiste (ja, ich habe eine Linuxphobie. Linux mag mich nicht und ich mag Linux nicht).

Insofern: Viel Glück und möget ihr Erfolg mit dem Umbau haben! Ich verfolge das Thema weiter.
 
Zuletzt bearbeitet:
eine frage sei mir erlaubt
warum versteift sich das p3dnow team so auf (open)solaris
Wenn Du den Artikel gelesen hast, dann weißt Du ja, dass die Intention dieses Artikels war einen möglichst zuverlässigen Home-Server auf Basis von möglichst preisgünstigen Desktop-Komponenten zu bauen, der völlig ohne teure Server-Hardware auskommt und trotzdem problemlos erweiterbare Datenspeicher samt Redundanz bieten soll

Aus diesem Grund stellten wir ZFS in den Mittelpunkt des Artikels, da es damit möglich ist, auf Software-Ebene mehrere Festplatten zu einem preisgünstigen RAID-5/6 zusammen zu schalten und nachträglich zu erweitern. Und das funktioniert ja auch problemlos. Die hier geschilderten Problem betreffen ja mal wieder - wie schon damals beim Webserver-Projekt - Baustellen im Umfeld des OS - die im Falle von Realtek anscheinend auch Linux betreffen. Also wo wäre der Vorteil mit debian? *kopfkratz

Wenn jemand keinen Wert legt auf ZFS, die Erweiterbarkeit von Datenpools und die freie Verfügbarkeit des Systems, der kann sich ja auch einen Windows-Server hinstellen und in keine der genannten Fallen tappen. Das hatten wir ja auch in der Zusammenfassung des Artikels geschrieben:
Der Artikel stellt keinerlei Anspruch auf Vollständigkeit für die Realisierung eines Home-Servers. Selbstverständlich führen hier viele Wege nach Rom. Wir haben einen aufgezeigt. Wer lieber bei Windows oder Linux bleibt, kann sicherlich ähnliche Lösungen kreieren ohne vertraute Pfade verlassen zu müssen. Hier muss jeder selbst abwägen, ob ZFS alleine die Auseinandersetzung mit dem unbekannten Exoten Solaris rechtfertigt.
Nur bräuchten wir für einen Windows Home-Server keinen Artikel zu veröffentlichen. Jeder User, der Planet 3DNow! im Web findet und die Beiträge darauf einigermaßen erfassen kann, wird dazu in der Lage sein. Der Rest liest P3D sowieso nicht, weil er kein Wort davon versteht, was hier geschrieben wird.

Nachtrag:
Ach ja, unser Webserver-Admin hatte mich im übrigen versucht davon abzuhalten ein weiteres Solaris-Abenteuer zu starten (er nennt Solaris seit damals nur noch das Betriebssystem mit dem "S" Wort ;D) und versuchte mich von FreeBSD als Home-Server Lösung zu überzeugen, das ja mittlerweile auch ZFS-Support bietet (wenn auch nicht für das Betriebssystem selbst und nur experimentell wenn ich das richtig gelesen habe). Vielleicht hätte ich doch auf ihn hören sollen ;) Oder wir starten noch ein zweites Projekt mit FreeBSD als Basis? Mal Terminkalender herauskramen...
 
Ich auch, denn anscheinend hat man bei Linux die gleichen Probleme, Du schreibst ja selbst:

aber wenigstens isses ned so lahm sie slowlaris ;)

Also auch Probleme, aber kein ZFS, tolle Idee *lol*

lieber sw raid5 + xfs + dm-crypt
is alles in allem noch immer performanter als zfs ;)
und auch nachtraeglich erweiterbar

ich kann meine alten messungen auf nem x335 mal raussuchen wenn ich sie noch finde
 
Zuletzt bearbeitet:
(...)(wenn auch nicht für das Betriebssystem selbst und nur experimentell wenn ich das richtig gelesen habe).(...)
Püh, damit disqualifiziert sich so eine Bastelware schon im Servereinsatz.

Laß Dich nicht vom Kurs abbringen und folge dem Ruf Deines Herzens... ;D
 
Ach Quatsch, in der OpenSource-Welt ist doch jeder zweiter Treiber experimentell :D

OK, bei Windows auch, aber da gibt's niemand zu ;)
 
Nachtrag:
Ach ja, unser Webserver-Admin hatte mich im übrigen versucht davon abzuhalten ein weiteres Solaris-Abenteuer zu starten (er nennt Solaris seit damals nur noch das Betriebssystem mit dem "S" Wort ;D) und versuchte mich von FreeBSD als Home-Server Lösung zu überzeugen, das ja mittlerweile auch ZFS-Support bietet (wenn auch nicht für das Betriebssystem selbst und nur experimentell wenn ich das richtig gelesen habe). Vielleicht hätte ich doch auf ihn hören sollen ;) Oder wir starten noch ein zweites Projekt mit FreeBSD als Basis? Mal Terminkalender herauskramen...

Sollte ich die Zeit finden, bastel ich mal äquivalent eine Linux-Lösung nach. Dann kann der Nutzer wählen, zwischen Solaris, FreeBSD oder Linux. ;D
 
Komisch nur, wenn Solaris 10 sich mit SSDs betreiben lässt und dabei auch von der Geschwindigkeit der neuen SSDs profitiert ...

dann erzaehl mal um was es sich handelt.
das einzige was das (nicht windoof) os unterstuetzen koennte um fuer ssds "besser" geeignet zu sein als ein anderes ist das ata trim commando (welches dank garbage collector firmware bei den vertex, und neuen ssds basierend auf sandforce controllern (welche kein trim mehr brauchen)) ja auch schon wieder ueberfluessig ist

nur um schnell zu lesen brauchts keine OS unterstuetzung ;)

aber ich glaube ich werd mal neu benchmarken, openslowlaris 2009.06 gegen irgendein sw-raid5+xfs
nur um sicher zu sein dass sich in den letzten monaten nicht drastisch was verbessert hat auf solaris seite.
 
Zuletzt bearbeitet:
aber ich glaube ich werd mal neu benchmarken, openslowlaris 2009.06 gegen irgendein sw-raid5+xfs
nur um sicher zu sein dass sich in den letzten monaten nicht drastisch was verbessert hat auf solaris seite.

Na, verbrenn dir mal nicht die Finger. Oder hast du ein Shelf mit dutzenden von Platten zum Test zur Verfügung? *suspect*
 
Sun FlashFire Performance
Sun Storage F5100 Flash Array
... Solaris ist im Vergleich zum dort eingesetztem RedHat Linux langsamer ... aber sooo langsam wieder auch nicht.

Die Vorteile mit SSDs als HDD-Cache werden jedenfalls deutlich ausgespielt. Kein Vergleich zum unseligen Hype von Microsofts Vista "???"... wie nannte sich das noch mal mit dem USB-Flash ... ah ja, "Ready Boost".
 
Zuletzt bearbeitet:
Ab FreeBSD 8, welches dzt. im RC3 ist, ist das ZFS nicht mehr als experimentell gekennzeichnet.
Außerdem ist das "experimentelle" ZFS exakt der _gleiche_ Code wie der von OpenS.....
(nein ich sprech's nicht aus ;))
Das experimentelle ZFS von FreeBSD ist bei mir und meinen Kunden im harten Produktionseinsatz seit es ZFS gibt und hat noch NIE irgend welche Zicken gemacht.
Geschweige denn Abstürze Netzwerkadapter Probleme oder sonst was.

Weiters um das den Windowsjüngern ein für alle mal klar zu machen:
"Experimentell" in der OpenSource Welt entspricht weitaus mehr einer stabilen Version als es je eine Windows 1.0 Version ist oder sein wird *buck*

Mit etwas nachlesen lässt sich meistens ganz leicht erfahren wie "experimentell" eine Sache in der OpenSource Welt tatsächlich ist.

Und nein mit Linux LVM + Raid und egal welchem Filesystem (derzeit) kommt nichts auch nur in die Nähe von ZFS.
Schon mal ein 13 TB Raid 6 mit Linux formatiert? Viel Spass wir sehen uns in einer Woche wenn der Format fertig ist.....

lg
__tom
 
Zurück
Oben Unten