Trinity als Spieleplattform — Vier Grafikkarten zeigen das Mögliche
BOINC — Einstein@home
BOINC für Distributed Computing dürfte weitläufig bekannt sein. Das für wissenschaftliche Projekte entwickelte Programm nutzt teilweise schon seit längerem die GPU mit ihrer geballten Rechenleistung für die Berechnung. Einige Projekte nutzen noch immer AMDs CAL oder NVIDIAs CUDA. Am liebsten hätten wir POEM genutzt, da es für beide Architekturen OpenCL nutzt. Wir hätten uns hier bessere Vergleichbarkeit erhofft, da OpenCL von beiden GPU-Herstellern unterstützt wird. Tatsächlich können aber auch hier unterschiedlich gut angepasste Algorithmen zum Einsatz kommen und die jeweiligen Hersteller ihre Runtimes verschieden gut pflegen. Daher ist es zu verschmerzen, dass wir wegen einiger Probleme beim Test uns dann doch entschieden, Einstein zu verwenden, auch wenn hier auf NVIDIA-Karten die Programmsprache CUDA zum Einsatz kommt.
Wir lassen stets zwei WUs gleichzeitig auf der Grafikkarte berechnen, um eine möglichst hohe Auslastung zu erzeugen. Eine stets optimale Auslastung der GPU kann allerdings nicht sichergestellt werden. Gerade schnellere Grafikkarten können auch noch mehr Aufgaben gleichzeitig bearbeiten. Das Ergebnis wird von uns in Punkten pro Stunde angegeben. Anzumerken an dieser Stelle ist, dass die CUDA-Ausführung mehr CPU-Zeit beansprucht. Dieser Wert wird von BOINC ausgegeben, wenn eine fertige WU (Work Unit) von der entsprechenden Projektseite verifiziert wird. Er gibt an, wie lange eine WU die CPU beansprucht hat, genauso gibt es einen Wert für die Gesamtlaufzeit. CUDA beansprucht die CPU um 50 bis 100 % mehr als die OpenCL-Anwendung auf den AMD-Karten.
Die Berechnung mit OpenCL auf den AMD-Karten scheint deutlich effektiver vonstattenzugehen.
Im folgenden Diagramm haben wir die erreichbaren Credits pro kWh dargestellt. Dabei wird die Leistungsaufnahme des Gesamtsystems gemessen. Für exzessive BOINC-Nutzer ist die Darstellung insofern wichtig, da gerade bei einem 24/7‑Betrieb nicht unerhebliche Kosten entstehen können.
Bezogen auf die Leistungsaufnahme sieht es für die AMD-Karten noch mal ein Stück besser aus, was nicht zuletzt auch an der höheren CPU-Last der CUDA-Umsetzung liegen kann.