AMD-Grafikkarten unter Linux: Treiber, OpenCL, BOINC, amdconfig und headless per ssh

Hat jemand 'ne Lösung für lockup on Boot mit AMD VEGA64 auf SuSe Tumbleweed??
 
Wird der AMDgpupro unter Ubuntu18.04(.1) direkt mit einer VegaVII umgehen können oder ist da noch Feintuning oder gar Bastelei angesagt?
 
Schick sie mir, ich probiere es aus :-D

Ich gehe davon aus, dass die Installation des Treibers (OpenCL PAL) ausreicht.
 
Ich gehe davon aus, dass die Installation des Treibers (OpenCL PAL) ausreicht.
Den kenn ich noch gar nicht.
Bei der RX460 war ich froh, dass mit Ubuntu18 der AMDgpupro ausgereicht hat, plus evtl. noch ein Boinc-Paket für OpenCL. So wollte ich das eigentlich wieder machen. Vorher muss aber noch der Nvidia-Treiber weg, hoffentlich geht das gut.
 
Dann würde ich eben den 18.50 nehmen. Da ist die VII auch aufgelistet und der ist für 18.04.1
 
OpenCL PAL ist ja kein eigener Treiber, sondern nur die OpenCL Variante die du bei der AMDGPU-PRO Installation auswählst. Alles bis inkl. Polaris ist legacy, Vega ist PAL.
Nvidia-Treiber und AMD-Treiber parallel geht auch, so betreibe ich ja meine GTX 1060 und RX580 zeitgleich. Die AMD muss jedoch primäre Karte sein, anderfalls hatte ich kein Bild. Eine Karte macht wohl Kernel Mode Setting wenn sie den Desktop ausliefert, die andere nicht, das gab dann Probleme.
 
Na dann kann ich den Nvidia-Treiber vielleicht auch lassen.
2 Karten verträgt das Netzteil und das Mainboard eh nicht.
 
Ein Testlauf mit der RX460 und dem 19.10 auf Ubuntu 18.04.2 war schon mal erfolgreich.
Installiert hab ich nur ./amdgpu-pro-install --opencl=legacy,pal --headless
Damit knuspert die RX460 nun per OpenCL Einstein.

Ich weiß nur noch nicht, ob ich den Ryzen dann auch auf 18.04.2 ugrade oder auf .1 lasse und eben den älteren 18.50 nehme. Hat der 19.10 irgendwelche Vorteile hinsichtlich Performance?

--- Update ---

Das gleiche Prozedere hat auf der VegaVII nun auch wunderbar funktioniert, OpenCL läuft.
 
Ich habe mein Skript (create_amdgpu-ocl-pkg.sh) zur Verwurstung des offiziellen Treibers mal ein wenig überarbeitet, es ist jetzt zu einem gewissen Maße Versionsunabhängig.
Das OpenCL des AMDGPU-PRO 18.50 und 19.10 wird damit in ein (Ubuntu/Debian/Mint-)Release- und Kernelunabhängiges Paket umgewandelt. Beim älteren 17.50 klappt das nicht, da war die Namensgebung noch anders, sicherlich verschmerzbar.
Zusätzlich ist nur das Paket ocl-icd-libopencl1 notwendig, dann bescheinigt clinfo bereits OpenCL Fähigkeiten.

Beispiel:
Code:
root@frickelbude:/tmp# ./create_amdgpu-ocl-pkg.sh amdgpu-pro-18.50-725072-ubuntu-18.04.tar.xz
No download needed, driver already on disk.

Processing driver archive:
 Extracting amdgpu-pro-18.50-725072-ubuntu-18.04.tar.xz  done
  Extracting opencl-amdgpu-pro-icd_18.50-725072_amd64.deb done
    Extracting data.tar.xz done
  Extracting opencl-orca-amdgpu-pro-icd_18.50-725072_amd64.deb done
    Extracting data.tar.xz done
  Extracting libdrm-amdgpu-amdgpu1_2.4.95-725072_amd64.deb done
    Extracting data.tar.xz done
Copying files to package directory done

Building package (allow up to 2min):
dpkg-deb: building package 'amdgpu-ocl' in 'amdgpu-ocl.deb'.
Renaming amdgpu-ocl to amdgpu-ocl_18.50-725072.deb

amdgpu-ocl_18.50-725072.deb content:
drwxr-xr-x root/root         0 2019-05-20 22:18 ./
drwxr-xr-x root/root         0 2019-01-15 15:07 ./etc/
drwxr-xr-x root/root         0 2019-01-15 15:07 ./etc/OpenCL/
drwxr-xr-x root/root         0 2019-01-15 15:07 ./etc/OpenCL/vendors/
-rw-r--r-- root/root        20 2019-01-15 15:07 ./etc/OpenCL/vendors/amdocl-orca64.icd
-rw-r--r-- root/root        15 2019-01-15 15:07 ./etc/OpenCL/vendors/amdocl64.icd
drwxr-xr-x root/root         0 2019-05-20 22:18 ./opt/
drwxr-xr-x root/root         0 2019-05-20 22:18 ./opt/amdgpu/
drwxr-xr-x root/root         0 2019-05-20 22:18 ./opt/amdgpu/share/
drwxr-xr-x root/root         0 2019-05-20 22:18 ./opt/amdgpu/share/libdrm/
drwxr-xr-x root/root         0 2019-05-20 22:18 ./usr/
drwxr-xr-x root/root         0 2019-05-20 22:18 ./usr/lib/
-rw-r--r-- root/root  67647328 2019-05-20 22:18 ./usr/lib/libamdocl-orca64.so
-rw-r--r-- root/root  35387344 2019-01-15 15:07 ./usr/lib/libamdocl12cl64.so
-rw-r--r-- root/root  68055480 2019-01-15 15:07 ./usr/lib/libamdocl64.so
-rw-r--r-- root/root     47544 2019-01-15 15:07 ./usr/lib/libdrm_amdgpo.so.1.0.0
lrwxrwxrwx root/root         0 2019-05-20 22:18 ./opt/amdgpu/share/libdrm/amdgpu.ids -> /usr/share/libdrm/amdgpu.ids
lrwxrwxrwx root/root         0 2019-05-20 22:18 ./usr/lib/libdrm_amdgpo.so.1 -> libdrm_amdgpo.so.1.0.0

Use dpkg -i amdgpu-ocl_18.50-725072.deb to install it.

Das Treiberarchiv für Ubuntu herunterladen und im gleichen Verzeichnis platzieren und das Skript plus Paketnamen aufrufen. Alternativ Skript ohne Archivnamen aufrufen und der aufkommenden Abfrage den vollen Pfad zum Paket mitgeben. Der Rest geht dann automatisiert. Das Archiv wird entpackt, aus 3 der darin befindlichen .deb Pakete werden Dateien extrahiert und in einen gemeinsamen Verzeichnisbaum kopiert. Nach dem Erzeugen von Paketverwaltungsinformationen wird ein installierbares Paket erzeugt.

Klappt bei mir auf Ubuntu 19.04 (Kernel 5.0.0), man muss sich nicht auf Ubuntu 18.04.1 oder 18.04.2 beschränken, bzw. kann auch auf 18.04.1 den aktuelleren Treiber 19.10 einsetzen und vice versa.


Freue mich über jegliches Feedback!
 
Zuletzt bearbeitet:
Ich habe mir die Datei erstmal gesichert. Zu Pfingsten werde ich wohl dazu kommen, damit zu testen.
 
Ich habe jetzt mehreren AMD IGPs mit den AMDGPU-PRO Treiber zum laufen gebracht(R2E, R3, R7, Vega11), Lubuntu 18.04.1 installiert und aktualisiert
auf 18.04.2(Kernel14.15.0.50) Neustart, den AMDGPU-PRO Treiber installiert Neustart dan Boinc installiert und schon rechnet die IGP los(ohne boinc-opencl)
die R3 von meinem 5350 hat Milkyway in ca. 53 Min. gerechnet PPS Sieve in ca. 5 Std. der OpenCL Parameter --opencl=pal ist ab Vega 10,
für alle anderen ist der Parameter --opencl=legacy, auf dem A12-9800 ist der Treiber v. 18.50 und auf dem R5 2400G ist der Treiber v. 19.10 sowie auf dem 5350.
 
Zuletzt bearbeitet:
Wie sucht man denn den Fehler, wenn der ominöse "Pro"-Treiber einfach abstürzt?
 
Zuletzt bearbeitet:
Entweder in /var/log/messages oder in /var/log/Xorg.0.log.
 
Das Treiberarchiv für Ubuntu herunterladen und im gleichen Verzeichnis platzieren und das Skript plus Paketnamen aufrufen. Alternativ Skript ohne Archivnamen aufrufen und der aufkommenden Abfrage den vollen Pfad zum Paket mitgeben. Der Rest geht dann automatisiert. Das Archiv wird entpackt, aus 3 der darin befindlichen .deb Pakete werden Dateien extrahiert und in einen gemeinsamen Verzeichnisbaum kopiert. Nach dem Erzeugen von Paketverwaltungsinformationen wird ein installierbares Paket erzeugt.

Klappt bei mir auf Ubuntu 19.04 (Kernel 5.0.0), man muss sich nicht auf Ubuntu 18.04.1 oder 18.04.2 beschränken, bzw. kann auch auf 18.04.1 den aktuelleren Treiber 19.10 einsetzen und vice versa.


Freue mich über jegliches Feedback!

Ich habe es mal bei der VII-FX-8350 Kombi unter Ubuntu 19.04 und mit dem 19.10er Treiber getestet.
Direkt nach dem runterladen funktionierte das Script nicht, erst als ich in den Zugriffsrechten der Datei das Häkchen bei "Datei als Programm ausführen" setzte funktionierte es.
Ich war dann den weiteren Anweisungen gefolgt, hatte die erzeugte "amdgpu-ocl_19.10-785425.deb" zusammen mit sudo gestartet und das Paket so installiert.
Danach lief die erste Universe WU aber so ganz glücklich scheint BOINC noch nicht zu sein weil es die GPU offenbar nicht so richtig erkennt.
Sa 25 Mai 2019 16:01:06 CEST | | OpenCL: AMD/ATI GPU 0: Unknown AMD GPU (driver version 2841.4 (PAL,HSAIL), device version OpenCL 2.0 AMD-APP (2841.4), 16192MB, 16192MB available, 13839 GFLOPS peak)
An die Rechenzeit unter Windows kommt diese Lösung allerdings bei weitem nicht ran denn hier steht es ca. 280 vs. ca 375 Sekunden.
 
Oh vergessen zu schreiben, es ging um Einstein.

--- Update ---

Nun habe ich auch noch etwas mit Seti experimentiert.
Auf Standard lief die WU ca. 400 Sekunden, mit den Programmparametern für die VII ist sie bei der ersten WU auf ca. 260 Sekunden gefallen und die ASIC Power ist dafür von ca. 160W auf ca. 200W gestiegen. Die GPU Auslastung hat sich also erheblich verbessert und dadurch die Rechenzeit deutlich gefallen.
 
Einstein hab ich unter Linux in 220s hinbekommen.
Oder 2 Stück in leicht unter 400s.

Bei Seti hab ich jetzt 2 WUs, die einfach stehen bleiben. Keinerlei Fortschritt mehr erkennbar. Wenn ich die kurz pausiere, sind sie danach "verdrängt". Es läuft aber sonst nichts auf der GPU.
Ich hab die Spannung der GPU manuell auf 1V runtergesetzt, vielleicht ist das schon zu wenig.

Das letzte Kernel-update hat ohnehin nicht so richtig gut funktioniert. Danach blieb der Bildschirm immer schwarz nach dem Login. Erst nachdem ich mal mit dem vorherigen Kernel gebootet hatte, ging es wieder. Ich hoffe nicht, dass sich der aktuelle Kernel nicht mehr mit dem Treiber verträgt.
 
Zuletzt bearbeitet:
Ich probiere hier eindeutig zu viel durcheinader rum....die Seti Geschichte bezog sich nämlich auf die Windows Installation. -.-
Bei denen habe ich allerdings beobachtet das die ersten ca. 20 Sekunden praktisch ausschließlich die CPU was zu tuen hat. Entweder ist die WU dann als kurzläufer durch oder es beginnt der GPU Part der Berechnung. Kann es sein dass sie bei dir stehen bleiben weil die GPU Berechnung nicht anspringt?
 
Am Anfang bleibt der Fortschritt ja bei 0% stehen. Erst wenn die GPU was zu tun hat, zählt es los.
Aber die 2 WUs blieben mitten drin stehen. Irgendwann fingen sie dann endlich von vorne an und waren durch.
So lange es Einzelfälle bleiben...

Ich probiere auch alles durcheinander. ;)
 
Wie bei mir, zu der Zeit des CPU Parts bleibt der Fortschrittsbalken bei 0 und entweder springt er dann auf 100% und die WU ist erledigt oder er fängt mit der Berechnung per GPU an und der Fortschrittsbalken läuft wie gewohnt ab. Früher lief das definitiv anders aber da war auch die Variabilität der Laufzeit erheblich größer.
 
Ich habe es mal bei der VII-FX-8350 Kombi unter Ubuntu 19.04 und mit dem 19.10er Treiber getestet.
Direkt nach dem runterladen funktionierte das Script nicht, erst als ich in den Zugriffsrechten der Datei das Häkchen bei "Datei als Programm ausführen" setzte funktionierte es.
Ich war dann den weiteren Anweisungen gefolgt, hatte die erzeugte "amdgpu-ocl_19.10-785425.deb" zusammen mit sudo gestartet und das Paket so installiert.
Danach lief die erste Universe WU aber so ganz glücklich scheint BOINC noch nicht zu sein weil es die GPU offenbar nicht so richtig erkennt.

An die Rechenzeit unter Windows kommt diese Lösung allerdings bei weitem nicht ran denn hier steht es ca. 280 vs. ca 375 Sekunden.

Zuvor hatte BOINC die Karte garnicht erkannt?
Bis auf unknown AMD GPU sieht der device/Version string sonst ja gut und nach amdgpu-pro openCL aus. Die Laufzeiten müssten analog dem amdgpu-pro auf zB. Ubuntu 18.04 sein, sind ja die gleichen Dateien... Warum sie nun so langsam sind ist mir rätselhaft.
 
Nö zuvor konnte BOINC mit der Karte nichts anfangen.
Ich vermute mal dass die Karte nicht richtig takten kann weil sie an sich nicht korrekt erkannt wird.
Nun ja, ich habe für meine Versuche erstmal wieder Windows genutzt und beschäftige mich später wieder mit Linux.
 
Du kannst ja unter Linux dann mit den amdgpu-utils (amdgpu-monitor) schauen in welchm Pstate die läuft.
 
Wie bekomme ich eine HD7770 unter Mint 19.1 zum crunchen? Habe alles gelesen aber so richtig steige ich da nicht durch. Das Meiste scheint für neuere Karten zu sein oder ist langsam weil open source. clinfo zeigt 0 devices. Hat jemand ne Kurzanleitung was ich wo herunterladen muss und welche Befehle ich copy/paste'n kann ;)
 
Zurück
Oben Unten