Linux/AMD GPU/Collatz -> nur Berechnungsfehler Was mache ich falsch?

TAL9000

Grand Admiral Special
Mitglied seit
20.03.2007
Beiträge
5.945
Renomée
654
Standort
nähe Giessen
Servus

Nach der erfolglosen Suche mit verschiedenen Begriffen gebe ich mal auf und frage hier:

Habe Linux (L)ubuntu 14.04.1 mit einer HD7950 und den dazu gehörigen fglrx fglrx-core fglrx-amdcccle Paketen sowie dem AMD-APP-SDK-linux-v2.9-1.599.381-GA-x64 installiert.

Leider bricht jede Collatz WU ab:
https://boinc.thesonntags.com/collatz/results.php?hostid=841022
Code:
<core_client_version>7.2.42</core_client_version>
<![CDATA[
<message>
process exited with code 1 (0x1, -255)
</message>
<stderr_txt>
Collatz Conjecture Sieve 1.40 Linux x86_64 for OpenCL
Written by Slicker (Jon Sonntag) of team SETI.USA
Based on the AMD Brook+ kernels by Gipsel of team Planet 3DNow!
Sieve code and OpenCL optimization provided by Sosiris of team BOINC@Taiwan
Processor Type      ATI
LLVM ERROR: Cannot select: 0x2202050: i32 = setcc 0x2201340, 0x25070a0, 0x2201f50 [ORD=14] [ID=50]
  0x2201340: i64 = add 0x25070a0, 0x2507da0 [ORD=10] [ID=46]
    0x25070a0: i64 = AMDILISD::VEXTRACT 0x2508f30, 0x2508630 [ORD=9] [ID=36]
      0x2508f30: v2i64,ch = CopyFromReg 0x263d590, 0x2508e30 [ORD=9] [ID=30]
        0x2508e30: v2i64 = Register %vreg38 [ORD=9] [ID=2]
      0x2508630: i32 = TargetConstant<1> [ORD=2] [ID=21]
    0x2507da0: i64 = add 0x2507aa0, 0x2507ca0 [ORD=8] [ID=45]
      0x2507aa0: i64,ch = load 0x263d590, 0x25075a0, 0x25076a0<LD4[%arrayidx], zext from i32> [ORD=5] [ID=44]
        0x25075a0: i32 = add 0x2508930, 0x25074a0 [ORD=3] [ID=43]
          0x2508930: i32,ch = CopyFromReg 0x263d590, 0x2508830 [ORD=3] [ID=29]
            0x2508830: i32 = Register %vreg35 [ORD=3] [ID=1]
          0x25074a0: i32 = shl 0x2201a50, 0x25073a0 [ORD=3] [ID=42]
            0x2201a50: i32 = AMDILISD::VEXTRACT 0x2509330, 0x2508630 [ORD=2] [ID=38]
              0x2509330: v4i32 = llvm.AMDIL.get.global.id 0x2509230 [ORD=1] [ID=32]
                0x2509230: i32 = TargetConstant<2976> [ORD=1] [ID=4]
              0x2508630: i32 = TargetConstant<1> [ORD=2] [ID=21]
            0x25073a0: i32 = Constant<2> [ORD=3] [ID=7]
        0x25076a0: i32 = undef [ORD=4] [ID=8]
      0x2507ca0: i64 = shl 0x25079a0, 0x2507ba0 [ORD=7] [ID=40]
        0x25079a0: i64 = zero_extend 0x2509130 [ORD=6] [ID=37]
          0x2509130: i32,ch = CopyFromReg 0x263d590, 0x2509030 [ORD=6] [ID=31]
            0x2509030: i32 = Register %vreg39 [ORD=6] [ID=3]
        0x2507ba0: i32 = Constant<26> [ORD=7] [ID=9]
  0x25070a0: i64 = AMDILISD::VEXTRACT 0x2508f30, 0x2508630 [ORD=9] [ID=36]
    0x2508f30: v2i64,ch = CopyFromReg 0x263d590, 0x2508e30 [ORD=9] [ID=30]
      0x2508e30: v2i64 = Register %vreg38 [ORD=9] [ID=2]
    0x2508630: i32 = TargetConstant<1> [ORD=2] [ID=21]
In function: __OpenCL_kernelSteps_kernel

</stderr_txt>
]]>
Unter Win7 läuft selbe HW Konfig ohne Probleme, würde es aber gerne auch unter Linux mal zum laufen kriegen.

Versucht habe ich das OpenCL2 Paket von AMD https://support.amd.com/en-us/kb-articles/Pages/OpenCL2-Driver.aspx https://www2.ati.com/drivers/linux-amd-14.41rc1-opencl2-sep19.zip -> machte keinen Unterschied.

Was könnte ich noch ausprobieren. Das Problem habe ich übrigens auch mit einer HD5770 und HD6770...

Prime läuft z.B. Problem wurde hier schon mal gepostet, habe jedoch keine Antwort darauf gefunden.

TAL9000
 
Push und aktueller Fehler mit System
Intel Xeon X3220
Intel Desktop Board DQ965GF
Sapphire Vapor-X Radeon HD 5770
Linux 14.04.1
Code:
<core_client_version>7.2.42</core_client_version>
<![CDATA[
<message>
process exited with code 230 (0xe6, -26)
</message>
<stderr_txt>
Collatz Conjecture Sieve 1.40 Linux x86_64 for OpenCL
Written by Slicker (Jon Sonntag) of team SETI.USA
Based on the AMD Brook+ kernels by Gipsel of team Planet 3DNow!
Sieve code and OpenCL optimization provided by Sosiris of team BOINC@Taiwan
Processor Type      ATI
Device Vendor       Advanced Micro Devices, Inc.
Name                Juniper
Driver Version      1800.11
OpenCL Version      OpenCL 1.2 AMD-APP (1800.11)
The verification of the steps for 5397102675252236777471 failed. The OpenCL device calculated 4294967295 vs 504 steps by the CPU. Processing aborted.
Error: GPU steps do not match CPU steps.  Workunit processing aborted.
18:43:07 (8206): called boinc_finish

</stderr_txt>
]]>
 
Zurück
Oben Unten