10. Pentathlon 2019 - Einstein@home (Querfeldein)

man lernt nie aus beim Penta erst baut man VMs dann baut man virtuelle Boinc sessions wo wird das noch hinführen :)
 
Hat einer ne passende App config für die Vega 8 des Ryzen 5 2500U zur Hand?
Wo muss die nochmal hin,in den Data-Ordner?
 
Hat einer ne passende App config für die Vega 8 des Ryzen 5 2500U zur Hand?
Wo muss die nochmal hin,in den Data-Ordner?

Ich würd die erstmal @default probieren und mir die GPU- und Memory-Controller Auslastung anschauen. Im Gegensatz zu den "richtigen" Vega-Karten nuckelt die Vega 8 des Ryzen 5 2500U ja am DDR4-Speicher des Gesamtsystems. Da ist wohl nicht viel Luft, mit 2 Threads das Interface besser auslasten zu wollen; das wird schon ordentlich ausgelastet sein :o
 
Hat einer ne passende App config für die Vega 8 des Ryzen 5 2500U zur Hand?
Wo muss die nochmal hin,in den Data-Ordner?

Also ich habe auch eine Vega 8 im Ryzen 3 2200G. Und mit Threads ist man nur 4 Minuten schneller. Macht also wenig Sinn.
 
Jetzt, wo der Bunker mit 1000 WUs gefüllt ist, rechnet die VII plötzlich sehr viel langsamer. :(
Entweder liegt es am verringerten CPU-Takt (3 statt 3,6GHz) oder daran, dass die CPU auch mit rechnet (egal ob ein halber oder ganzer CPU-Kern für Einstein frei bleibt)
 
Ja, das dachte ich ja auch.
Nur in Bionc hat der je 2 WUs und das verteilt auf Device 0 und 1 ???
Da ist aber nur eine Vega8 drin nix extra.
 
Es liegt definitiv an den CPU-Tasks. Mit pausiertem NFS geht es sofort wieder auf 3:50 runter.
Ich probier jetzt noch mal mit 13 oder 12 Tasks für die CPU.
Aber dann bleibt für NFS viel auf der Strecke.
 
hast du ne app_config?
Dann bau mal

<cpu_usage>1</cpu_usage>

mit ein.

der ganze Abschniit bei mir:

<gpu_versions>
<gpu_usage>0.5</gpu_usage> <- kannst Du wahrscheinlich weg lassen?
<cpu_usage>1</cpu_usage>
</gpu_versions>
 
Ich hab direkt im Boinc-Manager auf 95% gestellt gehabt, dann ist ja ein Thread frei.
Mit 3 freien Threads, also 85% geht es jetzt in Richtung 4:20.
Ich denke, das ist ein guter Kompromiss.

--- Update ---

Ist das eigentlich gewollt, dass der P3D-Cluster die letzten Tage täglich gut 6 Mio bei Einstein raushaut?
Oder wurde da eine Bunkertür vergessen?
 
Vermutlich rotzt der einfach so volle Pulle alles raus :D
 
Muss ich bei drei AMD Karten im Rechner VGA Dummys anschließen oder wieso rechnet nur eine davon Einstein? Collatz geht auf allen dreien.
 
Irgendwelche <exclude_gpu>-Einträge in der cc_config? <use_all_gpus>1</use_all_gpus> vorhanden?
Ich habe nur einen mit zwei gleichen AMD Karten und da funktioniert das.
Da muss wohl many-multi-GPU-Spezialist sompe ran.
 
Vermutlich rotzt der einfach so volle Pulle alles raus :D
Wenn wir das mal eben 3 Tage zurückhalten könnten, wären das gut 18 Mio.
Aber vermutlich ist es ja nicht nur eine Hand voll Rechner, sondern mehrere kleine Grüppchen von Rechnern bei zig Leuten ?
 
Irgendwelche <exclude_gpu>-Einträge in der cc_config? <use_all_gpus>1</use_all_gpus> vorhanden?
Ich habe nur einen mit zwei gleichen AMD Karten und da funktioniert das.
Da muss wohl many-multi-GPU-Spezialist sompe ran.

es geht auf einmal wie durch zauberhand*noahnung*
 
Kann man BOINC dazu zwingen eine GPU nicht zu nutzen? Er erkennt bei mir die eine Karte zwei mal und führt nun auf dieser vier Berechnungen parallel aus....
 
Dann stell doch zurück auf nur eine WU pro Karte. Dann hast Du nur noch 2.
 
Kann man BOINC dazu zwingen eine GPU nicht zu nutzen? Er erkennt bei mir die eine Karte zwei mal und führt nun auf dieser vier Berechnungen parallel aus....
Ja.
In meiner cc_config hab ich gleich mehrere Projekte für bestimmte GPUs ausgeschlossen:
Code:
<options>
        <no_alt_platform>0</no_alt_platform>
        <ncpus>8</ncpus>
        <use_all_gpus>1</use_all_gpus>
        <report_results_immediately>0</report_results_immediately>
        <exclude_gpu>
         <url>http://milkyway.cs.rpi.edu/milkyway/</url>
         <device_num>1</device_num>                                                                                                                                                                                  
        </exclude_gpu>                                                                                                                                                                                               
        <exclude_gpu>                                                                                                                                                                                                
         <url>http://boinc.thesonntags.com/collatz/</url>                                                                                                                                                            
         <device_num>2</device_num>                                                                                                                                                                                  
        </exclude_gpu>                                                                                                                                                                                               
        <exclude_gpu>                                                                                                                                                                                                
         <url>http://einstein.phys.uwm.edu/</url>                                                                                                                                                                    
         <device_num>3</device_num>                                                                                                                                                                                  
        </exclude_gpu>                                                                                                                                                                                               
        <exclude_gpu>                                                                                                                                                                                                
         <url>http://setiathome.berkeley.edu/</url>                                                                                                                                                                  
         <device_num>1</device_num>                                                                                                                                                                                  
        </exclude_gpu>                                                                                                                                                                                               
  </options>
 
Bei mir läuft als Test eine WU mit Standard-Einstellungen.
Muss ich etwas anpassen auch wenn die sauber durchläuft?

Anwendung
Gamma-ray pulsar binary search #1 on GPUs 1.18 (FGRPopencl1K-ati)
Name
LATeah1049X_180.0_0_0.0_42556052
Ressourcen
1 CPU + 1 AMD/ATI GPU
 
Viel zu optimieren gibt es nicht bei Einstein.
Erst bei sehr schnellen Karten lohnt sich eine 2. WU parallel.
 
Ja.
In meiner cc_config hab ich gleich mehrere Projekte für bestimmte GPUs ausgeschlossen:
Code:
<options>
        <no_alt_platform>0</no_alt_platform>
        <ncpus>8</ncpus>
        <use_all_gpus>1</use_all_gpus>
        <report_results_immediately>0</report_results_immediately>
        <exclude_gpu>
         <url>http://milkyway.cs.rpi.edu/milkyway/</url>
         <device_num>1</device_num>                                                                                                                                                                                  
        </exclude_gpu>                                                                                                                                                                                               
        <exclude_gpu>                                                                                                                                                                                                
         <url>http://boinc.thesonntags.com/collatz/</url>                                                                                                                                                            
         <device_num>2</device_num>                                                                                                                                                                                  
        </exclude_gpu>                                                                                                                                                                                               
        <exclude_gpu>                                                                                                                                                                                                
         <url>http://einstein.phys.uwm.edu/</url>                                                                                                                                                                    
         <device_num>3</device_num>                                                                                                                                                                                  
        </exclude_gpu>                                                                                                                                                                                               
        <exclude_gpu>                                                                                                                                                                                                
         <url>http://setiathome.berkeley.edu/</url>                                                                                                                                                                  
         <device_num>1</device_num>                                                                                                                                                                                  
        </exclude_gpu>                                                                                                                                                                                               
  </options>

Danke.... irgendwas stimmt aber mit meinem BOINC nicht. Ich habe eben noch mal neugestartet weil der Lüfter von der einen Karte an einem Kabel schliff und ich das beheben wollte... Jetzt hab ich vier mal die eine Karte B im BM und die Karte A gar nicht....
 
Öhm, das ist wirklich seltsam. Was zeigt denn clinfo, auch so viele?
 
Code:
Number of platforms:                             2
  Platform Profile:                              FULL_PROFILE
  Platform Version:                              OpenCL 2.1 AMD-APP (2766.5)
  Platform Name:                                 AMD Accelerated Parallel Processing
  Platform Vendor:                               Advanced Micro Devices, Inc.
  Platform Extensions:                           cl_khr_icd cl_khr_d3d10_sharing cl_khr_d3d11_sharing cl_khr_dx9_media_sharing cl_amd_event_callback cl_amd_offline_devices
  Platform Profile:                              FULL_PROFILE
  Platform Version:                              OpenCL 2.1 AMD-APP (2766.5)
  Platform Name:                                 AMD Accelerated Parallel Processing
  Platform Vendor:                               Advanced Micro Devices, Inc.
  Platform Extensions:                           cl_khr_icd cl_khr_d3d10_sharing cl_khr_d3d11_sharing cl_khr_dx9_media_sharing cl_amd_event_callback cl_amd_offline_devices


  Platform Name:                                 AMD Accelerated Parallel Processing
Number of devices:                               2
  Device Type:                                   CL_DEVICE_TYPE_GPU
  Vendor ID:                                     1002h
  Board name:                                    Radeon RX 580 Series
  Device Topology:                               PCI[ B#29, D#0, F#0 ]
  Max compute units:                             64
  Max work items dimensions:                     3
    Max work items[0]:                           1024
    Max work items[1]:                           1024
    Max work items[2]:                           1024
  Max work group size:                           256
  Preferred vector width char:                   4
  Preferred vector width short:                  2
  Preferred vector width int:                    1
  Preferred vector width long:                   1
  Preferred vector width float:                  1
  Preferred vector width double:                 1
  Native vector width char:                      4
  Native vector width short:                     2
  Native vector width int:                       1
  Native vector width long:                      1
  Native vector width float:                     1
  Native vector width double:                    1
  Max clock frequency:                           1000Mhz
  Address bits:                                  64
  Max memory allocation:                         4026531840
  Image support:                                 Yes
  Max number of images read arguments:           128
  Max number of images write arguments:          64
  Max image 2D width:                            16384
  Max image 2D height:                           16384
  Max image 3D width:                            2048
  Max image 3D height:                           2048
  Max image 3D depth:                            2048
  Max samplers within kernel:                    16
  Max size of kernel argument:                   1024
  Alignment (bits) of base address:              2048
  Minimum alignment (bytes) for any datatype:    128
  Single precision floating point capability
    Denorms:                                     No
    Quiet NaNs:                                  Yes
    Round to nearest even:                       Yes
    Round to zero:                               Yes
    Round to +ve and infinity:                   Yes
    IEEE754-2008 fused multiply-add:             Yes
  Cache type:                                    Read/Write
  Cache line size:                               64
  Cache size:                                    16384
  Global memory size:                            4294967296
  Constant buffer size:                          4026531840
  Max number of constant args:                   8
  Local memory type:                             Scratchpad
  Local memory size:                             32768
  Max pipe arguments:                            16
  Max pipe active reservations:                  16
  Max pipe packet size:                          4026531840
  Max global variable size:                      3623878656
  Max global variable preferred total size:      4294967296
  Max read/write image args:                     64
  Max on device events:                          1024
  Queue on device max size:                      8388608
  Max on device queues:                          1
  Queue on device preferred size:                262144
  SVM capabilities:
    Coarse grain buffer:                         Yes
    Fine grain buffer:                           Yes
    Fine grain system:                           No
    Atomics:                                     No
  Preferred platform atomic alignment:           0
  Preferred global atomic alignment:             0
  Preferred local atomic alignment:              0
  Kernel Preferred work group size multiple:     64
  Error correction support:                      0
  Unified memory for Host and Device:            0
  Profiling timer resolution:                    1
  Device endianess:                              Little
  Available:                                     Yes
  Compiler available:                            Yes
  Execution capabilities:
    Execute OpenCL kernels:                      Yes
    Execute native function:                     No
  Queue on Host properties:
    Out-of-Order:                                No
    Profiling :                                  Yes
  Queue on Device properties:
    Out-of-Order:                                Yes
    Profiling :                                  Yes
  Platform ID:                                   00007FFB34C66FD0
  Name:                                          Fiji
  Vendor:                                        Advanced Micro Devices, Inc.
  Device OpenCL C version:                       OpenCL C 2.0
  Driver version:                                2766.5
  Profile:                                       FULL_PROFILE
  Version:                                       OpenCL 2.0 AMD-APP (2766.5)
  Extensions:                                    cl_khr_fp64 cl_amd_fp64 cl_khr_global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extended_atomics cl_khr_int64_base_atomics cl_khr_int64_extended_atomics cl_khr_3d_image_writes cl_khr_byte_addressable_store cl_khr_fp16 cl_khr_gl_sharing cl_khr_gl_depth_images cl_amd_device_attribute_query cl_amd_vec3 cl_amd_printf cl_amd_media_ops cl_amd_media_ops2 cl_amd_popcnt cl_khr_d3d10_sharing cl_khr_d3d11_sharing cl_khr_dx9_media_sharing cl_khr_image2d_from_buffer cl_khr_spir cl_khr_subgroups cl_khr_gl_event cl_khr_depth_images cl_khr_mipmap_image cl_khr_mipmap_image_writes cl_amd_liquid_flash cl_amd_planar_yuv


  Device Type:                                   CL_DEVICE_TYPE_GPU
  Vendor ID:                                     1002h
  Board name:                                    Radeon RX 580 Series
  Device Topology:                               PCI[ B#30, D#0, F#0 ]
  Max compute units:                             36
  Max work items dimensions:                     3
    Max work items[0]:                           1024
    Max work items[1]:                           1024
    Max work items[2]:                           1024
  Max work group size:                           256
  Preferred vector width char:                   4
  Preferred vector width short:                  2
  Preferred vector width int:                    1
  Preferred vector width long:                   1
  Preferred vector width float:                  1
  Preferred vector width double:                 1
  Native vector width char:                      4
  Native vector width short:                     2
  Native vector width int:                       1
  Native vector width long:                      1
  Native vector width float:                     1
  Native vector width double:                    1
  Max clock frequency:                           1360Mhz
  Address bits:                                  64
  Max memory allocation:                         4026531840
  Image support:                                 Yes
  Max number of images read arguments:           128
  Max number of images write arguments:          64
  Max image 2D width:                            16384
  Max image 2D height:                           16384
  Max image 3D width:                            2048
  Max image 3D height:                           2048
  Max image 3D depth:                            2048
  Max samplers within kernel:                    16
  Max size of kernel argument:                   1024
  Alignment (bits) of base address:              2048
  Minimum alignment (bytes) for any datatype:    128
  Single precision floating point capability
    Denorms:                                     No
    Quiet NaNs:                                  Yes
    Round to nearest even:                       Yes
    Round to zero:                               Yes
    Round to +ve and infinity:                   Yes
    IEEE754-2008 fused multiply-add:             Yes
  Cache type:                                    Read/Write
  Cache line size:                               64
  Cache size:                                    16384
  Global memory size:                            4294967296
  Constant buffer size:                          4026531840
  Max number of constant args:                   8
  Local memory type:                             Scratchpad
  Local memory size:                             32768
  Max pipe arguments:                            16
  Max pipe active reservations:                  16
  Max pipe packet size:                          4026531840
  Max global variable size:                      3623878656
  Max global variable preferred total size:      4294967296
  Max read/write image args:                     64
  Max on device events:                          1024
  Queue on device max size:                      8388608
  Max on device queues:                          1
  Queue on device preferred size:                262144
  SVM capabilities:
    Coarse grain buffer:                         Yes
    Fine grain buffer:                           Yes
    Fine grain system:                           No
    Atomics:                                     No
  Preferred platform atomic alignment:           0
  Preferred global atomic alignment:             0
  Preferred local atomic alignment:              0
  Kernel Preferred work group size multiple:     64
  Error correction support:                      0
  Unified memory for Host and Device:            0
  Profiling timer resolution:                    1
  Device endianess:                              Little
  Available:                                     Yes
  Compiler available:                            Yes
  Execution capabilities:
    Execute OpenCL kernels:                      Yes
    Execute native function:                     No
  Queue on Host properties:
    Out-of-Order:                                No
    Profiling :                                  Yes
  Queue on Device properties:
    Out-of-Order:                                Yes
    Profiling :                                  Yes
  Platform ID:                                   00007FFB34C66FD0
  Name:                                          Ellesmere
  Vendor:                                        Advanced Micro Devices, Inc.
  Device OpenCL C version:                       OpenCL C 2.0
  Driver version:                                2766.5
  Profile:                                       FULL_PROFILE
  Version:                                       OpenCL 2.0 AMD-APP (2766.5)
  Extensions:                                    cl_khr_fp64 cl_amd_fp64 cl_khr_global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extended_atomics cl_khr_int64_base_atomics cl_khr_int64_extended_atomics cl_khr_3d_image_writes cl_khr_byte_addressable_store cl_khr_fp16 cl_khr_gl_sharing cl_khr_gl_depth_images cl_amd_device_attribute_query cl_amd_vec3 cl_amd_printf cl_amd_media_ops cl_amd_media_ops2 cl_amd_popcnt cl_khr_d3d10_sharing cl_khr_d3d11_sharing cl_khr_dx9_media_sharing cl_khr_image2d_from_buffer cl_khr_spir cl_khr_subgroups cl_khr_gl_event cl_khr_depth_images cl_khr_mipmap_image cl_khr_mipmap_image_writes cl_amd_liquid_flash cl_amd_planar_yuv


  Platform Name:                                 AMD Accelerated Parallel Processing
Number of devices:                               2
  Device Type:                                   CL_DEVICE_TYPE_GPU
  Vendor ID:                                     1002h
  Board name:                                    Radeon RX 580 Series
  Device Topology:                               PCI[ B#29, D#0, F#0 ]
  Max compute units:                             64
  Max work items dimensions:                     3
    Max work items[0]:                           1024
    Max work items[1]:                           1024
    Max work items[2]:                           1024
  Max work group size:                           256
  Preferred vector width char:                   4
  Preferred vector width short:                  2
  Preferred vector width int:                    1
  Preferred vector width long:                   1
  Preferred vector width float:                  1
  Preferred vector width double:                 1
  Native vector width char:                      4
  Native vector width short:                     2
  Native vector width int:                       1
  Native vector width long:                      1
  Native vector width float:                     1
  Native vector width double:                    1
  Max clock frequency:                           1000Mhz
  Address bits:                                  64
  Max memory allocation:                         4026531840
  Image support:                                 Yes
  Max number of images read arguments:           128
  Max number of images write arguments:          64
  Max image 2D width:                            16384
  Max image 2D height:                           16384
  Max image 3D width:                            2048
  Max image 3D height:                           2048
  Max image 3D depth:                            2048
  Max samplers within kernel:                    16
  Max size of kernel argument:                   1024
  Alignment (bits) of base address:              2048
  Minimum alignment (bytes) for any datatype:    128
  Single precision floating point capability
    Denorms:                                     No
    Quiet NaNs:                                  Yes
    Round to nearest even:                       Yes
    Round to zero:                               Yes
    Round to +ve and infinity:                   Yes
    IEEE754-2008 fused multiply-add:             Yes
  Cache type:                                    Read/Write
  Cache line size:                               64
  Cache size:                                    16384
  Global memory size:                            4294967296
  Constant buffer size:                          4026531840
  Max number of constant args:                   8
  Local memory type:                             Scratchpad
  Local memory size:                             32768
  Max pipe arguments:                            16
  Max pipe active reservations:                  16
  Max pipe packet size:                          4026531840
  Max global variable size:                      3623878656
  Max global variable preferred total size:      4294967296
  Max read/write image args:                     64
  Max on device events:                          1024
  Queue on device max size:                      8388608
  Max on device queues:                          1
  Queue on device preferred size:                262144
  SVM capabilities:
    Coarse grain buffer:                         Yes
    Fine grain buffer:                           Yes
    Fine grain system:                           No
    Atomics:                                     No
  Preferred platform atomic alignment:           0
  Preferred global atomic alignment:             0
  Preferred local atomic alignment:              0
 
Es werden auf jeden Fall auf der Nano, als auch auf der RX580 jetzt Berechnungen ausgeführt. Ich fass da erstmal nix an *buck*
 
Irgendwie rechnet meine RX480 total lahm, 22+min bei 2WUs gleichzeitig....

Takt ist stabil, Auslasung ist gut... was übersehe ich?

Ich hab hier ne RX 480 Reddevil bei 1250, 1,07V und OC-Ram mit 2050MHz.
Die zieht zwei WUs in stabilen 18:38-18:48 durch.
Ram hochziehen bringen einiges bei Einstein, wenn ich mich recht entsinne.
Wenn Du Samsungspeicher hast tu es unbedingt. Der läuft am Besten.

Sys ist Win 10 x64, alle Updates mit Treiber 19.4.1, 1800X mit 3200er Ramtakt.

--- Update ---

Kann man BOINC dazu zwingen eine GPU nicht zu nutzen? Er erkennt bei mir die eine Karte zwei mal und führt nun auf dieser vier Berechnungen parallel aus....
Das Problem hab ich aufm Huawei Matebook auch.
Welcher Treiber? 19.4.1?
 
Zuletzt bearbeitet:
Zurück
Oben Unten