Seite 1 von 53 123451151 ... LetzteLetzte
Ergebnis 1 bis 25 von 1311
  1. Beitrag #1
    Themenstarter
    Grand Admiral
    Special
    Grand Admiral
    Avatar von nazgul99
    • Mein System
      Notebook
      Modell: ThinkPad Edge E145 / 8GB / M500 480GB / Kubuntu /// Asus U38N / 6GB / Matt / Postville / Kubuntu/W8
      Desktopsystem
      Prozessor: AMD A10-7800
      Mainboard: MSI A88XI AC
      Kühlung: Scythe Shuriken Rev.2
      Arbeitsspeicher: 2x 8GB DDR3-2133
      Grafikkarte: IGP
      Display: HP LP2465, MVA, 1920x1200, 24"
      SSD(s): Samsung 850 EVO 500GB
      Festplatte(n): ST9500325AS 500GB
      Optische Laufwerke: ja, so'n USB-Dings
      Soundkarte: onboard, optisch -> SMSL Q5 PRO -> ELAC EL60
      Gehäuse: Silverstone ML06B
      Netzteil: SST-ST30SF
      Betriebssystem(e): Kubuntu
      Browser: Firefox
      Sonstiges: Synology DS414slim 3x 1,5 TB RAID5

    Registriert seit
    01.05.2005
    Ort
    Irgendwo in der Nähe
    Beiträge
    3.573
    Danke Danke gesagt 
    319
    Danke Danke erhalten 
    181

    Carrizo - volles HSA, UVD6/VCE3.1/ACP2, HDMI 2.0 - und: SOC, aber immernoch DDR3?

    Hiermit sei der Carrizo-Speku-Thread eröffnet
    An dieser Stelle sei alles spekuliert, was die komplette APU inkl. GPU und HSA angeht, für die CPU-Kern-Architektur gibt's hier nen Excavator-Thread.


    Computerbase hat hier eine angebliche AMD-Folie gepostet, welche Carrizos Features und Verbesserungen zusammenfasst:



    Dass Carrizo das erste wirklich vollständige HSA-Design werden soll (was genau Kaveri noch fehlt, mag sicher jemand raussuchen, es gab mal Folien mit Jahreszahlen und den dann jeweils abzuschließenden Implementationsschritten). Interessant finde ich vor allem folgendes:

    • Es wird ein SOC
    • UVD6: 9-18x 1080p h.264 30fps Decodierung (=270-540fps?)
    • VCE3.1: 9x 30fps 1080p h.264 Encodierung (=270 fps?)
    • Leider von h.265 (noch?) nix zu lesen
    • Leider keine Angaben zu Qualitätsverbesserungen beim Encodieren
    • Audio Co-Prozessor ACP2, was auch immer daran besser wird
    • Immernoch DDR3
    • Display Controller DCE11 mit HDMI 2.0 (bis zu 3 Kanäle)
    • Da SOC: PCIe 3.0 für Grafik nur noch 8x, sonstiges 4x
    • Wireless Display (Miracast, kann Kaveri das schon?)
    • Connected Standby, die andren Punkte dahinter sagen mir nix: STAPM, PPT/TDC/EDC tracking, BBB
    • Wg. SOC auch hier nur noch 2 integrierte SATA-Ports
    • Nur vom Lötsockel (BGA) die Rede, TDPs 12-35 Watt


    STAPM oder die folgenden Kürzel könnten auf die im CPU-Träger integrierten Power-Regulatoren zutreffen, ich glaub bei Heise gab's mal ne Meldung, dass AMD hier Intels Beispiel folgen will. Das gibt vor allem die Möglichkeit für sehr niedrige (Connected) Standby- und Lowpower-Leistungsaufnahmen. Connected Standby könnte wie bei Mullins auch mittels eines integrierten ARM-Cores erledigt werden.

    Ach ja, ~30% Performance-Verbesserung bei 15 Watt sind angesagt, wobei es nach meinem Wissensstand gar keine 15W-Kaveri gibt (die schnellsten haben 19 Watt). Ob damit die CPU-Kerne oder die Gesamtleistung inkl. GPU-Shader gemeint ist, bleibt unklar. Man darf tippen, dass AMD bei ner APU die Gesamtleistung inkl. GPU meint. FredD (wie oft soll ich denn noch danke sagen? ) hat recht, da steht klar, dass von den Excavator- (XV-)Kernen die Rede ist.

    Ich finde das Paket insgesamt sehr gelungen, zumindest wenn man auf den Mobilsektor schaut. Ich begrüße die Ausführung als SOC! Klassische Desktop-Kunden dürften eher enttäuscht sein ob der beschnittenenen PCIe- und SATA-Lanes. DDR4 wäre natürlich ebenfalls wünschenswert, auch für's Notebook. Dass es ein separates Die für Desktops geben wird, halte ich für sehr unwahrscheinlich.
    Miniaturansichten angehängter Grafiken Miniaturansichten angehängter Grafiken Klicke auf die Grafik für eine größere Ansicht 

Name:	carrizo.jpg 
Hits:	7271 
Größe:	302,7 KB 
ID:	30725  
    Geändert von nazgul99 (16.07.2014 um 19:45 Uhr) Grund: Ups "fill" statt "full", hab's denn gleich mal eingedeutscht
    Norddeutsch und subjektiv.

  2. Die folgenden 10 Benutzer sagen Danke zu nazgul99 für diesen nützlichen Beitrag:

    Athlonix (04.03.2016), Bartfratze (18.07.2014), FredD (16.07.2014), gruffi (16.07.2014), isigrim (16.07.2014), Marius87 (02.01.2016), WindHund (22.07.2014), Woerns (16.07.2014)

  3. Beitrag #2
    Admiral
    Special
    Admiral
    Avatar von Atombossler
    • Mein System
      Notebook
      Modell: Thinkpad 8
      Desktopsystem
      Prozessor: A8-7600@3.25Ghz
      Mainboard: Asus A88X-PRO
      Kühlung: NoFan CR80 EH
      Arbeitsspeicher: 16Gb G-Skill Trident-X DDR3 2400
      Grafikkarte: APU
      Display: Acer UHD 4K2K
      SSD(s): Samsung 850 PRO
      Festplatte(n): 2xSamsung 1TB HDD (2,5")
      Optische Laufwerke: Plexi BD-RW
      Soundkarte: OnBoard Geraffel
      Gehäuse: Define R2
      Netzteil: BeQuiet
      Betriebssystem(e): Win7x64-PRO
      Browser: Chrome

    Registriert seit
    28.04.2013
    Ort
    Andere Sphären
    Beiträge
    1.285
    Danke Danke gesagt 
    1
    Danke Danke erhalten 
    41
    Zitat Zitat von nazgul99 Beitrag anzeigen
    Hiermit sei der Carrizo-Speku-Thread eröffnet


    Ach ja, ~30% Performance-Verbesserung bei 15 Watt sind angesagt, wobei es nach meinem Wissensstand gar keine 15W-Kaveri gibt (die schnellsten haben 19 Watt).
    Marketingrechnung: 15% bessere Performance der Cores + 4Watt weniger Verbrauch, fertig sind die 30% Leistungsplus.

    Zitat Zitat von nazgul99
    Ich finde das Paket insgesamt sehr gelungen, zumindest wenn man auf den Mobilsektor schaut. Ich begrüße die Ausführung als SOC! Klassische Desktop-Kunden dürften eher enttäuscht sein ob der beschnittenenen PCIe- und SATA-Lanes.
    Die sollte eigentlich der Chipsatz übernehmen und die entsprechenden Teile im SOC deaktiviert sein.
    So ist das wohl angedacht.

    Zitat Zitat von nazgul99
    DDR4 wäre natürlich ebenfalls wünschenswert, auch für's Notebook. Dass es ein separates Die für Desktops geben wird, halte ich für sehr unwahrscheinlich.
    Hot Dog, lecker und knusprig!

  4. Beitrag #3
    Grand Admiral
    Special
    Grand Admiral
    Avatar von hoschi_tux
    • Mein System
      Desktopsystem
      Prozessor: AMD Athlon X4 860K
      Mainboard: MSI A88XM Gaming
      Kühlung: Noctua NH-U12P
      Arbeitsspeicher: 2x 4GB Corsair Vengeance PC3-17066U, 2x 8GB GSkill Ares PC3-17066U
      Grafikkarte: PowerColor RX Vega 56 (Ref)
      Display: LG W2600HP, 26", 1920x1200
      Festplatte(n): Crucial M550 128GB, Crucial M550 512GB, WD7500BPKT
      Soundkarte: onboard
      Gehäuse: Cooler Master Silencio 352M
      Netzteil: Antec TruePower Classic 550W
      Betriebssystem(e): Gentoo 64Bit, Win 7 64Bit
      Browser: Firefox
    • Mein DC

      hoschi_tux beim Distributed Computing

      Aktuelle Projekte: Einstein@Home, Predictor@Home, QMC@Home, Rectilinear Crossing No., Seti@Home, Simap, Spinhenge, POEM
      Lieblingsprojekt: Seti/Spinhenge
      Mitglied der Kavallerie: Nein
      BOINC-Statistiken:

    Registriert seit
    08.03.2007
    Ort
    Ilmenau
    Beiträge
    2.915
    Danke Danke gesagt 
    31
    Danke Danke erhalten 
    18
    Ich weiß nicht was ich von dem halbierten L2 Cache halten soll..
    Steamroller hat ggü. Richland 50% Cachebandbreite dazugewonnen und jetzt wird Carrizo wieder beschnitten?
    Wie ist der Cache jeweils getaktet? Ganzer oder halber CPU Takt?
    Dazu gibts auch nur eine PCIe3 x8 Anbindung für dGPU.
    Entweder das sind wirklich beschnittene Laptopmodelle, optimiert für wenig Energieverbrauch (halber Cache etc. pp.), oder Excavator wird im Vergleich zu Steamroller keine Butter vom Brot ziehen.
    Geändert von hoschi_tux (16.07.2014 um 12:31 Uhr)
    Für einen grünen Planeten braucht man jeden einzelnen Grashalm.

    Never change a broken system!
    In case of sensible data.

  5. Beitrag #4
    Grand Admiral
    Special
    Grand Admiral
    • Mein System
      Notebook
      Modell: dv6-2028ez; 6465b
      Prozessor: M600; A6-3410MX
      Mainboard: -;-
      Kühlung: -;-
      Arbeitsspeicher: 4GB DDR2 800; 8GB DDR3 1600
      Grafikkarte: Mobility HD4550; HD6530G
      Display: 15"(1366x768);14"(1600x900)
      SSD(s): -;240GB SSD Samsung 840
      Festplatte(n): 500GB;2nd HD 500GB Toshiba
      Optische Laufwerke: Blueray Drive;-
      Gehäuse: dv6-2028ez; 6465b
      Netzteil: HP 90W
      Betriebssystem(e): Win 7 hp; Win8.1 Pro
      Browser: UX Nightly 64bit
    • Mein DC

      ONH beim Distributed Computing

      Rechner: M600, A6-3410MX
      Mitglied der Kavallerie: Nein
      BOINC-Statistiken:

    Registriert seit
    31.08.2009
    Ort
    AG CH
    Beiträge
    2.835
    Danke Danke gesagt 
    202
    Danke Danke erhalten 
    3
    Oder was viel wahrscheinlicher ist, die Folie ist ein Fake, alleine die DDR3 Blöcke sprechen dafür.

    Dazu kommt noch der unlogische Versionssprung der uvd, ich würde das ganze nicht umbedingt für voll nehmen.

    Dennoch danke für den Carrizo Thread nun wird der xv thread hoffentlich nicht mehr mit nit cpu sachen vollgespamt.
    Geändert von ONH (16.07.2014 um 12:37 Uhr)

  6. Beitrag #5
    Themenstarter
    Grand Admiral
    Special
    Grand Admiral
    Avatar von nazgul99
    • Mein System
      Notebook
      Modell: ThinkPad Edge E145 / 8GB / M500 480GB / Kubuntu /// Asus U38N / 6GB / Matt / Postville / Kubuntu/W8
      Desktopsystem
      Prozessor: AMD A10-7800
      Mainboard: MSI A88XI AC
      Kühlung: Scythe Shuriken Rev.2
      Arbeitsspeicher: 2x 8GB DDR3-2133
      Grafikkarte: IGP
      Display: HP LP2465, MVA, 1920x1200, 24"
      SSD(s): Samsung 850 EVO 500GB
      Festplatte(n): ST9500325AS 500GB
      Optische Laufwerke: ja, so'n USB-Dings
      Soundkarte: onboard, optisch -> SMSL Q5 PRO -> ELAC EL60
      Gehäuse: Silverstone ML06B
      Netzteil: SST-ST30SF
      Betriebssystem(e): Kubuntu
      Browser: Firefox
      Sonstiges: Synology DS414slim 3x 1,5 TB RAID5

    Registriert seit
    01.05.2005
    Ort
    Irgendwo in der Nähe
    Beiträge
    3.573
    Danke Danke gesagt 
    319
    Danke Danke erhalten 
    181
    ONH, da ist was dran. Hab mich auch schon über UVD3 -> UVD6 gewundert, aber letztlich kann da auch irgend ein Marketing-Unsinn dahinter stecken.

    Atombossler, ein SOC, der für den Desktop-Gebrauch teil-deaktiviert wird und diese Teile werden dann aufgebohrt in nem FCH zur Verfügung gestellt? Hmm ... Aber man würde trotzdem deutlich mehr PCIe-Lanes benötigen, um über den Chipsatz dann eben so viele zur Verfügung stellen zu können. Gut, man könnte die Leitungen der SATA-Ports umnutzen und vielleicht noch ein paar andre, aber ich hab zumindest meine Zweifel, dass da genügend zusammenkomen. Aber denkbar ist es.
    Norddeutsch und subjektiv.

  7. Beitrag #6
    Grand Admiral
    Special
    Grand Admiral
    • Mein System
      Notebook
      Modell: Lenovo Thinkpad X60s
      Desktopsystem
      Prozessor: Phenom II 955 BE
      Mainboard: DFI LanParty DK 790FXB-M3H5
      Kühlung: Noctua NH-U12P
      Arbeitsspeicher: 4GB OCZ Platinum DDR1600 7-7-7 @ 1333 6-6-6
      Grafikkarte: Radeon 4850 1GB
      Festplatte(n): Western Digital Caviar Black 1TB
      Netzteil: Enermax Modu 525W
      Betriebssystem(e): Linux, Vista x64
      Browser: Firefox 3.5

    Registriert seit
    14.07.2006
    Beiträge
    3.992
    Danke Danke gesagt 
    22
    Danke Danke erhalten 
    21
    Wieso wird hier wieder Größe mit Bandbreite zusammengeworfen? - Man kann auch den halben Cache z.B. mit doppeltem Takt betreiben...
    Die Jaguar haben doch AFAIK auch shared L2 Caches. - Wobei sich hier wiederum die Frage stellt ob das ein generelles Architekturmerkmal von Excavator wird oder ein Spezialfall der Implementation als Carizzo.
    Insgesamt klingen die Erweiterungen erstmal interessant. Was genau als "Full HSA" gemeint ist, weiß ich allerdings auch nicht. Offiziell galt doch schon Kaveri als "die HSA-APU".
    Dass der 15W - Bereich ausgebaut wird, ist nur konsequent angesichts des Rückzugs aus der Highend-Battle mit Intel. Wobei 15W mir relativ wenig vorkommen, das ist doch schon fast Katzen-Territorium, also Jaguar/Puma basierende APUs, egal ob man nun Kabini, Beema o.ä. anführt.
    Das aller, aller wichtigste wird sein dass AMD zeitnah liefern kann und dass sie es endlich schaffen die APUs in kaufbare Produkte abseits der Rentner-Netbooks mit 17-Zoll Display (kann man bei 1024x768 auch ohne Brille bedienen) unterzubringen.
    Ich meine, selbst Kaveri ist schon ein recht guter Allrounder, die kleinen APUs lassen die ATOMs alt aussehen... und dennoch findet man kaum ein brauchbares Produkt im Handel. In Deutschland schon garnicht. Komischerweise geht sowas in Polen und Nachbarländern. Das hat nichts mehr mit Produktpolitik zu tun sondern ist schlichte Wettbewerbsverzerrung wenn man mich fragt.
    Alles in Allem, ein inkrementelles Update für die Kaveris. Nungut. War ja so zu erwarten.
    Dass DDR4 noch nicht kommt, ist auch irgendwie naheliegend, das dürfte preislich in der Klasse noch nicht wirklich passend sein. - vielleicht gibts dann später nen Refresh mit DDR4-Controller.
    Real Programmers always confuse Christmas and Halloween because OCT 31 == DEC 25 !
    Andrew Rutherford (andrewr@ucs.adelaide.edu.au)

    Um ein tadelloses Mitglied einer Schafherde sein zu können, muss man vor allem ein Schaf sein.
    Albert Einstein

  8. Beitrag #7
    Gesperrt

    Registriert seit
    25.01.2011
    Beiträge
    1.546
    Danke Danke gesagt 
    177
    Danke Danke erhalten 
    5
    Zitat Zitat von nazgul99 Beitrag anzeigen
    Dass Carrizo das erste wirklich vollständige HSA-Design werden soll (was genau Kaveri noch fehlt, mag sicher jemand raussuchen, es gab mal Folien mit Jahreszahlen und den dann jeweils abzuschließenden Implementationsschritten).
    Steht doch alles auf den Folien
    Graphics Preemption und (GPU Compute) Context Switch, siehe auch http://en.wikipedia.org/wiki/Preemption_%28computing%29

    Abseits ausschweifiger Marketing-Sprechblasen, z.B.
    Spoiler

    gibt es auch ein paar handfeste Informationen dazu, z.B.:

    http://rtos.com/images/uploads/Preemption_Threshold.pdf

    oder
    Spoiler


    oder hier noch das passende Patent:
    http://www.google.com/patents/US20120194524

  9. Beitrag #8
    Grand Admiral
    Special
    Grand Admiral
    • Mein System
      Notebook
      Modell: Lenovo Thinkpad X60s
      Desktopsystem
      Prozessor: Phenom II 955 BE
      Mainboard: DFI LanParty DK 790FXB-M3H5
      Kühlung: Noctua NH-U12P
      Arbeitsspeicher: 4GB OCZ Platinum DDR1600 7-7-7 @ 1333 6-6-6
      Grafikkarte: Radeon 4850 1GB
      Festplatte(n): Western Digital Caviar Black 1TB
      Netzteil: Enermax Modu 525W
      Betriebssystem(e): Linux, Vista x64
      Browser: Firefox 3.5

    Registriert seit
    14.07.2006
    Beiträge
    3.992
    Danke Danke gesagt 
    22
    Danke Danke erhalten 
    21
    War das nicht schon ein Compute-Feature von GCN an sich? - oder bin ich da aufm falschen Dampfer. Ich war der Meinung dass schon die GCN-Karten unter anderem mit besserer GPGPU-Eignung durch eben jene Context-switching Fähigkeit beworben wurden. Also wäre das ja nicht wirklich neu - Kaveri hat ja auch schon GCN GPU-Teile
    Real Programmers always confuse Christmas and Halloween because OCT 31 == DEC 25 !
    Andrew Rutherford (andrewr@ucs.adelaide.edu.au)

    Um ein tadelloses Mitglied einer Schafherde sein zu können, muss man vor allem ein Schaf sein.
    Albert Einstein

  10. Beitrag #9
    Themenstarter
    Grand Admiral
    Special
    Grand Admiral
    Avatar von nazgul99
    • Mein System
      Notebook
      Modell: ThinkPad Edge E145 / 8GB / M500 480GB / Kubuntu /// Asus U38N / 6GB / Matt / Postville / Kubuntu/W8
      Desktopsystem
      Prozessor: AMD A10-7800
      Mainboard: MSI A88XI AC
      Kühlung: Scythe Shuriken Rev.2
      Arbeitsspeicher: 2x 8GB DDR3-2133
      Grafikkarte: IGP
      Display: HP LP2465, MVA, 1920x1200, 24"
      SSD(s): Samsung 850 EVO 500GB
      Festplatte(n): ST9500325AS 500GB
      Optische Laufwerke: ja, so'n USB-Dings
      Soundkarte: onboard, optisch -> SMSL Q5 PRO -> ELAC EL60
      Gehäuse: Silverstone ML06B
      Netzteil: SST-ST30SF
      Betriebssystem(e): Kubuntu
      Browser: Firefox
      Sonstiges: Synology DS414slim 3x 1,5 TB RAID5

    Registriert seit
    01.05.2005
    Ort
    Irgendwo in der Nähe
    Beiträge
    3.573
    Danke Danke gesagt 
    319
    Danke Danke erhalten 
    181
    Ge0rgy, FredD (danke!), ich suchte nach der entsprechenden Folie und hab eine Variante davon (es gab verschiednene) hier gefunden:



    Da steht zwar 2014, aber Kaveri war ja auch für (Anfang, Mitte, Ende ...) 2013 angekündigt. Was auf der Folie unter "2014" steht, müsste dann Carrizo sein. Trotzdem danke

    ---------- Beitrag hinzugefügt um 13:21 ---------- Vorheriger Beitrag um 13:18 ----------

    Das wären dann: 2011: Llano, 2012: Trinity & Richland, 2013: Kaveri, 2014: Carrizo.

    Dass Kaveri noch nicht die volle geplante Ausbaustufe sein würde, war mir jedenfalls (u.a. durch diese, immer wieder leicht variierte, Folie) bekannt.
    Norddeutsch und subjektiv.

  11. Beitrag #10
    Grand Admiral
    Special
    Grand Admiral
    Avatar von gruffi
    • Mein System
      Desktopsystem
      Prozessor: AMD Ryzen 5 1600
      Mainboard: MSI B350M PRO-VDH
      Kühlung: Wraith Spire
      Arbeitsspeicher: 2x 8 GB DDR4-2400 CL16
      Grafikkarte: XFX Radeon R7 260X
      Display: LG W2361
      SSD(s): Crucial CT250BX100SSD1
      Festplatte(n): Toshiba DT01ACA200
      Optische Laufwerke: LG Blu-Ray-Brenner BH16NS40
      Soundkarte: Realtek HD Audio
      Gehäuse: Sharkoon MA-I1000
      Netzteil: be quiet! Pure Power 9 350W
      Betriebssystem(e): Windows 10 Professional 64-bit
      Browser: Mozilla Firefox
      Sonstiges: https://valid.x86.fr/mb4f0j

    Registriert seit
    08.03.2008
    Ort
    vorhanden
    Beiträge
    3.619
    Danke Danke gesagt 
    96
    Danke Danke erhalten 
    14
    Zitat Zitat von nazgul99 Beitrag anzeigen
    Ach ja, ~30% Performance-Verbesserung bei 15 Watt sind angesagt, wobei es nach meinem Wissensstand gar keine 15W-Kaveri gibt (die schnellsten haben 19 Watt). Ob damit die CPU-Kerne oder die Gesamtleitung inkl. GPU-Shader gemeint ist, bleibt unklar.
    Naja, die schreiben es ja explizit bei CPU hin. Also wird's wohl auch für die CPU gelten. Allerdings müsste man auch wissen, wie es bei 45W oder 65W ausschaut. Ansonsten lässt sich die Zahl schlecht einordnen. Bei kleineren TDPs kann man viel durch die Einsparung von ein paar Watt gewinnen.


    Ansonsten fällt der halbierte L2 auf. Vielleicht ein Ergebnis der Jaguar/Puma+ Architektur? Die kommt ja auch lediglich mit 2 MB L2 daher. Allerdings mit Halbtakt, um Energie zu sparen. Wollen wir hoffen, dass Carrizo seine TDP auch mit vollem L2 Takt erreicht. Für singlethreaded Workloads sollte die Cachegrösse eh keine allzu grosse Auswirkungen haben. Da sind selbst 2 MB noch ordentlich. Anders schaut es allerdings bei Volllast auf allen Kernen aus. Dann stehen pro Thread nur noch 0,5 MB Cache zur Verfügung. Das gab es das letzte mal abseits der Cat Architektur vor 5 Jahren bei Propus. Der sich trotzdem recht gut schlug und im Schnitt maximal messbar hinter Deneb lag. In einigen Cache intensiven Szenarien allerdings klare Performancenachteile hatte.
    Geändert von gruffi (16.07.2014 um 14:08 Uhr)
    Don't reinvent the wheel ... unless you plan on learning more about wheels.

    Diese Nachricht wird nicht angezeigt, da sich y33H@ auf deiner Ignorier-Liste befindet.

  12. Beitrag #11
    Gesperrt

    Registriert seit
    25.01.2011
    Beiträge
    1.546
    Danke Danke gesagt 
    177
    Danke Danke erhalten 
    5
    Auf der ersten Seite des Kaveri Threads ist noch die Ur-Variante dieser Fole (FSA-Roadmap): http://cdn.overclock.net/0/04/600x38...c21593_hsa.png zu finden.

    Wir dürfen in diesem Zusammenhang auch auf den letzten Punkt gespannt sein "Extend to discrete GPU". Wenn sich das gut zusammenreimt, könnten die kommenden GPUs (Tonga und wie sie alle heißen) dann regelrecht als verlängerter Arm der (voll-HSA-fähigen) APU arbeiten, in der Art und Weise feinkörniger und vom Umfang weit über das bisher bekannte Spektrum von Switchable Graphics / Enduro und hybrid Crossfire hinaus.

  13. Beitrag #12
    Admiral
    Special
    Admiral
    Avatar von hot
    • Mein System
      Desktopsystem
      Prozessor: AMD Phenom 9500
      Mainboard: Asrock AOD790GX/128
      Kühlung: Scythe Mugen
      Arbeitsspeicher: 2x Kingston DDR2 1066 CL7 1,9V
      Grafikkarte: Leadtek Geforce 260 Extreme+
      Display: Samsung 2432BW
      Festplatte(n): Samsung HD403LJ, Samung SP1614C
      Optische Laufwerke: LG HL55B
      Soundkarte: Realtek ALC890
      Gehäuse: Zirco AX
      Netzteil: Coba Nitrox 600W Rev.2
      Betriebssystem(e): Vista x64 HP
      Browser: Firefox

    Registriert seit
    21.09.2002
    Beiträge
    1.174
    Danke Danke gesagt 
    10
    Danke Danke erhalten 
    0
    Der L2-Cache ist sicherlich aus performancegründen halbiert. Der wird dafür einfach deutlich schneller sein. Interessant wär viel mehr der L1D$.
    AMD hat sich da ne ganz schöne eierlegende Wollmilchsau zusammengebaut.

  14. Beitrag #13
    Redaktion
    Redaktion

    Registriert seit
    26.08.2008
    Beiträge
    2.038
    Danke Danke gesagt 
    353
    Danke Danke erhalten 
    45
    Der Vergleich 15 Watt mit Kaveri hinkt doppelt, weil der 17 Watt Kaveri ja auch noch einen nicht so sparsamen FCH mitschleppt, während der bei Carrizo integriert ist. Dafür bräuchte man zum Vergleich wahrscheinlich einen 10 Watt Kaveri.
    @nazgul
    Danke für´s Zusammenschreiben!

  15. Beitrag #14
    Themenstarter
    Grand Admiral
    Special
    Grand Admiral
    Avatar von nazgul99
    • Mein System
      Notebook
      Modell: ThinkPad Edge E145 / 8GB / M500 480GB / Kubuntu /// Asus U38N / 6GB / Matt / Postville / Kubuntu/W8
      Desktopsystem
      Prozessor: AMD A10-7800
      Mainboard: MSI A88XI AC
      Kühlung: Scythe Shuriken Rev.2
      Arbeitsspeicher: 2x 8GB DDR3-2133
      Grafikkarte: IGP
      Display: HP LP2465, MVA, 1920x1200, 24"
      SSD(s): Samsung 850 EVO 500GB
      Festplatte(n): ST9500325AS 500GB
      Optische Laufwerke: ja, so'n USB-Dings
      Soundkarte: onboard, optisch -> SMSL Q5 PRO -> ELAC EL60
      Gehäuse: Silverstone ML06B
      Netzteil: SST-ST30SF
      Betriebssystem(e): Kubuntu
      Browser: Firefox
      Sonstiges: Synology DS414slim 3x 1,5 TB RAID5

    Registriert seit
    01.05.2005
    Ort
    Irgendwo in der Nähe
    Beiträge
    3.573
    Danke Danke gesagt 
    319
    Danke Danke erhalten 
    181
    Gern geschehen isigrim

    Golem berichtet ebenfallsund verweist am Ende auf etwas, das ich übersehen habe:
    Wie bereits berichtet, wird Carrizo auch als Desktop-APU für den Sockel FM2+ erscheinen.
    Wenn AMD die Pläne entgegen den Ankündigungen für Sockel FM2+ nicht doch wieder ändert, müsste Carrizo also tatsächlich auch mit einer Southbridge genutzt werden können. Falls das mit dem OSC für Notebooks stimmt, würde ich am ehesten tipen, dass einige Lötpads des Dies je nach Konfiguration entweder oder für z.B. SATA oder PCIe nutzen lassen. Gegeben hat es sowas ja schon. Gäbe es keine Doppelnutzung, müsste Platz für die zusätzlichen Lötpads verschwendet werden. Ein zweites die für den Desktop halte ich nach wie vor für sehr unwahrscheinlich.

    ---------- Beitrag hinzugefügt um 20:10 ---------- Vorheriger Beitrag um 20:03 ----------

    Im SA-Forum hat noch jemand diese Folie gepostet:



    Da steht ebenfalls DDR3 ... Die Folie bezieht sich auf den Desktop, also ist natürlich auch FM2+ µPGA angegeben. DDR3 ist mit diesem Sockel natürlich auch zwingend.
    Norddeutsch und subjektiv.

  16. Beitrag #15
    Grand Admiral
    Special
    Grand Admiral
    • Mein System
      Notebook
      Modell: Lenovo Thinkpad X60s
      Desktopsystem
      Prozessor: Phenom II 955 BE
      Mainboard: DFI LanParty DK 790FXB-M3H5
      Kühlung: Noctua NH-U12P
      Arbeitsspeicher: 4GB OCZ Platinum DDR1600 7-7-7 @ 1333 6-6-6
      Grafikkarte: Radeon 4850 1GB
      Festplatte(n): Western Digital Caviar Black 1TB
      Netzteil: Enermax Modu 525W
      Betriebssystem(e): Linux, Vista x64
      Browser: Firefox 3.5

    Registriert seit
    14.07.2006
    Beiträge
    3.992
    Danke Danke gesagt 
    22
    Danke Danke erhalten 
    21
    Interessanterweise steht da sowohl bei Kaveri als auch bei Carizzo "Full HSA programming model"
    Real Programmers always confuse Christmas and Halloween because OCT 31 == DEC 25 !
    Andrew Rutherford (andrewr@ucs.adelaide.edu.au)

    Um ein tadelloses Mitglied einer Schafherde sein zu können, muss man vor allem ein Schaf sein.
    Albert Einstein

  17. Beitrag #16
    Themenstarter
    Grand Admiral
    Special
    Grand Admiral
    Avatar von nazgul99
    • Mein System
      Notebook
      Modell: ThinkPad Edge E145 / 8GB / M500 480GB / Kubuntu /// Asus U38N / 6GB / Matt / Postville / Kubuntu/W8
      Desktopsystem
      Prozessor: AMD A10-7800
      Mainboard: MSI A88XI AC
      Kühlung: Scythe Shuriken Rev.2
      Arbeitsspeicher: 2x 8GB DDR3-2133
      Grafikkarte: IGP
      Display: HP LP2465, MVA, 1920x1200, 24"
      SSD(s): Samsung 850 EVO 500GB
      Festplatte(n): ST9500325AS 500GB
      Optische Laufwerke: ja, so'n USB-Dings
      Soundkarte: onboard, optisch -> SMSL Q5 PRO -> ELAC EL60
      Gehäuse: Silverstone ML06B
      Netzteil: SST-ST30SF
      Betriebssystem(e): Kubuntu
      Browser: Firefox
      Sonstiges: Synology DS414slim 3x 1,5 TB RAID5

    Registriert seit
    01.05.2005
    Ort
    Irgendwo in der Nähe
    Beiträge
    3.573
    Danke Danke gesagt 
    319
    Danke Danke erhalten 
    181
    Dachte mir, dass das kommt Dass das Programmiermodell bei beiden gleich sei, bedeutet ja nicht unbedingt, dass die Hardware-Features bezüglich HSA es auch sind.
    Norddeutsch und subjektiv.

  18. Beitrag #17
    Gesperrt

    Registriert seit
    25.01.2011
    Beiträge
    1.546
    Danke Danke gesagt 
    177
    Danke Danke erhalten 
    5
    Ein weiteres (und wie ich meine sogar wichtigeres) Patent, um GPU Context Switches zu optimieren, wurde erst diesen Juni veröffentlicht (beantragt Nov. 2012). Wie wir aus dem Thread zu Compiler- und Software entnehmen können, nehmen Context Switches samt Preemption mal gerne mehrere Hunderte, wenn nicht sogar im Bereich von 1000 CPU Zyklen in Anspruch. Strategien zu finden, den Overhead zu reduzieren, aber auch benötigte Context Switches zu minimieren (siehe verlinktes Dokument von rtos), ist da ein ziemlich wichtiger Beitrag auf dem Weg zu heterogenem Computing.

    http://www.google.com/patents/US20140157287

    Zitat Zitat von FredD Beitrag anzeigen
    oder hier noch das passende Patent:
    http://www.google.com/patents/US20120194524

  19. Beitrag #18
    Grand Admiral
    Special
    Grand Admiral
    • Mein System
      Notebook
      Modell: Lenovo Thinkpad X60s
      Desktopsystem
      Prozessor: Phenom II 955 BE
      Mainboard: DFI LanParty DK 790FXB-M3H5
      Kühlung: Noctua NH-U12P
      Arbeitsspeicher: 4GB OCZ Platinum DDR1600 7-7-7 @ 1333 6-6-6
      Grafikkarte: Radeon 4850 1GB
      Festplatte(n): Western Digital Caviar Black 1TB
      Netzteil: Enermax Modu 525W
      Betriebssystem(e): Linux, Vista x64
      Browser: Firefox 3.5

    Registriert seit
    14.07.2006
    Beiträge
    3.992
    Danke Danke gesagt 
    22
    Danke Danke erhalten 
    21
    Wobei hier angemerkt sei, dass die angenommenen 1000 Takte nur eine Seite der Medallie sind und auch stark Architekturabhängig, viel schwerwiegender ist in der Praxis wohl das Phänomen, dass diverse caches bzw. cachezeilen bei jedem Contextwechsel "ungültig" werden, genau wie Daten durchs Prefetching, sogar die Sprungvorhersage muss komplett von vorne anfangen.
    GPUs sind anders aufgebaut was cache-Hierarchien betrifft, sowie meistens deutlich neidriger getaktet als CPUs. Das muss alles betrachtet werden. Trotzdem sit natürlich die grundsätzliche Fähigkeit begrüßenswert und jede Optimierung willkommen.
    Auch in Hinblick auf heterogeneous queueing oder wie man das schreibt. Also das gegenseitige "zuschieben" von Arbeit zwischen CPU und GPU.
    Real Programmers always confuse Christmas and Halloween because OCT 31 == DEC 25 !
    Andrew Rutherford (andrewr@ucs.adelaide.edu.au)

    Um ein tadelloses Mitglied einer Schafherde sein zu können, muss man vor allem ein Schaf sein.
    Albert Einstein

  20. Beitrag #19
    Technische Administration
    Dinosaurier

    Avatar von tomturbo
    • Mein System
      Notebook
      Modell: Microsoft Surface Pro 4
      Desktopsystem
      Prozessor: Phenom II X6 1045T
      Mainboard: Gigabyte 970A-UD3
      Kühlung: CoolerMaster Hyper 412S
      Arbeitsspeicher: 2x8GB Crucial Ballistix Tactical DDR3-1866
      Grafikkarte: Sapphire R7 250E ultimate / lüfterlos
      Display: HP ZR2740w (2560x1440)
      SSD(s): 2xSamsung 830 128GB
      Festplatte(n): Seagate ST31500341AS 1500GB
      Optische Laufwerke: Samsung Brenner
      Soundkarte: onboard
      Gehäuse: Fractal Design Define R4
      Netzteil: XFX 550W
      Betriebssystem(e): Arch Linux, Windows VM
      Browser: Firefox + Chromium + Konqueror
    • Mein DC

      tomturbo beim Distributed Computing

      Aktuelle Projekte: SETI@HOME, Universe@HOME, Asteroids@HOME
      Lieblingsprojekt: SETI@HOME
      Rechner: Xeon E3-1245V2; Raspberry Pi 3; NUC6i3BNH
      Mitglied der Kavallerie: Nein
      BOINC-Statistiken:

    Registriert seit
    30.11.2005
    Ort
    Österreich
    Beiträge
    6.870
    Danke Danke gesagt 
    205
    Danke Danke erhalten 
    8
    Naja so schlimm kann ein Contextswitch nun auch wieder nicht sein, denn unser Boot zum Beispiel hat eine durchschnittliche Contextswitch-Rate von 1600/sek über den Tag gerechnet. Unsere CPUs sind zwar gut ausgelastet aber so schlimm kann es nicht sein denn immerhin geht noch was am Server.

    4000 U/min wo der Diesel aufhört und richtige Motoren zu arbeiten beginnen

    "Ubuntu" - an African word meaning "Gentoo is too hard for me"

    vegan aus Überzeugung

    real man don't click

  21. Beitrag #20
    Grand Admiral
    Special
    Grand Admiral
    • Mein System
      Notebook
      Modell: Lenovo Thinkpad X60s
      Desktopsystem
      Prozessor: Phenom II 955 BE
      Mainboard: DFI LanParty DK 790FXB-M3H5
      Kühlung: Noctua NH-U12P
      Arbeitsspeicher: 4GB OCZ Platinum DDR1600 7-7-7 @ 1333 6-6-6
      Grafikkarte: Radeon 4850 1GB
      Festplatte(n): Western Digital Caviar Black 1TB
      Netzteil: Enermax Modu 525W
      Betriebssystem(e): Linux, Vista x64
      Browser: Firefox 3.5

    Registriert seit
    14.07.2006
    Beiträge
    3.992
    Danke Danke gesagt 
    22
    Danke Danke erhalten 
    21
    "Schlimm" ist relativ. 1000 Takte sind im Zeitalter der Gigahertz-Prozessoren keine besonders lange Zeit, ich meine, ein einzelner Takt dauert grade eine Nanosekunde bei 1Ghz. Das bedeutet wenn ein Contextswitch grob mit 100 Takten veranschlagt wird, sind wir immernoch bei einer Mikrosekunde. das bdeutet 1000 Kontextwechsel in einer millisekunde und 1 mio in einer Sekunde. Theoretisch möglich.
    Wenn du nun aber betrachtest, dass selbst teure Maschinenoperationen wie Divisionen usw. meistens (deutlich) unter 50 Takten brauchen, von Additionen, Multiplikationen etc. die quasi in einem Takt durchgehen mal ganz zu schweigen, dann ist 1000 Takte ausgesprochen teuer.
    Mit Features wie den tagged TLBs und dergleichen ist das auch inzwischen ein wenig besser geworden, weil der Prozessor nicht mehr bei jedem Kontextwechsel sämtlichen Bezug zu den alten Daten verliert (TLB-Flush würde bedeuten er wüsste nach dem zurückwechseln zum alten Tread alle Speicheroffsets neu berechnen)
    Es ist also nicht so als wäre da nicht Arbeit investiert worden. Dennoch können zu viele Threadwechsel tatsächlich negativ auf die Performance schlagen, wenn man alle Effekte, wie die berüchtige "cache Pollution" mit einrechnet. Davon dass die Pipeline komplett leerlaufen muss etc. mal ganz zu schweigen.
    Also wie soll ich das am besten ausdrücken. Technisch gesehen eine ziemlich teure Operation, die inzwischen allerdings durch Moores Law soweit entschärft wurde dass es praktisch keine allzu große Rolle spielt.
    Der springede Punkt ist aber, dass tehoretisch jeder weitere Kern das Problem auf mehrfache Weise lindert. Nicht wegen der 1000 Takte in denen die CPU nichts sinnvolles rechnet. Ich behaupte bei modernen Prozessoren ist der roh-Befehlsdurchsatz der Pipeline eh in den meisten Fällen zweitrangig, viel heftiger schlagen Wartezeiten ins Kontor, bis der lahme Arbeitsspeicher endlich die Daten anliefert etc. - und genau das muss er wenns dumm läuft nach einem Contextswitch, weil die Daten im Cache inzwischen vom neuen Thread überschrieben wurden und alles nach dem zurückwechseln neu geholt werden müssen.
    Das ist hier allerdings halbwegs OT.
    Real Programmers always confuse Christmas and Halloween because OCT 31 == DEC 25 !
    Andrew Rutherford (andrewr@ucs.adelaide.edu.au)

    Um ein tadelloses Mitglied einer Schafherde sein zu können, muss man vor allem ein Schaf sein.
    Albert Einstein

  22. Beitrag #21
    Admiral
    Special
    Admiral
    Avatar von Atombossler
    • Mein System
      Notebook
      Modell: Thinkpad 8
      Desktopsystem
      Prozessor: A8-7600@3.25Ghz
      Mainboard: Asus A88X-PRO
      Kühlung: NoFan CR80 EH
      Arbeitsspeicher: 16Gb G-Skill Trident-X DDR3 2400
      Grafikkarte: APU
      Display: Acer UHD 4K2K
      SSD(s): Samsung 850 PRO
      Festplatte(n): 2xSamsung 1TB HDD (2,5")
      Optische Laufwerke: Plexi BD-RW
      Soundkarte: OnBoard Geraffel
      Gehäuse: Define R2
      Netzteil: BeQuiet
      Betriebssystem(e): Win7x64-PRO
      Browser: Chrome

    Registriert seit
    28.04.2013
    Ort
    Andere Sphären
    Beiträge
    1.285
    Danke Danke gesagt 
    1
    Danke Danke erhalten 
    41
    Hot Dog, lecker und knusprig!

  23. Beitrag #22
    Grand Admiral
    Special
    Grand Admiral
    Avatar von WindHund
    • Mein System
      Desktopsystem
      Prozessor: AMD FX-8350 Eight-core @ Asus enhancement Mode
      Mainboard: ASUS Sabertooth 990FX/Gen3 R2.0 sponsored by P3D
      Kühlung: WaKü EK WB Supreme LTX 366x40mm Radiator 6l Brutto m³
      Arbeitsspeicher: 4x 8GiB Crucial DDR3-1866 CL11 ECC DR
      Grafikkarte: 2x XFX Radeon R7970 DD 6GiB @ CrossFireX
      Display: 37" LE37A550P1R 60Hz 550cd/m Full HD -> best part of my system
      SSD(s): Samsung 830 128GB, Crucial BX100 256GB native SATA3
      Festplatte(n): 1x SATA2 Samsung HD103UJ, 1x SATA3 WD75000AAKS, 1x USB3.0 boost M.2 128GB
      Optische Laufwerke: 1x HL-DT-ST BD-RE BH10LS30 SATA2
      Soundkarte: ALC892 HD Audio (onboard)
      Gehäuse: SF-2000 Big Tower
      Netzteil: Corsair HX850W (80+ Silber)
      Betriebssystem(e): Windows 10 x64 Professional (up to date!)
      Browser: @Chrome.Google.CPU_Last_niedrig
      Sonstiges: Gehäuselüfter: 4x200mm + 7x120mm (inklusive Radiatorlüfter extern)
    • Mein DC

      WindHund beim Distributed Computing

      Aktuelle Projekte: SIMAP, Einstein, Collatz, RadioAktiv
      Lieblingsprojekt: none, try all
      Rechner: FX-8350, FX-6300, Galaxy S2 2xR7970 + 1xGTX580 + Galaxy SII
      Mitglied der Kavallerie: Nein
      BOINC-Statistiken:
      Folding@Home-Statistiken:

    Registriert seit
    30.01.2008
    Ort
    Im wilden Süden (0711)
    Beiträge
    8.886
    Danke Danke gesagt 
    1.138
    Danke Danke erhalten 
    70
    Zitat Zitat von Atombossler Beitrag anzeigen
    Ave Cesar!
    Lustig zu wissen, die Italiener haben .it als Endung.

  24. Beitrag #23
    Lieutenant
    Lieutenant

    Registriert seit
    28.09.2012
    Beiträge
    59
    Danke Danke gesagt 
    0
    Danke Danke erhalten 
    0
    Bei der ganzen Kotext-Switching-Geschichte wäre noch wichtig zu wissen, wie die Scheduling-Intervalle der Betriebssysteme sind. Bei unseren Versuchen, einige Low-Power-ARM-Boards (Panda-Board usw.) mit Linux als Real-Time-Maschinen zu nutzen habe ich noch irgendwas mit 125µs in Erinnerung. Erst mit dieser Angabe kann man ja beurteilen, wie oft so ein Kontextswitch passiert und damit, wie teuer die benötigte Zeit tatsächlich ist.

  25. Beitrag #24
    Grand Admiral
    Special
    Grand Admiral
    • Mein System
      Notebook
      Modell: Lenovo Thinkpad X60s
      Desktopsystem
      Prozessor: Phenom II 955 BE
      Mainboard: DFI LanParty DK 790FXB-M3H5
      Kühlung: Noctua NH-U12P
      Arbeitsspeicher: 4GB OCZ Platinum DDR1600 7-7-7 @ 1333 6-6-6
      Grafikkarte: Radeon 4850 1GB
      Festplatte(n): Western Digital Caviar Black 1TB
      Netzteil: Enermax Modu 525W
      Betriebssystem(e): Linux, Vista x64
      Browser: Firefox 3.5

    Registriert seit
    14.07.2006
    Beiträge
    3.992
    Danke Danke gesagt 
    22
    Danke Danke erhalten 
    21
    Die Contextwechsel-Diskussion haben wir in den Software-Thread verlagert
    Real Programmers always confuse Christmas and Halloween because OCT 31 == DEC 25 !
    Andrew Rutherford (andrewr@ucs.adelaide.edu.au)

    Um ein tadelloses Mitglied einer Schafherde sein zu können, muss man vor allem ein Schaf sein.
    Albert Einstein

  26. Beitrag #25
    Lieutenant
    Lieutenant

    Registriert seit
    28.09.2012
    Beiträge
    59
    Danke Danke gesagt 
    0
    Danke Danke erhalten 
    0
    Wo? Ich find's nicht

Seite 1 von 53 123451151 ... LetzteLetzte

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •