App installieren
How to install the app on iOS
Follow along with the video below to see how to install our site as a web app on your home screen.
Anmerkung: This feature may not be available in some browsers.
Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
Prognose-Board: Wie geht es bei AMD weiter? Entwicklungen / Strategien / Maßnahmen, die AMD betreffen bzw. die AMD treffen könnte
- Ersteller BavarianRealist
- Erstellt am
ONH
Grand Admiral Special
@BR
vr-zone hat es mehr mit Schlagzeilen auch wenn die direkt verlinkten Quellen ihre Hypothese nicht wiederspricht. 2 Min lesen und nachdenken hilft, vieleicht siehst du dann selbst wo der Haken bei der vr zone news ist. Da deine interpretation dieses tweets wohl genauso falsch ist wie die von vr zone, kann man sich die KV spekulation sparen.
vr-zone hat es mehr mit Schlagzeilen auch wenn die direkt verlinkten Quellen ihre Hypothese nicht wiederspricht. 2 Min lesen und nachdenken hilft, vieleicht siehst du dann selbst wo der Haken bei der vr zone news ist. Da deine interpretation dieses tweets wohl genauso falsch ist wie die von vr zone, kann man sich die KV spekulation sparen.
FalconFly
Admiral Special
@FalconFly
Ok, der Zugfahrgast war ein gutes Beispiel!
Aber ganz ohne Software bringt dir auch die Spezialeinheit nichts, man muss sie ja auch "ansprechen".
Die 30x Beschleunigung ist auch etwas abgerundet, es sind mehr aber eben nur beim Prime Number chrunchen.
Jo.... und in normaler high performance Software ausserhalb der Benchmarks wenn's hoch kommt 15% - und das waere schon recht gut ... So wie ueblich halt.
30x ist einfach unrealistisch unter realen Bedingungen und letztendlich nichts als blinde Traumtaenzerei.
Gab schon viele neue SIMD-Funktionen und -Einheiten, und keine erreichte auch nur annaehernd einen 2x Performancesprung durch die Bank in freier Wildbahn. Diese wird keine Ausnahme sein.
Zuletzt bearbeitet:
Markus Everson
Grand Admiral Special
Gerade beim surfen nach bhavari und amur auf einen interessanten Gedanken gestoßen.
2015 laufen die gegenseitigen Lizenzen von AMD und Intel aus. AMD könnte ohne X86 dastehen, den Stecker ziehen und komplett auf ARM schwenken. Intel könnte ohne x64 dastehen. Nur dumm, das Intel auf Gedeih und Verderb auf x64 angewiesen ist.
Erklärt das den steigenden Kurs? Legt AMD hinter den Kulissen bereits seinem Rivalen die Daumenschrauben an? Wir am Ende der Informationskette würden so etwas frühestens in Monaten mitbekommen...
2015 laufen die gegenseitigen Lizenzen von AMD und Intel aus. AMD könnte ohne X86 dastehen, den Stecker ziehen und komplett auf ARM schwenken. Intel könnte ohne x64 dastehen. Nur dumm, das Intel auf Gedeih und Verderb auf x64 angewiesen ist.
Erklärt das den steigenden Kurs? Legt AMD hinter den Kulissen bereits seinem Rivalen die Daumenschrauben an? Wir am Ende der Informationskette würden so etwas frühestens in Monaten mitbekommen...
Opteron
Redaktion
☆☆☆☆☆☆
Ist doch schon alt:Gerade beim surfen nach bhavari und amur auf einen interessanten Gedanken gestoßen.
2015 laufen die gegenseitigen Lizenzen von AMD und Intel aus. AMD könnte ohne X86 dastehen, den Stecker ziehen und komplett auf ARM schwenken. Intel könnte ohne x64 dastehen. Nur dumm, das Intel auf Gedeih und Verderb auf x64 angewiesen ist.
Erklärt das den steigenden Kurs? Legt AMD hinter den Kulissen bereits seinem Rivalen die Daumenschrauben an? Wir am Ende der Informationskette würden so etwas frühestens in Monaten mitbekommen...
http://www.planet3dnow.de/cms/9200-...heitert-amd-setzt-auf-armv8-intel-ohne-amd64/
(Aber aufs Datum achten ^^)
amdfanuwe
Grand Admiral Special
- Mitglied seit
- 24.06.2010
- Beiträge
- 2.372
- Renomée
- 34
- Prozessor
- 4200+
- Mainboard
- M3A-H/HDMI
- Kühlung
- ein ziemlich dicker
- Speicher
- 2GB
- Grafikprozessor
- onboard
- Display
- Samsung 20"
- HDD
- WD 1,5TB
- Netzteil
- Extern 100W
- Betriebssystem
- XP, AndLinux
- Webbrowser
- Firefox
- Verschiedenes
- Kaum hörbar
AMD könnte ohne X86 dastehen, den Stecker ziehen und komplett auf ARM schwenken.
Für X86 sollten die Patente schon ausgelaufen sein, einen 486 müßte man doch schon ohne Patentprobleme bauen können. Aber die restlichen Patente, SSE, AVX, AES etc. wird Intel verteidigen. Zudem wird es einen Wust weiterer Patente geben, ohne die ein moderner Prozessor kaum effizient gebaut werden kann. Egal was sie machen, die Patente brauchen sie gegenseitig und werden sich schon einigen.
WindHund
Grand Admiral Special
- Mitglied seit
- 30.01.2008
- Beiträge
- 12.225
- Renomée
- 536
- Standort
- Im wilden Süden (0711)
- Mitglied der Planet 3DNow! Kavallerie!
- Aktuelle Projekte
- NumberFields@home
- Lieblingsprojekt
- none, try all
- Meine Systeme
- RYZEN R9 3900XT @ ASRock Taichi X570 & ASUS RX Vega64
- BOINC-Statistiken
- Prozessor
- AMD Ryzen 9 5950X
- Mainboard
- ASRock 570X Taichi P5.05 Certified
- Kühlung
- AlphaCool Eisblock XPX, 366x40mm Radiator 6l Brutto m³
- Speicher
- 2x 16 GiB DDR4-3600 CL26 Kingston (Dual Rank, unbuffered ECC)
- Grafikprozessor
- 1x ASRock Radeon RX 6950XT Formula OC 16GByte GDDR6 VRAM
- Display
- SAMSUNG Neo QLED QN92BA 43" up to 4K@144Hz FreeSync PP HDR10+
- SSD
- WD_Black SN850 PCI-Express 4.0 NVME
- HDD
- 3 Stück
- Optisches Laufwerk
- 1x HL-DT-ST BD-RE BH10LS30 SATA2
- Soundkarte
- HD Audio (onboard)
- Gehäuse
- SF-2000 Big Tower
- Netzteil
- Corsair RM1000X (80+ Gold)
- Tastatur
- Habe ich
- Maus
- Han I
- Betriebssystem
- Windows 10 x64 Professional (up to date!)
- Webbrowser
- @Chrome.Google & Edge Chrome
Die 15% sind halt die üblichen Häppchen damit der Kunde bei Laune gehalten wird.Jo.... und in normaler high performance Software ausserhalb der Benchmarks wenn's hoch kommt 15% - und das waere schon recht gut ... So wie ueblich halt.
30x ist einfach unrealistisch unter realen Bedingungen und letztendlich nichts als blinde Traumtaenzerei.
Gab schon viele neue SIMD-Funktionen und -Einheiten, und keine erreichte auch nur annaehernd einen 2x Performancesprung durch die Bank in freier Wildbahn. Diese wird keine Ausnahme sein.
Wenn ich es richtig verstanden habe, dann kann FMA4 vier Operanten pro cycle ausführen.
Ein cycle hat eine abfallende und eine ansteigende Flanke (DDR),
Das würde bedeuten, wenn man eine 4 Operanten Software mit 3 Operanten vergleicht wird diese mit zunehmender Laufzeit immer schneller, da pro Takt (DDR) immer eine "Aufgabe" mehr erledigt wird.
Das erklärt dann natürlich auch die 30x Beschleunigung, es ist also Grundsätzlich Möglich.
Ist nur die Frage wieviel der Programmierer dafür haben will, denn mit Konverter geht das nicht, da muss man von vorne Anfangen und alles neu Programmieren.
Also schlechte Zeiten für C++
Zuletzt bearbeitet:
4/3 ist prozentual immer noch das gleiche wie 400/300. Das mit 300x schneller ergibt für mich also immer noch keinen Sinn.
Die CPU arbeitet desweiteren auch nur mit steigenden Taktenflanken, DDR gibts nur beim RAM und der ist so oder so deutlich zu langsam um direkt aus ihm zu streamen. Das mit 3 bzw. 4 Operanden hat auch nichts mit einer unterschiedlichen Anzahl an Berechnungen zu tun im Prinzip ist es ja nur A=B+C*D vs. A=A+B*C ist. Wobei mir auf anhieb kein Algorithmis einfällt, den man nicht auch mit 3 Operanden gleich schnell programmieren könnte.
Wenn man viele Daten verarbeitet ist es nun zum einen gut viele Daten-Register in der CPU zu haben (durch x86/64 immer gleich) und als nächstes einen schnellen enstsprechend breit angebundenen L1D Cache zu besitzen. Dazu muss die CPU aber auch wieder intelligent genug gewesen die Daten vorarb alle in den Cache zu laden. Ansonsten trifft ein größerer Geschwindigkeitseffekt erst ein sobald man mehrmals mit den gleichen Daten arbeitet.
Als C++ Programmierer kann man auch genauso von FMA profitieren wenn man die Compiler Flags richtig setzt.
Wenn man seine Software optimieren möchte, ist es also zum einen wichtig darauf zu achten, dass die Daten möglichst alle in den Cache passen und, dass möglichst viele Befehle auf Kernebene parallel ausgeführt werden können. Dadurch kann man in einigen Fällen schon mehrere Faktoren an Geschwindigkeit herausholen. Ob die CPU jetzt FMA3 oder FMA4 kann ist da aber eher nebensächlich. Mit 128bit vs. 256bit SIMD ist von natur aus ja auch nur maximal Faktor 2 an Geschindigkeitszuwachs möglich und das auch nur dann wenn die Cachebandbreite im gleichen Maße steigt.
Die CPU arbeitet desweiteren auch nur mit steigenden Taktenflanken, DDR gibts nur beim RAM und der ist so oder so deutlich zu langsam um direkt aus ihm zu streamen. Das mit 3 bzw. 4 Operanden hat auch nichts mit einer unterschiedlichen Anzahl an Berechnungen zu tun im Prinzip ist es ja nur A=B+C*D vs. A=A+B*C ist. Wobei mir auf anhieb kein Algorithmis einfällt, den man nicht auch mit 3 Operanden gleich schnell programmieren könnte.
Wenn man viele Daten verarbeitet ist es nun zum einen gut viele Daten-Register in der CPU zu haben (durch x86/64 immer gleich) und als nächstes einen schnellen enstsprechend breit angebundenen L1D Cache zu besitzen. Dazu muss die CPU aber auch wieder intelligent genug gewesen die Daten vorarb alle in den Cache zu laden. Ansonsten trifft ein größerer Geschwindigkeitseffekt erst ein sobald man mehrmals mit den gleichen Daten arbeitet.
Als C++ Programmierer kann man auch genauso von FMA profitieren wenn man die Compiler Flags richtig setzt.
Wenn man seine Software optimieren möchte, ist es also zum einen wichtig darauf zu achten, dass die Daten möglichst alle in den Cache passen und, dass möglichst viele Befehle auf Kernebene parallel ausgeführt werden können. Dadurch kann man in einigen Fällen schon mehrere Faktoren an Geschwindigkeit herausholen. Ob die CPU jetzt FMA3 oder FMA4 kann ist da aber eher nebensächlich. Mit 128bit vs. 256bit SIMD ist von natur aus ja auch nur maximal Faktor 2 an Geschindigkeitszuwachs möglich und das auch nur dann wenn die Cachebandbreite im gleichen Maße steigt.
WindHund
Grand Admiral Special
- Mitglied seit
- 30.01.2008
- Beiträge
- 12.225
- Renomée
- 536
- Standort
- Im wilden Süden (0711)
- Mitglied der Planet 3DNow! Kavallerie!
- Aktuelle Projekte
- NumberFields@home
- Lieblingsprojekt
- none, try all
- Meine Systeme
- RYZEN R9 3900XT @ ASRock Taichi X570 & ASUS RX Vega64
- BOINC-Statistiken
- Prozessor
- AMD Ryzen 9 5950X
- Mainboard
- ASRock 570X Taichi P5.05 Certified
- Kühlung
- AlphaCool Eisblock XPX, 366x40mm Radiator 6l Brutto m³
- Speicher
- 2x 16 GiB DDR4-3600 CL26 Kingston (Dual Rank, unbuffered ECC)
- Grafikprozessor
- 1x ASRock Radeon RX 6950XT Formula OC 16GByte GDDR6 VRAM
- Display
- SAMSUNG Neo QLED QN92BA 43" up to 4K@144Hz FreeSync PP HDR10+
- SSD
- WD_Black SN850 PCI-Express 4.0 NVME
- HDD
- 3 Stück
- Optisches Laufwerk
- 1x HL-DT-ST BD-RE BH10LS30 SATA2
- Soundkarte
- HD Audio (onboard)
- Gehäuse
- SF-2000 Big Tower
- Netzteil
- Corsair RM1000X (80+ Gold)
- Tastatur
- Habe ich
- Maus
- Han I
- Betriebssystem
- Windows 10 x64 Professional (up to date!)
- Webbrowser
- @Chrome.Google & Edge Chrome
@tex_
Was verstehst du da nicht? Ob bei einem Takt 4 Operanten erledigt sind oder 3 summiert sich doch die Aufgabenmenge.
2 Takte FMA3 = 6
2 Takte FMA4 = 8
4 Takte FMA3 = 12
4 Takte FMA4 = 16
8 Takte FMA3 = 24
8 Takte FMA4 = 32
usw. Der Abstand wird immer größer je mehr Takte folgen.
Ich hab das nicht frei aus der Nase gezogen, es gibt inzwischen auch Benchmarks die das belegen mit 30x Leistungssteigerung.
Wenn es z.B. gelingt FMA4 (& XOP) bei Spiele zu nutzen, ist es wohl die erst CPU die eine GPU bei den Berechnungen unterstützen kann.
Das ist bisher ja immer noch umgekehrt, also die GPU unterstützt die CPU.
Was verstehst du da nicht? Ob bei einem Takt 4 Operanten erledigt sind oder 3 summiert sich doch die Aufgabenmenge.
2 Takte FMA3 = 6
2 Takte FMA4 = 8
4 Takte FMA3 = 12
4 Takte FMA4 = 16
8 Takte FMA3 = 24
8 Takte FMA4 = 32
usw. Der Abstand wird immer größer je mehr Takte folgen.
Ich hab das nicht frei aus der Nase gezogen, es gibt inzwischen auch Benchmarks die das belegen mit 30x Leistungssteigerung.
Wenn es z.B. gelingt FMA4 (& XOP) bei Spiele zu nutzen, ist es wohl die erst CPU die eine GPU bei den Berechnungen unterstützen kann.
Das ist bisher ja immer noch umgekehrt, also die GPU unterstützt die CPU.
Wu134
Grand Admiral Special
- Mitglied seit
- 24.04.2006
- Beiträge
- 2.169
- Renomée
- 29
- Standort
- bei Ulm
- Mein Laptop
- Lenovo U41-70
- Prozessor
- AMD Athlon X4 860K
- Mainboard
- Gigabyte GA-F2A78M-DS2
- Kühlung
- Arctic Freezer Extreme
- Speicher
- G.Skill Ripjaws 2 x 4 GB DDR3-2133
- Grafikprozessor
- AMD RX460 2 GB
- Display
- 19" BenQ FP91GP 1280x1024
- SSD
- Crucial M500 120 GB
- HDD
- Samsung F2 500 GB
- Optisches Laufwerk
- Samsung SH-S183A
- Soundkarte
- onboard Realtek HD
- Gehäuse
- Coolermaster Centurion 5 + Silentmaxx Dämmung
- Netzteil
- BeQuiet L7 300W
- Betriebssystem
- Windows 10 x64
- Webbrowser
- Firefox
- Verschiedenes
- Idle 44 W, Prime95 133 W, Spiele ca. 170 W
@tex_
Was verstehst du da nicht? Ob bei einem Takt 4 Operanten erledigt sind oder 3 summiert sich doch die Aufgabenmenge.
2 Takte FMA3 = 6
2 Takte FMA4 = 8
4 Takte FMA3 = 12
4 Takte FMA4 = 16
8 Takte FMA3 = 24
8 Takte FMA4 = 32
usw. Der Abstand wird immer größer je mehr Takte folgen.
Ich hab das nicht frei aus der Nase gezogen, es gibt inzwischen auch Benchmarks die das belegen mit 30x Leistungssteigerung.
Wenn es z.B. gelingt FMA4 (& XOP) bei Spiele zu nutzen, ist es wohl die erst CPU die eine GPU bei den Berechnungen unterstützen kann.
Das ist bisher ja immer noch umgekehrt, also die GPU unterstützt die CPU.
Das bleibt trotzdem linear. Bei 8000 Takten wären es dann 24000 zu 32000. 4 zu 3 bleibt 33% mehr, egal in welcher Zeit. Sonst müsste ein Haswell ja auch 30x schneller sein als ein AMD-Prozessor. Außer FMA4 ist ein Codewort für einen Prozessor mit Wurmloch-Technologie
Ob FMA4 jemals eine Verbreitung erreicht, dass man es als relevant einstufen kann, wage ich zu bezweifeln. Ich erinnere nur an die 3DNow!-Einheit. Auch gelobt und gehypt und innerhalb kürzester Zeit vom Markt verschwunden ... AMD sollte eher mal dafür sorgen, dass vorhandene Features genutzt werden, anstatt immer mehr Features zu integrieren, die nur halbherzig genutzt werden und den Namen "Feature" kaum verdienen.
Gruß
Die offizielle Vorstellung von Beema und Mullins? Vom Bild her würde ich irgendwas mit Hardware vermuten ist aber ein schwaches Indiz. Mir wäre ja der 7600 Kaveri am liebsten aber das dauert ja noch.
Server-APU´s? Naja wird nur noch sinnlose Raten.
E: Ja ich gehe auch von Beema aus der Rest war mehr Wunschdenken
Server-APU´s? Naja wird nur noch sinnlose Raten.
E: Ja ich gehe auch von Beema aus der Rest war mehr Wunschdenken
Zuletzt bearbeitet:
BavarianRealist
Grand Admiral Special
- Mitglied seit
- 06.02.2010
- Beiträge
- 3.358
- Renomée
- 80
Beema dürfte vor der Türe stehen, wenn es schon erste Angebote von Notebooks mit Beema von Händlern gibt. Lenovo, Toshiba und Co wollen ihre neuen Produkte jetzt auch verkaufen dürfen, oder?
LoRDxRaVeN
Grand Admiral Special
- Mitglied seit
- 20.01.2009
- Beiträge
- 4.169
- Renomée
- 64
- Standort
- Oberösterreich - Studium in Wien
- Mein Laptop
- Lenovo Thinkpad Edge 11
- Prozessor
- Phenom II X4 955 C3
- Mainboard
- Gigabyte GA-MA790X-DS4
- Kühlung
- Xigmatek Thor's Hammer + Enermax Twister Lüfter
- Speicher
- 4 x 1GB DDR2-800 Samsung
- Grafikprozessor
- Sapphire HD4870 512MB mit Referenzkühler
- Display
- 22'' Samung SyncMaster 2233BW 1680x1050
- HDD
- Hitachi Deskstar 250GB, Western Digital Caviar Green EADS 1TB
- Optisches Laufwerk
- Plextor PX-130A, Plextor Px-716SA
- Soundkarte
- onboard
- Gehäuse
- Aspire
- Netzteil
- Enermax PRO82+ II 425W ATX 2.3
- Betriebssystem
- Windows 7 Professional Studentenversion
- Webbrowser
- Firefox siebenunddreißigsttausend
- Schau Dir das System auf sysprofile.de an
War da vorher ein anderes Bild oder (noch) weniger zu sehen? Jetzt ist da DIE-Shot zu sehen:Vom Bild her würde ich irgendwas mit Hardware vermuten ist aber ein schwaches Indiz.
Das gebliche vom Hervorgehobenen sollte der Level 2 Cache in zwei Blöcken sein, die vier gleichen Blöcke direkt darunter die vier CPU Kerne, da oben der Speichercontroller und unten das meiste die GPU.
LG.
WindHund
Grand Admiral Special
- Mitglied seit
- 30.01.2008
- Beiträge
- 12.225
- Renomée
- 536
- Standort
- Im wilden Süden (0711)
- Mitglied der Planet 3DNow! Kavallerie!
- Aktuelle Projekte
- NumberFields@home
- Lieblingsprojekt
- none, try all
- Meine Systeme
- RYZEN R9 3900XT @ ASRock Taichi X570 & ASUS RX Vega64
- BOINC-Statistiken
- Prozessor
- AMD Ryzen 9 5950X
- Mainboard
- ASRock 570X Taichi P5.05 Certified
- Kühlung
- AlphaCool Eisblock XPX, 366x40mm Radiator 6l Brutto m³
- Speicher
- 2x 16 GiB DDR4-3600 CL26 Kingston (Dual Rank, unbuffered ECC)
- Grafikprozessor
- 1x ASRock Radeon RX 6950XT Formula OC 16GByte GDDR6 VRAM
- Display
- SAMSUNG Neo QLED QN92BA 43" up to 4K@144Hz FreeSync PP HDR10+
- SSD
- WD_Black SN850 PCI-Express 4.0 NVME
- HDD
- 3 Stück
- Optisches Laufwerk
- 1x HL-DT-ST BD-RE BH10LS30 SATA2
- Soundkarte
- HD Audio (onboard)
- Gehäuse
- SF-2000 Big Tower
- Netzteil
- Corsair RM1000X (80+ Gold)
- Tastatur
- Habe ich
- Maus
- Han I
- Betriebssystem
- Windows 10 x64 Professional (up to date!)
- Webbrowser
- @Chrome.Google & Edge Chrome
OK, ich sehe es ein, da habe ich was verdreht!Das bleibt trotzdem linear. Bei 8000 Takten wären es dann 24000 zu 32000. 4 zu 3 bleibt 33% mehr, egal in welcher Zeit. Sonst müsste ein Haswell ja auch 30x schneller sein als ein AMD-Prozessor. Außer FMA4 ist ein Codewort für einen Prozessor mit Wurmloch-Technologie
Ob FMA4 jemals eine Verbreitung erreicht, dass man es als relevant einstufen kann, wage ich zu bezweifeln. Ich erinnere nur an die 3DNow!-Einheit. Auch gelobt und gehypt und innerhalb kürzester Zeit vom Markt verschwunden ... AMD sollte eher mal dafür sorgen, dass vorhandene Features genutzt werden, anstatt immer mehr Features zu integrieren, die nur halbherzig genutzt werden und den Namen "Feature" kaum verdienen.
Gruß
Haswell kann auch doppelt so schnell sein, wenn AVX2 genutzt wird.
Übrigens ist die Aufspaltung der Sets Intel zu verdanken, sie wollten kein SSE5 sondern 3 Operanten AVX.
Bezüglich AMD 3DNow!, der prefetcher ist heute auch bei den FX vorhanden, also so nutzlos kann es nicht gewesen sein.
@lordxraven
Wenn das Beema ist, dann ist Beema ein Kabini. Der Dieshot sieht jedenfalls bis ins Detail wie der von Kabini aus. Damit dürfte wohl primär der Turbo neu sein (das wäre dann eher ein neues Stepping) und möglicherweise ne andere Fertigung.
Jetzt hoffe ich noch auf eine extra-Maske für Mullins.
Wenn das Beema ist, dann ist Beema ein Kabini. Der Dieshot sieht jedenfalls bis ins Detail wie der von Kabini aus. Damit dürfte wohl primär der Turbo neu sein (das wäre dann eher ein neues Stepping) und möglicherweise ne andere Fertigung.
Jetzt hoffe ich noch auf eine extra-Maske für Mullins.
WindHund
Grand Admiral Special
- Mitglied seit
- 30.01.2008
- Beiträge
- 12.225
- Renomée
- 536
- Standort
- Im wilden Süden (0711)
- Mitglied der Planet 3DNow! Kavallerie!
- Aktuelle Projekte
- NumberFields@home
- Lieblingsprojekt
- none, try all
- Meine Systeme
- RYZEN R9 3900XT @ ASRock Taichi X570 & ASUS RX Vega64
- BOINC-Statistiken
- Prozessor
- AMD Ryzen 9 5950X
- Mainboard
- ASRock 570X Taichi P5.05 Certified
- Kühlung
- AlphaCool Eisblock XPX, 366x40mm Radiator 6l Brutto m³
- Speicher
- 2x 16 GiB DDR4-3600 CL26 Kingston (Dual Rank, unbuffered ECC)
- Grafikprozessor
- 1x ASRock Radeon RX 6950XT Formula OC 16GByte GDDR6 VRAM
- Display
- SAMSUNG Neo QLED QN92BA 43" up to 4K@144Hz FreeSync PP HDR10+
- SSD
- WD_Black SN850 PCI-Express 4.0 NVME
- HDD
- 3 Stück
- Optisches Laufwerk
- 1x HL-DT-ST BD-RE BH10LS30 SATA2
- Soundkarte
- HD Audio (onboard)
- Gehäuse
- SF-2000 Big Tower
- Netzteil
- Corsair RM1000X (80+ Gold)
- Tastatur
- Habe ich
- Maus
- Han I
- Betriebssystem
- Windows 10 x64 Professional (up to date!)
- Webbrowser
- @Chrome.Google & Edge Chrome
Von Masken über shots, alles nix Wert, wenn es nicht Gehaltvoll ist.
Etwas Vitamin B12 mit C, gibt 6 Kerne oder 12 Threads. "Split it" ist die devise!
Neues Programm, neues Glück: http://www.forum-3dcenter.org/vbulletin/showpost.php?p=10123748&postcount=145
Jeder ist Willkommen: http://www.youtube.com/watch?v=84dkXoqzB-o
Etwas Vitamin B12 mit C, gibt 6 Kerne oder 12 Threads. "Split it" ist die devise!
Neues Programm, neues Glück: http://www.forum-3dcenter.org/vbulletin/showpost.php?p=10123748&postcount=145
Jeder ist Willkommen: http://www.youtube.com/watch?v=84dkXoqzB-o
Von Masken über shots, alles nix Wert, wenn es nicht Gehaltvoll ist.
Etwas Vitamin B12 mit C, gibt 6 Kerne oder 12 Threads. "Split it" ist die devise!
Neues Programm, neues Glück: http://www.forum-3dcenter.org/vbulletin/showpost.php?p=10123748&postcount=145
Jeder ist Willkommen: http://www.youtube.com/watch?v=84dkXoqzB-o
Und du willst genau was damit sagen?
FalconFly
Admiral Special
Die 15% sind halt die üblichen Häppchen damit der Kunde bei Laune gehalten wird.
Wenn ich es richtig verstanden habe, dann kann FMA4 vier Operanten pro cycle ausführen.
Ein cycle hat eine abfallende und eine ansteigende Flanke (DDR),
Das würde bedeuten, wenn man eine 4 Operanten Software mit 3 Operanten vergleicht wird diese mit zunehmender Laufzeit immer schneller, da pro Takt (DDR) immer eine "Aufgabe" mehr erledigt wird.
Das erklärt dann natürlich auch die 30x Beschleunigung, es ist also Grundsätzlich Möglich.
Ist nur die Frage wieviel der Programmierer dafür haben will, denn mit Konverter geht das nicht, da muss man von vorne Anfangen und alles neu Programmieren.
Also schlechte Zeiten für C++
*ugh*
Meine Einschaetzung dieser ~15% sind die Grenzen des erfahrungsgemaess - mit vertretbarem Aufwand - machbaren. Sicher sind mit Handoptimierung zur Laufzeit noch etliche Prozente drin - aber dahinter steckt dann architekturspezifisches Know-how eines sehr faehigen ASM-Coders und der sehr betraechtliche Arbeitsaufwand.
Das ist allerdings nicht der Standard (leider), ganz im Gegenteil. Den Standard setzen nunmal die Faehigkeiten der Compiler.
Den Rest verstehe ich ehrlich gesagt nicht, denn es macht keinen Sinn. Diese CPU-Funktionen haben nichts mit Taktflanken zu tun (deren Instructions/Data sollte besser eh nicht aus dem DDR-RAM kommen sondern aus den deutlich leistungsfaehigeren Caches). Da wird definitiv nichts "zur Laufzeit" immer schneller (das waere wohl einer der kuriosesten Speedpathes, der jemals in einer CPU gefunden wurde - und muesste sofort von AMD durch ein Errata/neue Maske oder Microcode Patch behoben werden)
PS.
Einer der Hauptgruende fuer deine extreme Ueberschaetzung der Beschleunigung scheint mir, dass du u.U. nicht weisst, dass viele Rechenprobleme gar nicht mit derartigen Funktionen beschleunigt werden koennen.
Es sind Spezial-Funktionen fuer sehr spezielle Probleme und nicht in der Lage, "allgemeinen Code" ueberhaupt effektiv zu bearbeiten - geschweige denn zu beschleunigen.
Wenn sie mal anspringen, sind es sehr gute Sprinter - leider ist Alltagscode zudem eher eine vielfaeltige Decathlon-Disziplin und der Sprint faellt am Ende nur gering in's Gewicht. Ausnahmen gibt's nur wenige - aber immerhin sieht man zumindest bei denen dann sehr ordentliche Beschleunigung (darunter fallen oft Packer oder Krypto-Programme, sonst fallen mir nur z.B. handoptimierte BOINC CPU Clients ein - gerade bei denen haben sich einige Leute sehr viel Muehe gegeben und alles rausgeholt, was ueberhaupt geht [ selbst da war so etwas wie Faktor 2x schneller bereits geradezu sensationell ] ).
Zuletzt bearbeitet:
WindHund
Grand Admiral Special
- Mitglied seit
- 30.01.2008
- Beiträge
- 12.225
- Renomée
- 536
- Standort
- Im wilden Süden (0711)
- Mitglied der Planet 3DNow! Kavallerie!
- Aktuelle Projekte
- NumberFields@home
- Lieblingsprojekt
- none, try all
- Meine Systeme
- RYZEN R9 3900XT @ ASRock Taichi X570 & ASUS RX Vega64
- BOINC-Statistiken
- Prozessor
- AMD Ryzen 9 5950X
- Mainboard
- ASRock 570X Taichi P5.05 Certified
- Kühlung
- AlphaCool Eisblock XPX, 366x40mm Radiator 6l Brutto m³
- Speicher
- 2x 16 GiB DDR4-3600 CL26 Kingston (Dual Rank, unbuffered ECC)
- Grafikprozessor
- 1x ASRock Radeon RX 6950XT Formula OC 16GByte GDDR6 VRAM
- Display
- SAMSUNG Neo QLED QN92BA 43" up to 4K@144Hz FreeSync PP HDR10+
- SSD
- WD_Black SN850 PCI-Express 4.0 NVME
- HDD
- 3 Stück
- Optisches Laufwerk
- 1x HL-DT-ST BD-RE BH10LS30 SATA2
- Soundkarte
- HD Audio (onboard)
- Gehäuse
- SF-2000 Big Tower
- Netzteil
- Corsair RM1000X (80+ Gold)
- Tastatur
- Habe ich
- Maus
- Han I
- Betriebssystem
- Windows 10 x64 Professional (up to date!)
- Webbrowser
- @Chrome.Google & Edge Chrome
Eigentlich nichts spezielles, es gibt nicht viele Programme wo ein FX bei Single Threadleistung einen 6C/12T überholt.Und du willst genau was damit sagen?
Interessanter weiße entsteht das Ergebnis nur mit einer langen Laufzeit und mit großen Datenaufwand.
@FalconFly
IPC wird meist falsch verstanden, das bedeutet nicht "Instructions per clock" sondern "per cycle".
Danke für deine Erklärung.
Raspo
Admiral Special
- Mitglied seit
- 12.02.2008
- Beiträge
- 1.981
- Renomée
- 36
- Standort
- Hamburg
- Mitglied der Planet 3DNow! Kavallerie!
- BOINC-Statistiken
- Folding@Home-Statistiken
- Mein Laptop
- Oneplus 6 64GB
- Prozessor
- Ryzen 3900X@65W
- Mainboard
- Asus Crosshair VI Hero
- Kühlung
- be quiet silent loop 280
- Speicher
- 4x 8 GB G.Skill Trident Z RGB @3600CL16
- Grafikprozessor
- Sapphire Pulse Vega 56
- Display
- Philips 436M6
- SSD
- Samsung 960 Evo
- HDD
- Intel SSD 80GB, WD Scorpio 620GB HDD für Boinc
- Soundkarte
- onboard @ Dali Zensor 1
- Gehäuse
- Phanteks Evolv ATX TG
- Netzteil
- Seasonic Prime 660W Platinum
- Betriebssystem
- Win 10 64bit Pro
- Webbrowser
- Firefox
Naja, es könnte theoretisch auch der ARM-Opteron vorgestellt werden.
Aber ich tippe auch auf Beema.
Aber ich tippe auch auf Beema.
@LoRDxRaVeN
War tatsächlich weniger vom Die zu sehen, der eingekreiste Teil war noch nicht da. Hab aber eher auf Beema spekuliert weil sonst nichts Sinn macht.
Eigentlich nichts spezielles, es gibt nicht viele Programme wo ein FX bei Single Threadleistung einen 6C/12T überholt.
Sehe da jetzt nichts besonderes. Das sind alles übertaktete Systeme mit den unterschiedlichsten Speichereinstellungen.
Dazu kommt das der FX im Schnitt bei der Listung dort immer gute 500-600MHz mehr an Takt, sowie HighSpeed-Ram braucht um im ST auf das gleiche Level wie Ivy/Hsw zu kommen mit DDR3-1600er RAM. Ein Sandy mit 1833er RAM ist dann wieder unerreichbar für den FX mit einem GHZ mehr in ST.
Ohne NB/HT OC gehts auch nicht.
Eigentlich nicht. Die Unterschiede zwischen Low/Mid/High sind mehr oder weniger rel. gleich.Interessanter weiße entsteht das Ergebnis nur mit einer langen Laufzeit und mit großen Datenaufwand.
Ähnliche Themen
- Antworten
- 728
- Aufrufe
- 50K
- Antworten
- 0
- Aufrufe
- 2K
- Antworten
- 0
- Aufrufe
- 1K
- Antworten
- 763
- Aufrufe
- 100K