Planet 3DNow! - Das Online-Magazin für den AMD-User

AKTUELLE NEWSMELDUNGEN

Intern: Umleitungsprobleme
Intern: Planet 3DNow! ab 18:00 Uhr eingeschränkt erreichbar
Never Settle Forever: AMD überlässt Zusammenstellung der Spielebündel seinen Kunden
Microsoft Patchday August 2013
Der Partner-Webwatch von Planet 3DNow! (13.08.2013)
Kühler- und Gehäuse-Webwatch (11.08.2013)
Ankündigung Microsoft Patchday August 2013
Vorerst kein Frame Pacing für AMD-Systeme mit Dual Graphics
Intern: kommende Woche eingeschränkte Erreichbarkeit auf Planet 3DNow!
Kaveri verschoben und keine neuen FX-Prozessoren von AMD [3. Update]
AMD plant Vorstellung neuer High-End-Grafikkarte Hawaii im September
Kaveri verschoben und keine neuen FX-Prozessoren von AMD [Update]
Der Partner-Webwatch von Planet 3DNow! (06.08.2013)
Kaveri verschoben und keine neuen FX-Prozessoren von AMD
AMD startet neue "Never-Settle-Forever"-Spielebündel für Radeon Grafikkarten
Neuer Artikel: SilverStone Fortress FT04 - Die Hardware steht Kopf

AKTUELLE DOWNLOADS

AMD Catalyst 13.8 Beta für Windows und Linux - Frame Pacing für CrossFire-Gespanne
NVIDIA GeForce Grafiktreiber 320.49 WHQL
CPUID HWMonitor 1.23
CPUID CPU-Z 1.65
AMD Catalyst 13.6 Beta 2 für Windows
FinalWire veröffentlicht neue AIDA64 Version 3.00
AMD Catalyst 13.6 Beta für Windows und Linux
AMD Catalyst 13.5 CAP1 - Neue Profile auch für Single-GPU-Systeme
AMD Catalyst 13.4 Beta Legacy für Radeon HD 2000, HD 3000 und HD 4000
AMD Catalyst 13.4 Proprietary Linux Display Driver
AMD Catalyst 13.5 Beta für Windows
AMD Catalyst 13.4 CAP1 - Neue Profile auch für Single-GPU- und Enduro-Systeme
AMD Catalyst 13.4 WHQL Desktop- und Notebook-Grafiktreiber
CPUID CPU-Z 1.64
TechPowerUp GPU-Z v0.7.0
AMD Catalyst 13.3 Beta 3 für Windows und Linux

AKTUELLE ARTIKEL

SilverStone Fortress FT04 - Die Hardware steht Kopf
Zalman CNPS5X Performa
Thermalright AXP-200
Fractal Design Arc Midi R2
mITX-Gehäuse: Inter-Tech Q-6 & E-i7
Antec HCG-750M und HCG-850M
Die neue Basis für unsere mITX-Gehäusetests: MSIs FM2-A75IA-E53
ASUS SABERTOOTH/GEN3 R2.0
Cooler Master B500 500W
Fujitsu STYLISTIC Q572 mit AMD Z-60 APU
AMD A10 6800K und A10 6700 im Test - neue APUs, alter Kern
Coby MID8065-8
Noctua NH-U12S und NH-U14S
Akasa AK-CC1101EP02 & Xigmatek Praeton LD963
mITX-Gehäuse - Cooltek Coolcube Mini
Weitere aktuelle Artikel, Tests, Guides, und Kolumnen...

QUICK LINKS

FORUM AKTUELL

UMFRAGE

PREISTICKER

PARTNERWEBSITES

COMMUNITY

SETI@HOME TEAM

GAMESERVER

PLANET 3D GAMES

KRAWALL NETWORK

archiv

Doping für CPUs - Möglichkeiten der Leistungssteigerung

Von: D'Espice
18. November 2002

Artikel-Index:

Mögliche Hebel zum Zweck der Leistungssteigerung (Fortsetzung)

Superskalare Arbeitsweise
Die von-Neumann Architektur für Mikroprozessoren definiert einen Computer sehr genau. So hat ein von-Neumann Prozessor strikt seriell und immer nach bestimmtem Schema zu arbeiten. Wer mit der von-Neumann Architektur noch nicht vertraut ist, dem sei empfohlen, dem Link zu folgen, schließlich stellt diese Architektur bis heute die Grundlage jeglicher Mikroprozessoren dar.

Mit einem strikt dieser Architektur folgenden Mikroprozessor würde man jedoch niemals eine IPC > 1 erreichen können. Die Tatsache, dass heutige Prozessoren einen IPC >> 1 haben, gründet schlicht und ergreifend auf der Tatsache, dass die Ingenieure die von-Neumann Architektur nach eigenen Vorstellung etwas verbogen haben und den Mikroprozessoren, beginnend mit dem Intel Pentium (586), die superskalare Arbeitsweise beigebracht haben.
Ein superskalarer Mikroprozessor unterscheidet sich hauptsächlich im Leitwerk von einem nicht-superskalaren Mikroprozessor. So teilt dieses einer Recheneinheit nicht mehr lediglich eine Instruktion pro Takt zu, sondern gleich mehrere unterschiedliche Instruktionen für mehrere unterschiedliche Recheneinheiten. Der Mikroprozessor ist somit in der Lage, mehrere Instruktionen parallel abzuarbeiten, solange diese oder ihr Ergebnis nicht voneinander abhängig sind. Somit kann ein zweifach superskalarer Mikroprozessor bei gleichem Takt im Idealfall doppelt so viele Instruktionen pro Sekunde abarbeiten, wie ein serieller Mikroprozessor.
Dieser Effekt wird erreicht, indem an unterschiedlichen Stellen der Mikroprozessor optimiert wird. So muss beispielsweise der Decoder mehr als nur eine Instruktion pro Taktzyklus decodieren können, es müssen mehrere voneinander unabhängige Recheneinheiten vorhanden sein und auch die interne Bandbreite muss stimmen. So versauern beispielsweise im Falle des Pentium 4 pro Taktzyklus sechs Recheneinheiten, da der Trace-Cache lediglich einen Durchsatz von 3 µOps/Takt erreicht.

Die erste Implementierung superskalarer Arbeitsweise fand im 586 (Intel Pentium) statt, der grundsätzlich nicht mehr ist, als ein superskalarer 80486 mit zweistufigem Decoder. Die sog. U-V Struktur des Decoders wurde alsbald von der 4-1-1 Struktur des Decoders des 686 (Intel Pentium Pro), der nun dreistufig arbeitet, abgelöst.

Out-of-order Execution
Eine weitere Möglichkeit der Laufzeitoptimierung ist die sog. Out-of-Order Execution (zu Deutsch: "Ausführung außerhalb der Reihenfolge"). Sie bietet einen enormen Zuwachs an Geschwindigkeit, denn plötzlich können Instruktionen bereits ausgeführt werden auch wenn sie noch gar nicht an der Reihe wären (Stichwort: Serieller Programmfluss der von-Neumann Architektur). Um dies besser verständlich zu machen, ein kleines Beispiel:
Nehmen wir an, dass eine Instruktion Daten aus dem Speicher einlesen muss. Dies führt dazu, dass der Prozessor für mehrere hundert bis tausend Taktzyklen auf die Daten warten muss und quasi zum Nichtstun verdammt ist. Gibt es jedoch in der Pipeline Instruktionen, die von der derzeit auf Daten aus dem Speicher wartenden Instruktion weder abhängen noch mit ihr in Zusammenhang stehen, kann der Prozessor die nötige Wartezeit mit der Ausführung dieser Instruktionen überbrücken.
In Zusammenhang mit hohem ILP und TLP (siehe folgendes Kapitel) kann eine enorme Verbesserung der Performance, ohne notwendige Eingriffe seitens des Programmierers oder Compilers, erreicht werden.

Seite 4/20

Nach oben