Planet 3DNow! - Das Online-Magazin für den AMD-User

AKTUELLE NEWSMELDUNGEN

Intern: Umleitungsprobleme
Intern: Planet 3DNow! ab 18:00 Uhr eingeschränkt erreichbar
Never Settle Forever: AMD überlässt Zusammenstellung der Spielebündel seinen Kunden
Microsoft Patchday August 2013
Der Partner-Webwatch von Planet 3DNow! (13.08.2013)
Kühler- und Gehäuse-Webwatch (11.08.2013)
Ankündigung Microsoft Patchday August 2013
Vorerst kein Frame Pacing für AMD-Systeme mit Dual Graphics
Intern: kommende Woche eingeschränkte Erreichbarkeit auf Planet 3DNow!
Kaveri verschoben und keine neuen FX-Prozessoren von AMD [3. Update]
AMD plant Vorstellung neuer High-End-Grafikkarte Hawaii im September
Kaveri verschoben und keine neuen FX-Prozessoren von AMD [Update]
Der Partner-Webwatch von Planet 3DNow! (06.08.2013)
Kaveri verschoben und keine neuen FX-Prozessoren von AMD
AMD startet neue "Never-Settle-Forever"-Spielebündel für Radeon Grafikkarten
Neuer Artikel: SilverStone Fortress FT04 - Die Hardware steht Kopf

AKTUELLE DOWNLOADS

AMD Catalyst 13.8 Beta für Windows und Linux - Frame Pacing für CrossFire-Gespanne
NVIDIA GeForce Grafiktreiber 320.49 WHQL
CPUID HWMonitor 1.23
CPUID CPU-Z 1.65
AMD Catalyst 13.6 Beta 2 für Windows
FinalWire veröffentlicht neue AIDA64 Version 3.00
AMD Catalyst 13.6 Beta für Windows und Linux
AMD Catalyst 13.5 CAP1 - Neue Profile auch für Single-GPU-Systeme
AMD Catalyst 13.4 Beta Legacy für Radeon HD 2000, HD 3000 und HD 4000
AMD Catalyst 13.4 Proprietary Linux Display Driver
AMD Catalyst 13.5 Beta für Windows
AMD Catalyst 13.4 CAP1 - Neue Profile auch für Single-GPU- und Enduro-Systeme
AMD Catalyst 13.4 WHQL Desktop- und Notebook-Grafiktreiber
CPUID CPU-Z 1.64
TechPowerUp GPU-Z v0.7.0
AMD Catalyst 13.3 Beta 3 für Windows und Linux

AKTUELLE ARTIKEL

SilverStone Fortress FT04 - Die Hardware steht Kopf
Zalman CNPS5X Performa
Thermalright AXP-200
Fractal Design Arc Midi R2
mITX-Gehäuse: Inter-Tech Q-6 & E-i7
Antec HCG-750M und HCG-850M
Die neue Basis für unsere mITX-Gehäusetests: MSIs FM2-A75IA-E53
ASUS SABERTOOTH/GEN3 R2.0
Cooler Master B500 500W
Fujitsu STYLISTIC Q572 mit AMD Z-60 APU
AMD A10 6800K und A10 6700 im Test - neue APUs, alter Kern
Coby MID8065-8
Noctua NH-U12S und NH-U14S
Akasa AK-CC1101EP02 & Xigmatek Praeton LD963
mITX-Gehäuse - Cooltek Coolcube Mini
Weitere aktuelle Artikel, Tests, Guides, und Kolumnen...

QUICK LINKS

FORUM AKTUELL

UMFRAGE

PREISTICKER

PARTNERWEBSITES

COMMUNITY

SETI@HOME TEAM

GAMESERVER

PLANET 3D GAMES

KRAWALL NETWORK

archiv

Doping für CPUs - Möglichkeiten der Leistungssteigerung

Von: D'Espice
18. November 2002

Artikel-Index:

Ansätze der Optimierung per Hardware (Fortsetzung)

Symmetric Multi-Processing (Fortsetzung)
Ein weiteres Problem stellt die Kohärenz der Inhalte der unterschiedlichen Cache-Hierarchien dar. Cache-Kohärenz bedeutet die Wahrung der Gültigkeit der Inhalte der Caches. Wird beispielsweise ein Wert aus dem Arbeitsspeicher von beiden Prozessoren in den jeweils eigenen Cache geladen und von einem anschließend verändert wieder zurückgeschrieben, muss der zweite Prozessor von diesem Vorgang Wissen haben, um seine eigenen Caches entsprechend zu aktualisieren.

SMP-Systeme haben hierfür ein sog. Cache-Kohärenz Protokoll, welches für die Korrektheit der Daten sorgt.
Das Protokoll mit der höchsten Verbreitung ist das sog. MESI-Protokoll. Jeder der Buchstaben steht hierbei für einen bestimmten Zustand einer Cache-Line, die einzelnen Zustände sind wie folgt definiert:

Modified: Der Inhalt im Arbeitsspeicher wurde seit dem spiegeln in den lokalen Prozessorcache modifiziert und stimmt somit nicht mehr überein
Exclusive: Der Inhalt im Arbeitsspeicher stimmt noch mit dem gespiegelten Inhalt im Cache überein. Die Cache-Line befindet sich nur im Cache eines einzelnen Prozessors.
Shared: Wie Exclusive, nur mit der Unterscheidung dass sich die Cache-Line in mehreren Caches befindet. Bei Aktualisierung der ursprünglichen Daten im Arbeitsspeicher werden alle Caches auf den neuesten Stand gebracht.
Invalid: Der Inhalt im Prozessorcache ist ungültig, ein Zugriff erzeugt einen Cache-Miss. Die Daten müssen neu aus dem Arbeitsspeicher geladen werden.

Die Erhaltung der Korrektheit der Daten (auf fachchinesisch Kohärenz genannt) kostet jedoch ein klein wenig Performance, was je nach Umsetzung des Protokolls unterschiedlich gravierend ausfallen kann.
Eine Erweiterung des MESI-Protokolls stellt das noch nicht so verbreitete MOESI-Protokoll dar. Es ist im Grunde genommen zum MESI-Protokoll 100%ig kompatibel, kennt jedoch noch einen zusätzlichen Status:

Owner: Zeigt an in welchem Cache welches Prozessors sich die Daten befinden. Somit können andere Prozessoren bei Bedarf diese Daten aus dem Cache anfordern und sparen sich den dazu im Vergleich sehr langsamen Hauptspeicherzugriff.

Hierbei passiert folgendes: Stellt CPU1 einen Read-Request auf einen bestimmten Speicherbereich (1) wird dieser in der Regel direkt aus dem Arbeitsspeicher in den Cache der CPU geladen. Merkt die Chipsatzlogik jedoch, dass eine weitere sich im System befindliche CPU genau diesen Speicherbereich bereits im Cache hat, so wird der Read-Request vom langesamen Arbeitsspeicher auf den schnellen Cache der betreffenden CPU umgeleitet. (2)

Die betreffende CPU (im Beispiel CPU0) überträgt die Cache-Line anschließend zum Chipsatz, (3) welcher sie direkt weiterleitet an CPU1 (4). Somit werden massiv Taktzyklen eingespart die beim Zugriff auf den im Vergleich zum schnellen Cache um den Faktor hundert bis einige Tausend langsameren Arbeitsspeicher mit Nichtstun verbracht worden wären.
Weiterhin profitiert auch der Speicherbus von dieser Taktik, da weniger Zugriffe auf den Speicherbus stattfinden und er somit für andere Aufgaben verfügbar ist.

Der durch die Wahrung der Kohärenz verursachte Performanceverlust wird durch effiziente Umsetzung des MOESI-Protokolls anstelle des MESI-Protokolls wieder mehr als wettgemacht.

Seite 12/20

Nach oben