Planet 3DNow! - Das Online-Magazin für den AMD-User

AKTUELLE NEWSMELDUNGEN

Intern: Umleitungsprobleme
Intern: Planet 3DNow! ab 18:00 Uhr eingeschränkt erreichbar
Never Settle Forever: AMD überlässt Zusammenstellung der Spielebündel seinen Kunden
Microsoft Patchday August 2013
Der Partner-Webwatch von Planet 3DNow! (13.08.2013)
Kühler- und Gehäuse-Webwatch (11.08.2013)
Ankündigung Microsoft Patchday August 2013
Vorerst kein Frame Pacing für AMD-Systeme mit Dual Graphics
Intern: kommende Woche eingeschränkte Erreichbarkeit auf Planet 3DNow!
Kaveri verschoben und keine neuen FX-Prozessoren von AMD [3. Update]
AMD plant Vorstellung neuer High-End-Grafikkarte Hawaii im September
Kaveri verschoben und keine neuen FX-Prozessoren von AMD [Update]
Der Partner-Webwatch von Planet 3DNow! (06.08.2013)
Kaveri verschoben und keine neuen FX-Prozessoren von AMD
AMD startet neue "Never-Settle-Forever"-Spielebündel für Radeon Grafikkarten
Neuer Artikel: SilverStone Fortress FT04 - Die Hardware steht Kopf

AKTUELLE DOWNLOADS

AMD Catalyst 13.8 Beta für Windows und Linux - Frame Pacing für CrossFire-Gespanne
NVIDIA GeForce Grafiktreiber 320.49 WHQL
CPUID HWMonitor 1.23
CPUID CPU-Z 1.65
AMD Catalyst 13.6 Beta 2 für Windows
FinalWire veröffentlicht neue AIDA64 Version 3.00
AMD Catalyst 13.6 Beta für Windows und Linux
AMD Catalyst 13.5 CAP1 - Neue Profile auch für Single-GPU-Systeme
AMD Catalyst 13.4 Beta Legacy für Radeon HD 2000, HD 3000 und HD 4000
AMD Catalyst 13.4 Proprietary Linux Display Driver
AMD Catalyst 13.5 Beta für Windows
AMD Catalyst 13.4 CAP1 - Neue Profile auch für Single-GPU- und Enduro-Systeme
AMD Catalyst 13.4 WHQL Desktop- und Notebook-Grafiktreiber
CPUID CPU-Z 1.64
TechPowerUp GPU-Z v0.7.0
AMD Catalyst 13.3 Beta 3 für Windows und Linux

AKTUELLE ARTIKEL

SilverStone Fortress FT04 - Die Hardware steht Kopf
Zalman CNPS5X Performa
Thermalright AXP-200
Fractal Design Arc Midi R2
mITX-Gehäuse: Inter-Tech Q-6 & E-i7
Antec HCG-750M und HCG-850M
Die neue Basis für unsere mITX-Gehäusetests: MSIs FM2-A75IA-E53
ASUS SABERTOOTH/GEN3 R2.0
Cooler Master B500 500W
Fujitsu STYLISTIC Q572 mit AMD Z-60 APU
AMD A10 6800K und A10 6700 im Test - neue APUs, alter Kern
Coby MID8065-8
Noctua NH-U12S und NH-U14S
Akasa AK-CC1101EP02 & Xigmatek Praeton LD963
mITX-Gehäuse - Cooltek Coolcube Mini
Weitere aktuelle Artikel, Tests, Guides, und Kolumnen...

QUICK LINKS

FORUM AKTUELL

UMFRAGE

PREISTICKER

PARTNERWEBSITES

COMMUNITY

SETI@HOME TEAM

GAMESERVER

PLANET 3D GAMES

KRAWALL NETWORK

archiv

Doping für CPUs - Möglichkeiten der Leistungssteigerung

Von: D'Espice
18. November 2002

Artikel-Index:

Neue und alte Möglichkeiten der Leistungssteigerung - per Hardware (Fortsetzung)

Simultaneous Multi-Threading (Fortsetzung)
Da eine detaillierte Abhandlung von Hyper-Threading den Rahmen dieses Artikels sprengen würde, werde ich mich auf die Eckdaten beschränken, besonders auf den Unterschied zwischen einem Prozessor mit Hyper-Threading und einem ohne Hyper-Threading.

Caches
Die Caches werden gemeinsam benutzt, das heißt jedem Prozessor steht effektiv lediglich der halbe Cache sowie die halbe Bandbreite zu. Jedoch muss man bei den Caches unterscheiden zwischen dem L1 Trace Cache sowie allen weitern Caches (L1 Data Cache, L2 Cache, L3 Cache).

Der L1 Trace Cache ist der Ersatz für den ursprünglich L1 Instruction Cache genannten Teil der L1 Cache Struktur. Im Gegensatz zu diesem, speichert der Trace Cache jedoch die bereits decodierten µOps ab. Prinzipiell ein hervorragendes Vorgehen, jedoch aufgrund der kleinen Größe des L1 Trace Cache (Intel spricht von 12.000 Einträgen, was etwa 8 KB entspricht; zum Vergleich: Der AMD Athlon XP hat 64KB L1 Code Cache) stark ausgebremst. Bei zwei logischen Prozessoren sieht die Situation noch deutlich drastischer aus, schließlich stehen hier jedem logischen Prozessor nur noch 6.000 Speicherplätze für µOps im wichtigsten aller Caches zu. Jeder der logischen Prozessoren verfügt über einen eigenen, vom anderen unabhängigen Zeiger in den Trace Cache, so dass Konflikte von Haus aus vermieden werden.
Versuchen beide logische Prozessoren gleichzeitig auf den L1 Trace Cache zuzugreifen, so wird ihnen abwechselnd Zugriff gewährt. Auch hier wird ein vorhandenes Nadelöhr nochmals verengt, schließlich kann der L1 Trace Cache grade mal drei µOps pro Taktsignal an einen Prozessor weitergeben, was sich bei zwei logischen auf theoretische 1,5 µOps pro Taktsignal verringert.
Wenn ein logischer Prozessor sich im Stillstand befindet oder keine Daten aus dem L1 Trache Cache benötigt, so hat der andere die volle Bandbreite und Zugriffszeit zur Verfügung.

Der L1 Data Cache, der L2 Cache sowie der L3 Cache hingegen, können von beiden logischen Prozessoren gemeinsam genutzt werden und alle Einträge, unabhängig davon welcher logische Prozessor den Eintrag gemacht hat, von allen logischen Prozessoren gelesen werden. Logischerweise sind hierdurch Konflikte vorprogrammiert, jedoch wurde hier seitens Intel eiskalt kalkuliert: Man nimmt bewußt den eventuell durch Konflikte verursachten Performanceverlust in Kauf, rechnet jedoch mit einem durch die gemeinsame Nutzung höheren Leistungsgewinn. So kann beispielsweise ein logischer Prozessor bereits die Daten aus dem Speicher in den Cache laden, die der andere in Kürze benötigen wird. Bei Server Applikationen ist dies übrigens ganz normales Verhalten (siehe auch Cache-Prefetch Logik des IBM Power4) und aufgrund der Tatsache, dass der Xeon MP auf den Servermarkt abzielt, ist diese Lösung vermutlich die geschickteste.
Problematisch wird die Angelegenheit beim Pentium 4 HT, da dieser auf dem SOHO-Markt abzielt. Wie er sich in der Praxis bewähren wird, muss sich jedoch erst noch zeigen.

Seite 15/20

Nach oben