ATI: PCI-Express Grafikkarten mit "Shared Memory"

Patmaniac

Grand Admiral Special
Mitglied seit
21.05.2001
Beiträge
14.789
Renomée
266
Die kanadische Grafikschmiede <a href="http://www.ati.com" target="b">ATI</a> ließ in einer <a href="http://www.ati.com/companyinfo/press/2004/4783.html" target="b">Pressemitteilung</a> verlauten, dass sie zukünftigen x16 PCI-Express-Grafikkarten Teile des Arbeitsspeichers als virtuellen Grafikkartenspeicher zukommen lassen will, wie es beispielsweise bei Notebooks schon lange praktiziert wird. Dieser Mix aus Onboard- und Shared-Memory, von ATI "HyperMemory" getauften Technik, möchte ATI es seinen Partner ermöglichen, zukünftige Grafikkarten preiswerter zu gestalten. Die neue x16 PCI-Express-Schnittstelle mit seiner hohen Bandbreite mache es möglich, dass die Grafikchipleistung weniger abhängig vom Grafikspeicher sei. Somit werde nicht viel Grafikleistung geopfert.

<a href="http://www.intel.com" target="b">Intel</a> führte schon 1997 zeitgleich zur Einführunge des Accelerated Graphics Port (AGP) genau jene Zugriffstechnik ein. Zum lokalen Video RAM (VRAM) konnte dem AGP-Grafikchip ein reservierter Teil des PC-Hauptspeichers (AGP Aperture) zugewiesen werden. Der Grund für die Entwicklung dieser Technik waren damals die höheren Speicherpreise für Grafikkarten. Der beengte Speicherplatz konnte die großen Texturen der 3D-Spiele kaum fassen und so musste auf den Arbeitsspeicher ausgelagert werden. Auch heute sind die Speicherpreise für den schnellen Grafikspeicher natürlich etwas höher als der für den normalen Arbeitsspeicher, wobei die Differenz nicht mehr so enorm ist. Auch wenn der Grafikspeicher meist die neuste Speichertechnologie in sich vereint.

Doch trotz des rasanten Fortschritts des Arbeitsspeichers (SDRAM, DDR-RAM, Dual-Channel) ist der lokale Grafikspeicher immer noch sehr viel schneller, denn moderne Grafikchips binden den Speicher über bis zu 256 Leitungen mit mehr als 550 MHz Taktfrequenz an, womit die RAM-Performance einen gewichtigen Anteil zur 3D-Leistung von Grafikkarten beiträgt. Daher sind bisherige shared Memory-Systeme i.d.R. meist deutlich langsamer als Systeme ohne geteilten Arbeitsspeicher.

Dennoch kündigt ATI nun die "HyperMemory"-Technik an und verweist darauf, dass "der Datentransfer bei früheren Verbindungstechniken [AGP dürfte wohl gemeint sein] nicht schnell genug für Echtzeit-Grafikanwendungen war, weshalb Grafikkarten mit bis zu 256 MByte lokalem Speicher für Texturen und Render-Daten verkauft wurden". Durch die Kombination der hohen Vollduplex-Transferleistung und das gut ausgetüftelte Speicher-Allokationsverfahren von PCI Express, verspricht sich ATI nun wohl keinen großen Performanceverlust mehr. Ob PCI-Express in der Praxis gegenüber der bisherigen AGP-Technik nun deutlich höhere Leistungen beim Zugriff auf den PC-Hauptspeicher bringt, wird sich erst zeigen. Bisherige PCI-Express-Grafikkarten zeigen zumindest bis jetzt keine großen Performanceschübe zu ihren AGP-Abbildern.

Weiterhin macht das HyperMemory-Verfahren natürlich nur Sinn, wenn der Rechner über genügend Arbeitsspeicher verfügt. Ein ständiger Zugriff des Grafikchips auf dem ihn zugesicherten Arbeitsspeicherbereich würde zudem die Gesamtleistung des System trotz PCI-Express stärker belasten. ATI relativierte dies aber sogleich mit dem Versprechen, dass anspruchsvolle 3D-Grafikdaten immer noch direkt auf der Grafikkarte gespeichert werden und nur weniger häufig benötigte auf den Hauptspeicher geschrieben werden. Zudem soll HyperMemory die Übertragungsgeschwindigkeit bei Datentransfers über den Systembus erhöhen, damit sich die Speicherzugriffe selbst effizient beschleunigen, als es ohne HyperMemory der Fall wäre.

Entsprechende Grafikkarten mit HyperMemory-Technik sollen noch 2004 präsentiert werden. Für preisbewusste PC- und Notebook-Systeme könnte diese Technik sehr interessant werden. Insbesondere wenn der Chipsätzen mit integrierter Grafik, wie dem RX480 und RS480 (wir <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1095347873">berichteten</a>). Eventuell kommt HyperMemory schon bei diesen ATI-Chipsätzen für Athlon 64-Prozessoren zum Einsatz.
Bei teuren High-End-Systemen könnte HyperMemory in Zukunft notwendig werden, wenn der aktuelle Grafikkartenspeicher von 256MB an seine Grenzen stößt. Da bei AMD64-Systemen der Grafikchip "indirekt" über den HyperTransport-Kanal und den im Prozessor integrierten Memory Controller auf den Hauptspeicher zugreift, könnte eine optimierte Grafik-Speicherverwaltung grafiktaugliche Chipsätze deutlich leistungsfähiger machen.
 
Zuletzt bearbeitet:
ich für meinen teil glaube, dass das ganze nur für notebooks und chipsätze mit integrierter grafikeinheit sinnmachen dürfte. aber lassen wir uns überraschen.
 
Also bitte die Herren, original Pressemitteilung, heise, golem und eigenes vermögen bitteschön! ;) Anscheinend habt ihr keine Ahnung, wie schwierig es ist News mit technischen Hintergrund zu schreiben. Das ist n bissl aufwendiger als im Forum zu plaudern. Da ist doch also jede Hilfe von Newsdiensten gern gesehn, wo doch gut ausgebildete Redakteure dahinter sitzen, die zudem noch bezahlt sind.
 
Nunja, ich formuliere eigentlich immer um und bringe anderes ein. Nur bei Fachworten/ausdrücken und zusammenhängenden Kontext wird es natürlich schwierig. ;)

And Now: Back to topic!^ :)
 
@Patmaniac, der Bericht war gut geschrieben !

Es lohnt auch nicht über die Verwandschaft zu AGP und Auslagern zu sprechen, wahrscheinlich nutzen die GraKa-Hersteller seit Jahren den AGP-Krempel überhaupt nicht mehr in ihren Treibern.

Die Stellungnahme könnte auch bedeuten, daß PCIe normalerweise das alte AGP-Feature gar nicht mehr kennt und man es jetzt wieder neu erfinden muß.

Im Prinzip errinnert mich die ATI-Schilderung an den Schaltplan der XBox2, die auch einen Grafikkern mit kleinem, aber schnellem RAM hat. Legt man zudem auf dem DRAM Texturen u.ä. komprimiert ab, spart man einiges an benötigter Bandbreite ein.

Zudem hat man bisher:
- Texturen im DRAM
- Texturen im GraKa-RAM
- und vielleicht noch Texturen im Auslagerungsbereich AGP (das ist aber wohl hoffentlich heute wirklich gestrichen !)

Das ATI-Feature hätte diese Daten nur noch einfach im Speicher.
Auch geht es sicherlich nur um Daten, die die Graka nicht alle Paar Millisekunden benötigt - da dürfte es viele davon geben in modernen Spielen.
 
nunja, aber ein weiterer Performancerückgang werden die langen Wege von graka zu den Ramriegeln bringen.
ich denke, in ein paar jahren kaufen wir CPU´s mit 5GB Chache. Weil es einfach so zu langsam wird.

röwe
 
Moin,
@rkinet warum plenkst du so schrecklich?
Ich mag deine beiträge ja gerne lesen nur...das beißt...:(
mfg,
Hannnibal der wo selber ne sauklaue hat :]
 
Zuletzt bearbeitet:
@Hannnibal - was war da die Grundaussage ?

Wenn die Graka Bilder berechnet, benötigt sie nur einen Bruchteil eines 128 o. 256M Speichers.
So 4 MB für die RGB-Werte zzgl. diverses und eben Texturen.

Wenn in einigen Jahren vielleicht noch mehr Recheneinheiten gleichzeitig werkeln benötigt die Graka für diese lokalen Daten ein schnelles RAM.
Dafür das ganze, riesige DRAM der GraKa auszulegen wird dann ein teurer Spass.

Es könnte so kommen, wie bei CPUs:
- schneller interner Cache (*)
- L2-Speicher, langsamer
- L3, eben per PCIe

(*) könnte man dann natürlich mit 1024 Bit o.ä. ankoppeln und ziemlich hoch takten.

ATI hat nur aus dem Nähkästchen geplaudert ...


noch ne Idee - mein Favorit für das ATI-Design:

Wahrscheinlich reichen dann 16 MB lokal für die Graka, die man gleich im selben Gehäuse unterbringen kann.
GDR-3 wäre dann ein Kinderspiel
Und der GraKa-Chip hätte kaum noch Anschlußbeine.

Die Transferraten für direkt in der Benutzung befindliche Daten und Texturen etc. sind doch drastisch unterschiedlich.
 
Zuletzt bearbeitet:
Hm, ich will ja nicht wissen, in welches Performance-Loch diese Produkte fallen werden, sobald per PCI-X ueber das lokale Video RAM hinaus Speicher verwendet wird.

Da trifft dann in Zukunft >40GB/sek Video RAM auf max. 2-3GB/Sek System RAM (welches natuerlich nicht gleichzeitig von anderen Bussen oder gar der CPU in Anspruch genommen wird *buck* )

Naja, netter Marketing-Name fuer eine Situation, die alle Spiele- und GraKa-Hersteller zu Recht meiden wie die Pest.
Denn sie heisst selbst mit dem schnellsten System RAM stets : laehmend langsame Performance

Die "Spieletauglichkeit" von Shared Memory Loesungen kann man ja an den entsprechenden Budget-Notebooks sehen; da Arbeitet auch max. 1-2GB/Sek DDR RAM mit bis zu 8xAGP angebunden.
Die AGP-Anbindung stellt dabei nicht den limitierenden Faktor dar, es ist der vergleichsweise lahme und von anderen Komponenten bereits zu 100% ausgelastete Systemspeicher ;)
 
Zuletzt bearbeitet:
@ FalconFly

Nun, für entsprechend anspruchsvolle PCI-X Karten müsste schon der HT-Bus schneller werden, sonst könnten sich dort die Daten stauen, dass ist schon klar. Was Intel dann macht, ist mir eigentlich sch***s egal. *buck* Vll werden sie ja noch mit dem herkömmlichen FSB glücklich.. :P

Und so wie ich das verstanden hab, soll die CPU und sonstige Prozesse eben NICHT auf den für die Graka reservierten Arbeitsspeicher zugreifen können. Bei bisherigen Notebooks mit z.B. 256MB, wo 64MB für die Graka abgeschnitten werden, bedeutet das natürlich einen recht hohen Arbeitsspeicherverlust (25%). Aber wenn ich von meinen 1GB 128MB abschneide, und dabei noch lokaler VRAM immernoch dazu kommt (!), hab ich nur einen Verlust von 12,5%. Und so wie die Entwicklung in den nächsten Jahren fortschreiten wird, bewegen wir uns schnell unter 10%. Vor allem die Prozente, die selbst bei anspruchsvollsten Spielen nicht genutzt werden! UT2004 lagert ja glaube ich 'nur' ~300MB in den RAM aus. Womit beim zocken mindestens die Hälfte des GBs nichts zu tun hat. :P

Also gerade für nicht zu wichtige Daten auf die man nicht so sehr schnell zugreifen muss, wie es bei CPUs schon lange praktiziert wird, wie rkinet gut erkannt hat, könnte das die Entwicklung in der Graka-Branche positiv vorran bringen. Und das wesentliche ist ja, dass der teure Trend gestoppt wird, der sonst immer angeprangert wird. Vll muss man dann nicht mehr 500&#8364; für eine aktuelle und gut performende Graka bezahlen, sondern nur noch 300&#8364;. Ich empfinde das als eine gute Sache. ;)
 
Hm, also Video RAM "on demand".

Ich denke allerdings immer noch (da Daten, die nicht im Video RAM liegen, nach erstmaliger Verwendung ohnehin bereits im System gecached werden), dass es nicht viel bringt.

Ob per 8x AGP oder per PCI-E, die Daten muessen bei Bedarf dann erstmal aus dem lahmen RAM gezogen werden, der bleibt (egal wie) immer eine Schnecke.

Eine volle Entkopplung des Bereiches aus dem Rest des Systems koennte eine leichte Verbesserung der performance im kosmetischen Bereich bringen, aber IMHO mehr nicht.

Vielleicht aber gibt es in der GPU aber demnaechst auch eine Art Prefetching, Branch prediction und spekulative Vorhersagen fuer einen insges. besser optimierten Umgang mit Texturen.
Dann koennte das durchaus etwas bringen, aber auch dann darf es niemals zu einer massiven Nutzung des System RAM's kommen.

Um ohne Performance-Verlust zu arbeiten, braeuchte man anstelle von PC400 in etwa PC8000 RAM (CL2 versteht sich *g*) und Tricks zur Bandbreitenschonung, aber selbst da waere PCI-E laengst wieder der limitierende Faktor.

Naja, lassen wir uns ueberraschen ;)
Mir faellt jedenfalls nichts ein, was man in so einem Speicherbereich sinnvoll Cachen koennte, was nicht ohnehin entweder im System RAM abrufbereit liegt, oder aus performance-gruenden permanent im Video RAM vorliegen muss.

PS.
UT2003 hatte eine Moeglichkeit, 256MB Texturen in der Engine manuell freizuschalten. Versuche mit 128MB-Karten haben gezeigt, dass die Performance damit absolut in die Knie ging (Dia-Show unter 1fps). Und dabei lagen immer noch 50% der Texturen im schnellen Video RAM, die anderen 50% ueber 8xAGP o.0

An dem Trend zu immer groesseren Texturmengen ist wohl nicht viel zu aendern; lediglich ATI's neue Texturkompression koennte dem (fuer eine Zeit lang) entgegenwirken.
 
Zuletzt bearbeitet:
Bitte PCI-X und Express nicht verwechseln ^^
 
Original geschrieben von mAxPaYnE
Bitte PCI-X und Express nicht verwechseln ^^

Nun, dass dürfte relativ egal sein. Denn späteres PCI-X wird ja die Belastung auf den Bus nur erhöhen! Insofern muss dies für momentane Entwicklungen wie HyperMemory berücksichtigt werden, da PCI-X verhältnismäßig schnell eingeführt werden soll, nicht wahr? Von ca. 2 Jahren war bis jetzt die Rede, wenn ich es nicht falsch in Erinnerung habe.
 
Original geschrieben von PuckPoltergeist
Nö, das sind zwei vollkommen unterschiedliche Techniken. Und du verwechselst hier auch PCI-X mit PCIe. Ersteres gibt es schon sehr lange. ;D

Hoppala, ich wusste doch, dass ich mich mit diesem ganzen PCI-Sche***s noch irgendwann verhaspel! ;D Dann ist PCI-X eine aktuelle PCI-Technik für Steckkarten, die bei Servern zum Einsatz kommt oder wie (beim Desktop dann PCI bzw. PCI-Express)?
 
Zuletzt bearbeitet:
Zurück
Oben Unten