ClearSpeed: 25 Gigaflops bei 2,5 Watt; PCs zu Supercomputern?

Patmaniac

Grand Admiral Special
Mitglied seit
21.05.2001
Beiträge
14.789
Renomée
266
Hi alle zusammen,

Schaut euch mal diese Newsmeldung bei golem.de an! Ein kleiner Auszug:

Ein normaler PC, der mit sechs PCI-Karten mit jeweils vier CS301-Chips ausgestattet ist, könnte so rund 600 Gigaflops erreichen, was ihn bei einem Preis von rund 25.000 US-Dollar in die Liste der derzeit 500 schnellsten Supercomputer katapultieren würde.

Na das wäre natürlich heftig. 8) Das schafft ein 8x Opteron- System sicher nicht! Aber weiter:

Noch liegt der Chip aber nicht als Prototyp vor, auch wenn ClearSpeed davon ausgeht, ihn noch in diesem Jahr auf den Markt bringen zu können.

Na, wenn das also mal keine Ente ist. ;) Wäre aber zumindest ne ziemlich hammerharte Angelegenheit, wenn es dann tatsächlich doch einen Chip geben würde.


http://www.clearspeed.com/
 
Zuletzt bearbeitet:
Ist das nur bei mir so, dass der Link net tut?

Hmm, es wäre schon gigantisch, muss ich sagen, aber wer will denn 25000$ für seinen PC ausgeben??
Und außerdem, wie kann das so "billig" sein?? Immerhin hat die Meldung was gutes, ich wusste nämlich gar nicht, dass PCI so schnell ist...
 
So, Link sollte jetzt funzen. Weiss auch net was los ist, kurz nachdem in den Thread aufgemacht hab, war P3D auch einmal schwer zu erreichen... ??? *noahnung*
 
Jo, das Verbindungsproblem hatte ich auch, ist da etwa einer der Server abgekackt?? ;D :]

Naja, der Link tut, der Bericht is ok- aber das gab's schonmal, oder nicht? Halt was in die Richtung- erst kürzlich auch mal von SUN, wenn ich mich recht erinnere... Naja, so schnell wird das net kommen, ich bau erstmal auf A64 San Diego 8)
 
toll, die chips kommen eh nie richtung desktop ! is wie mit den SUN und Transmeta CPUs -> For Professional User only
 
Ein paar kleine Anmerkungen:

- ClearSpeed gibt die Peak-Performance pro Chip mit 25.6 GFLOPs an
- Worst case Power-Dissipatino sind 8.5 GFLOPs/W (d.h. 3W pro Chip), allerdings stammen diese Daten aus einer Gate Level Power-Simulation und sind deshalb nicht 100% aussagekräftig.

Die versprochenen 600 GFLOPS klingen erst mal Super (Zum Vergleich: Ein P IV 3GHz liegt bei etwa 12 GFLOPS). Aber dies ist eine PEAK-PERFORMANCE Angabe! Das Problem ist, dass die genannten 600GFLOPs nur bei ganz wenigen Problemstellungen auch tatsächlich erreichbar sind. Voraussetzung dafür:
1) (Teil-)Algorhtimus passt in den Cache des CS301
2) Lokale Daten passen in 4k Scratchpad Memory eines PE's
3) Keine Datenabhängigkeiten die nicht mittels Umordnung/Pipelining erschlagen werden können (= voll paralellisierbar)
4) Benötigte Speicherbandbreiten < 800MB/s (=Geschwindigkeit des Memory Interfaces)
5) Summe der benötigten Kommunikationsbandbreite Board<=>Board < 133MB/s (PCI limit)

Für FFTs & Co dürfte das allemal zutreffen :-) *G* Mal sehn ob's demnächst einen modifizierten SETI Client gibt....

Die _relative_ FPU-Geschwindigkeit eines Processing Elemtens ist aber dennoch nur etwa halb (bzw. 1/4 je nach Sichtweise) so schnell ist wie die PIV FPU.

Egal, jedenfals ist die Leistungsaufnahme phantastisch gering. Abwegig ist sie jedenfals nicht das Ding hat schlieslich nur 1.2V Corespannung und läuft auf 200MHz :-)

BTW. Die verwendete Grundstruktur kommt gerade sehr in Mode. Zumindest gibt es jede Menge Konkurrenz die auf ähnliche Architekturen -- Processing Element Arrays -- setzt (Pact XPP, Tera, Cell, FirePath, etc.). Naja der Markt der "Netzwerk"-Prozessoren scheint wohl langsam in Gang zu kommen.

> Na, wenn das also mal keine Ente ist.

Würd ich eher mit einem Bienenschwarm vergleichen :-) .. schön klein und kann furchtbar stechen -- denoch wird es die größeren Raubtiere erst mal nicht aus dem angestammten Revier verdrängen :-)))))

> ich wusste nämlich gar nicht, dass PCI so schnell ist...

Noch besser: PCI macht satte 0 FLOPs :-)))
 
Original geschrieben von HenryWince
Ein paar kleine Anmerkungen:

- ClearSpeed gibt die Peak-Performance pro Chip mit 25.6 GFLOPs an
- Worst case Power-Dissipatino sind 8.5 GFLOPs/W (d.h. 3W pro Chip), allerdings stammen diese Daten aus einer Gate Level Power-Simulation und sind deshalb nicht 100% aussagekräftig.

Die versprochenen 600 GFLOPS klingen erst mal Super (Zum Vergleich: Ein P IV 3GHz liegt bei etwa 12 GFLOPS). Aber dies ist eine PEAK-PERFORMANCE Angabe! Das Problem ist, dass die genannten 600GFLOPs nur bei ganz wenigen Problemstellungen auch tatsächlich erreichbar sind. Voraussetzung dafür:
1) (Teil-)Algorhtimus passt in den Cache des CS301
2) Lokale Daten passen in 4k Scratchpad Memory eines PE's
3) Keine Datenabhängigkeiten die nicht mittels Umordnung/Pipelining erschlagen werden können (= voll paralellisierbar)
4) Benötigte Speicherbandbreiten < 800MB/s (=Geschwindigkeit des Memory Interfaces)
5) Summe der benötigten Kommunikationsbandbreite Board<=>Board < 133MB/s (PCI limit)

Für FFTs & Co dürfte das allemal zutreffen :-) *G* Mal sehn ob's demnächst einen modifizierten SETI Client gibt....

Die _relative_ FPU-Geschwindigkeit eines Processing Elemtens ist aber dennoch nur etwa halb (bzw. 1/4 je nach Sichtweise) so schnell ist wie die PIV FPU.

Egal, jedenfals ist die Leistungsaufnahme phantastisch gering. Abwegig ist sie jedenfals nicht das Ding hat schlieslich nur 1.2V Corespannung und läuft auf 200MHz :-)

BTW. Die verwendete Grundstruktur kommt gerade sehr in Mode. Zumindest gibt es jede Menge Konkurrenz die auf ähnliche Architekturen -- Processing Element Arrays -- setzt (Pact XPP, Tera, Cell, FirePath, etc.). Naja der Markt der "Netzwerk"-Prozessoren scheint wohl langsam in Gang zu kommen.

> Na, wenn das also mal keine Ente ist.

Würd ich eher mit einem Bienenschwarm vergleichen :-) .. schön klein und kann furchtbar stechen -- denoch wird es die größeren Raubtiere erst mal nicht aus dem angestammten Revier verdrängen :-)))))

> ich wusste nämlich gar nicht, dass PCI so schnell ist...

Noch besser: PCI macht satte 0 FLOPs :-)))


any questions *buck*
 
Zurück
Oben Unten