PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : nVidia: Tesla General Purpose Processor Platform


AnarchX
2007-06-20, 20:37:53
NVIDIA takes on AMD's Stream Computing Initiative with its Tesla GPU cards and HPC systems@Dailytech (http://www.dailytech.com/NVIDIA+Announces+Tesla+General+Purpose+Processor+Platform/article7772.htm)


Late last year AMD and ATI merged into one company, forming not just a bigger entity but creating a very specific roadmap altogether. AMD's grand scheme with ATI is to develop a single chip handling both general purpose computing as well as graphics. The Fusion project as AMD calls it is this very goal.

Today, NVIDIA reveals that it is not behind when it comes to general purpose GPU, or GPGPU, computing. Earlier this year the company announced its complete unified device architecture, or CUDA, Technology, which laid the groundwork for GPGPU programming for NVIDIA GPUs. CUDA Technology directly competes with AMD’s Stream Computing initiative. [...]
http://img158.imageshack.us/img158/926/5162largeteslac870a5fb3ks7.jpg (http://imageshack.us)


Ich dachte unter CUDA wird das MUL nicht mitgezählt? Oder hat man die SPs auf 2GHz gebracht?

AnarchX
2007-06-20, 22:54:22
NVIDIA Tesla: GPU computing gets its own brand @B3D (http://www.beyond3d.com/content/articles/77/1)

Ganon
2007-06-20, 23:38:31
Fehlt noch Double Precision ;)

Sonyfreak
2007-06-20, 23:57:48
Schaut für mich so aus, wie wenn nVidia versuchen würde, sich neue Geschäftsfelder zu finden, da man ja möglicherweise im PC Grafikkarten- bzw. Chipsatzmarkt sehr in die Enge getrieben werden könnte. Möglicherweise auch ein Versuch, sich in manchen "ernsthaften" Geschäftsfeldern einen Namen zu machen, falls man es doch mal probieren sollte, einen eigenen Prozessor auf den Markt zu bringen.

mfg.

Sonyfreak

(+44)
2007-06-21, 01:21:42
Verbessertes Slotblech! :)

Nun sind beide Slots perforiert, sollte für besseren Throughput sorgen.

Gmax
2007-06-21, 02:18:30
http://www.heise.de/newsticker/meldung/91374

Ganon
2007-06-21, 08:23:33
http://www.heise.de/newsticker/meldung/91374

Hehe, Heise ist zu blöd englische Texte abzutippen ;)

2.072 TFLOP haben die in 2072 TFLOP "übersetzt" :D

Simon Moon
2007-06-21, 08:50:06
Hehe, Heise ist zu blöd englische Texte abzutippen ;)

2.072 TFLOP haben die in 2072 TFLOP "übersetzt" :D

Ist bestimmt ein Tippfehler, den bei der Einzelnen haben sies mit 518GFLOP richtig angegeben...

Holundermann
2007-06-21, 08:51:13
Kann mir mal wer erklären wwas man damit berechnen kann? und wieviel TFLOP hat ein aktueller prozessor? was sagt der wert aus? Warum brauchen die dinger soviel speicher?

Stone2001
2007-06-21, 08:54:28
Fehlt noch Double Precision ;)
Soll ja mit der nächste Generation kommen....

Und außerdem kommt es auf die Anwendung an, ob man die auch wirklich braucht. Ich bin zwar kein Numeriker, aber wenn ich meine letzten Gespräche mit einem noch richtig in Errinnerung habe, kann man mit den entsprechenden Algorithmen unterm Strich die gleichen Ergebnisse erzielen. Schade nur, das ich hier in der Schublade Idee über exakte Gleitkommaarithmetik habe...

Naja, aber spätestens wenn der Cell auch Double Precision hat, dann kräht auch kein Hahn mehr danach. Dann arbeiten wieder alle mit DP und machen sich keine großen Gedanken mehr um die Genauigkeit und die Korrektheit ihrer Ergebnisse, die FP-Einheit wird es richten.

Gast
2007-06-21, 08:54:32
Lol, davon träumt nvidia. Tatsache ist, dass so ein Chip gegen eine CPU nicht den hauch einer Chance hat, solange sie nicht streamen darf.

Stone2001
2007-06-21, 09:06:23
Kann mir mal wer erklären wwas man damit berechnen kann? und wieviel TFLOP hat ein aktueller prozessor? was sagt der wert aus? Warum brauchen die dinger soviel speicher?
Damit kann man eigentlich recht viel berechnen, kommt halt nur darauf an, wie genau die Ergebnisse sein müssen. :) Aber für Grafikanwendungen dürfte sich der Chip sicherlich gut eignen.

Ein aktueller Prozessor kommt in der Regel auf eine einstellige GFLOPS Leistung.
Die 2072 GFLOP der Tesla-Plattform sagen im Prinzip aus, dass in diesem Rack soviel Rechenleistung steckt, dass man vor 10 Jahren erster in der Top500 Liste geworden wäre.

Warum die soviel Speicher brauchen? Die Frage ist eher, warum nur 6 GB für das komplette Rack, 32GB oder 64 GB hätten es schon sein sollen. Mit der Rechenleistung könnte man recht detailierte Modell (z.B. in der Strömungsmechanik) berechnen lassen, da ist aber 6 GB viel zu wenig.
EDIT: BTW im HPC-Bereich gibt es mehrere Fausregeln (gehen unter anderem auf Seymour Cray zurück): Für jede FLOPS brauchst du 1 byte RAM, sowie 1 Byte/sec Speicherbandbreite.

Gast
2007-06-21, 09:43:28
Die 2072 GFLOP der Tesla-Plattform sagen im Prinzip aus, dass in diesem Rack soviel Rechenleistung steckt, dass man vor 10 Jahren erster in der Top500 Liste geworden wäre.


Das ist doch in keinster Weise vergleichbar. General purpose vs. Definite Purpose. Die GPUs kacken bei einem Array ungleicher Daten derart ab.

Stone2001
2007-06-21, 10:05:15
Das ist doch in keinster Weise vergleichbar. General purpose vs. Definite Purpose. Die GPUs kacken bei einem Array ungleicher Daten derart ab.
Wie gut ist die Linpack-Leistung der Tesla-Plattform?
Das sie in den meisten Anwendung wohl nicht an die durchschnittliche Leistung dürfte klar sein, aber das zählt halt bei der Top500 nicht.

Hauwech
2007-06-21, 10:49:08
Natürlich kann man das so nicht vergleichen aber bei dem Bild auf B3D mit dem 1U Rack und der theoretischen Leistung von dem Ding, fiel mir spontan der Werbespot von IBM mit den gestohlenen Servern ein. :D

http://www.youtube.com/watch?v=rmxPfZtV6w0

Einfach mal bei youtube nach IBM commercial oder IBM Werbung suchen, sind ein paar lustige Sachen dabei. :)

Gast
2007-06-21, 21:24:08
Naja, aber spätestens wenn der Cell auch Double Precision hat, dann kräht auch kein Hahn mehr danach. Dann arbeiten wieder alle mit DP und machen sich keine großen Gedanken mehr um die Genauigkeit und die Korrektheit ihrer Ergebnisse, die FP-Einheit wird es richten.

wohl kaum, selbst wenn die nächste generation DP bringen sollten, dann wohl kaum mit full-speed.

will man also hoche leistung sollte man DP wirklich nur dort einsetzen wo es gebraucht wird.

Coda
2007-06-21, 22:20:55
Das ist doch in keinster Weise vergleichbar. General purpose vs. Definite Purpose. Die GPUs kacken bei einem Array ungleicher Daten derart ab.
Hm, Numbercrunching-Anwendungen lassen sich meistens gut streamen.

Stone2001
2007-06-21, 22:26:38
wohl kaum, selbst wenn die nächste generation DP bringen sollten, dann wohl kaum mit full-speed.

will man also hoche leistung sollte man DP wirklich nur dort einsetzen wo es gebraucht wird.
Wenn die nächste Cell-Generation kein pipelined DP bringt, was bringt sie dann? DP kann der Cell in der SPE jetzt auch schon, nur halt non-pipelined mit 7 Zyklen Latenz.

Generell sollte man DP überall einsetzen.

Ihm
2007-06-22, 01:54:04
Hm, Numbercrunching-Anwendungen lassen sich meistens gut streamen.

Stimmt. Aber für klar definiertes Numbercrunching sollte man lieber auf FPGA's zurückgreifen. Darüberhinaus sind FPGA's viel flexibler.

Zum Thema:
Es kommt halt immer darauf an, was man berechnen will. Für Gleitkommaberechnungen ist eine GPU z.B. ideal. Da kann auch schonmal im Vergleich zur CPU der Faktor 270 enstehen. In einigen Bereichen könnte man dafür zehn Opteron-Racks abreissen.
Was ich gut finde: Nvidia stellt CUDA kostenlos zur Verfügung. Weiterhin machen Sie es einem mit dem integrierten Compiler sehr viel leichter. Dazu kommen dann noch ein paar nette Tools und die Sache ist mehr als rund. Und das Beste: Man kann CUDA auch mit den Consumerkarten nutzen.
Ich finde, dass Nvidia endlich etwas macht, was seit den ersten DX9 Karten schon lange überfällig ist.
Ausser ständigen Ankündigungen habe ich von ATI's CTM zum Beispiel noch nichts gesehen.

pajofego
2007-06-23, 10:39:10
Man kann CUDA auch mit den Consumerkarten nutzen.
Ich finde, dass Nvidia endlich etwas macht, was seit den ersten DX9 Karten schon lange überfällig ist.
Ausser ständigen Ankündigungen habe ich von ATI's CTM zum Beispiel noch nichts gesehen.

Gebe ich dir zu 100% recht! Und das finde ich auch sehr gut und nicht nur deswegen kaufe ich nur nvidia Hardware!

Was mir noch nicht ganz klar ist, worin liegt der Unterschied zwischen einer 8800 Ultra für ca. 600€ und der deutlich teuren Tesla Karte für 1500$? O.K. letztere hat 1,5 GB Speicher, aber das dürfte doch nicht der einzige Grund sein, oder? Welche Vorzüge hat die Tesla Grafikkarte gegenüber der normalen Grafikkarte zumal ich auch wie schon oben erwähnt CUDA benutzen kann?

Danke,
Gruß
pajofego

Gast
2007-06-23, 10:50:23
Was mir noch nicht ganz klar ist, worin liegt der Unterschied zwischen einer 8800 Ultra für ca. 600€ und der deutlich teuren Tesla Karte für 1500$? O.K. letztere hat 1,5 GB Speicher, aber das dürfte doch nicht der einzige Grund sein, oder?Eventuell liegt der Unterschied im Support.

AnarchX
2007-06-23, 10:53:42
Eventuell liegt der Unterschied im Support.

Ganz genau, soetwas liest man auch im passenden Interview @ B3D ( GeForce, Quadro, Tesla - alle haben spezifischen ISV-Support):
http://www.beyond3d.com/content/interviews/41/1
http://www.beyond3d.com/content/interviews/40/1

Zudem würde ich auch behaupten, dass hier die Hardware strengeren Qualitätsrichtlinien unterliegt.

RavenTS
2007-06-23, 18:04:08
Eventuell liegt der Unterschied im Support.

Oder es kommt sogar ein etwas anderes Layout (mehr Lagen etc.) zum Einsatz, da ja beispielsweise keine Bildausgänge mehr vorhanden sein müssen...