PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Kann das funktionieren?


Hauwech
2002-08-07, 14:28:35
Moin moin,

vielleicht kann hier ja mal jemand was dazu sagen ob das auf nem Grafikchip ueberhaupt funktioniert oder zumindest was bringt.

Wenn ich mich nicht irre war mal in der c't ein Bericht ueber Chips die mehr oder weniger so speziell sind das sie einen wesentlich hoeheren Output an Ergebnissen liefern koennen als herkoemmliche Designs in CPUs bei gleichen Taktraten. Ich glaube das bezog sich auf mathematische Funktionen.
Ich meine sowas aehnliches wuerde Intel bereits im P4 haben mit den ALU-Einheiten die, korrgiert mich wenn ich falsch liege, mit doppeltem CPU-Takt laufen.

Nun bin ich halt kein Chipdesigner und mit Mathematik habe ich auch nich viel am Hut aber wenn ich das alles so recht verstehe benutzen die Graka-chips halt auch jede Menge an Mathezeugs.

Ist es moeglich fuer bestimmte Einheiten in Graka-chips sowas zu realisieren und wuerde es ueberhaupt Sinn machen?

Klaert mich mal auf (neeee nich so, weiss wie das geht.. :))

mfg Karsten

Pussycat
2002-08-08, 19:08:22
Ich glaube nicht, dass jemand die Frage versteht Hauwech. Bitte nochmal deutlich?

GloomY
2002-08-08, 19:39:47
Du kannst immer eine spezielle Logikschaltung für ein spezielles Problem bauen, und damit dann eine andere Architektur, die allgemeiner (d.h. weniger stark spezialisiert ist) damit in der Leistung schlagen.
Aber das ist ja schon bei dem Grafikkarten geschehen. Gerade deshalb ist ja Hardwarerendering so viel schneller als Softwarerendering, welches von der CPU durchgeführt wird.
All zu viel Optimierungsmöglichkeiten gibt es da imho nicht mehr.

Was den P4 mit seinen "double pumped ALUs" angeht:
So etwas kann man schon machen, allerdings sind gerade Grafikchips sehr vom Speichertransfer abhängig. Große Schleifen gibt's da nicht. D.h. wenn der Speicher weiterhin der Flaschenhals bleibt, dann bringt es nichts (oder nicht viel), an den Logikschaltungen herumzuschrauben.

=FSS=[Elr*ond]
2002-08-08, 20:33:20
Ich bin nicht so gut in logischem denken und mathematik aber das was du da laberst würde meiner Meinung nach durchaus einen Sinn ergeben ich würd's mal testen und gucken ob das mit den Einheiten ruled.-

Hauwech
2002-08-08, 21:35:33
Originally posted by GloomY
Du kannst immer eine spezielle Logikschaltung für ein spezielles Problem bauen, und damit dann eine andere Architektur, die allgemeiner (d.h. weniger stark spezialisiert ist) damit in der Leistung schlagen.
Aber das ist ja schon bei dem Grafikkarten geschehen. Gerade deshalb ist ja Hardwarerendering so viel schneller als Softwarerendering, welches von der CPU durchgeführt wird.
All zu viel Optimierungsmöglichkeiten gibt es da imho nicht mehr.

Was den P4 mit seinen "double pumped ALUs" angeht:
So etwas kann man schon machen, allerdings sind gerade Grafikchips sehr vom Speichertransfer abhängig. Große Schleifen gibt's da nicht. D.h. wenn der Speicher weiterhin der Flaschenhals bleibt, dann bringt es nichts (oder nicht viel), an den Logikschaltungen herumzuschrauben.

Ja so aehnlich meinte ich das, danke fuer die Erklaerungen GloomY :)

Geht mir eigentlich nicht um Speicherbandbreite sondern darum das 'eventuell' weniger Strom benoetigt wird. :)

(OT: Vielleicht kann das Embedded-Ram Konzept der Bit-Boys helfen den Flaschenhals 'Speicherbandbreite' zu weiten wenn es irgendwann mal billiger werden sollte als immer groessere und kompliziertere Speicherinterfaces zu bauen aber naja, reine Spekulation)

Ich habe eher das Pferd von hinten aufgezaeumt und mit dem P4-Beispiel auch die falsche 'Sattelgroesse' gewaehlt so wie es aussieht. Versuche es nochmal :)

Die ALU-Einheiten beim P4 laufen ja bekanntlich mit 2x CPU-Takt. Das es so funktioniert, haengt natuerlich vom Design der Einheiten ab.
Was ich natuerlich nicht weiss und auch nicht nachschauen kann ist, wie warm diese ALU-Einheiten bei 2x CPU-Takt werden. Andersrum kann ich mir das nur so vorstellen das die bei einfachem CPU-Takt nicht so richtig 'warm' werden wie der Rest des Chips ansonsten haette Intel es ja wohl nicht gemacht, oder?

Wenn es, zumindest denke ich es mir so, bei CPUs moeglich ist bestimmte Bereiche anders zu takten, kann es bei Grafikchips nicht auch moeglich sein?
Bestimmte Bereiche die bei zB. 300MHz auf andere Einheiten warten muessen weil sie 'zu schnell' sind mit zB. 200 MHz takten bei immer noch 100% Leistung um so die Leistungsaufnahme und dementsprechend auch die Waermeabgabe zu reduzieren?

Oder is das voelliger Quatsch was ich hier schreibe?


mfG Karsten

Ridcully
2002-08-09, 19:17:15
Ich verstehe von Chips genauso wenig wie du und vom Programmieren habe ich auch keine Ahnung aber ich vermute folgenes.

Die Einheiten die Intel mit Doppelten Takt betreibt sind sehr einfach aufgebaut. Solche Einheiten sind in modernen Grafikchips eher Mangelware. Wenn es "einfache" und aus wenigen Transistoren bestehende Einheiten gibt werden sie erfahrungsgemäss doppelt gebaut. Meine Erklärunbg dafür ist das mann Problemme bei der Syncronisation befürchtet. Das Chaos wäre natürlich komplett wenn mann Einheiten die nicht so stark beansprucht werden herunter taktet. Wenn die eine Hälfte beisspielsweise mit 200 und die andere mit 300 Hz arbeitet würde nur jeder sechste Taktzyklus aus beiden Hälfeten gleichzeitig ein Ergebniss liefern. Wenn die Ergebnisse im weitern Verlauf mit einander verknüpft werden sollen muss ja ständig gewartet werden.

Nur so ne vermutung

Ridcully

Pussycat
2002-08-10, 12:10:16
Ich glaube, dass der P10 unterschiedliche Takte für unterschiedliche Chipbereiche unterstützt (irgendwo in den .inf-files standen 3 Taktwerte). Dass kommt wohl in die Nähe.