PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : ATI GPU/CPU Load balancing


Demirug
2004-11-15, 09:45:48
Bei VNUNET gibt es eine Newsmeldung (http://www.vnunet.com/news/1159346) für die Ben Bar-Haim befragt wurde. Am Ende spricht er nun darüber das der Treiber arbeiten von der GPU auf die CPU verlagern kann.

Some tasks may be done by either processor, leaving the driver to decide which to use.

'We call it load balancing,' said Bar-Haim. 'If there is a very fast CPU we might move some of the functionality to it.

'Some of the decisions are made on the fly, some in advance. Some will depend on the load on the CPU. The software can be very clever, finding out how much load there is on the CPU.'

Primär dürfte es sich dabei eigentlich nur um Vertexshader bzw HT&L Funktionen drehen weil für Pixelshader ist die CPU auf jeden Fall zu langsam. Die Idee ist vom Grundsatz her sicherlich nicht schlecht nur da die meisten Spiele sowieso eher CPU limitiert sind dürfte es dort wenig bringen. Bei reinen Funktionsbenchmarks hat die CPU aber oft noch Luft. Diese Treiberfunktion könnte dabei also unter Umständen GPU-Leistung zeigen die gar nicht da ist.

Möglicherweise steht das HTT CPU Verhalten beim 3dmarks05 damit im Zusammenhang.

Gast
2004-11-15, 09:49:57
Nur' so'ne Frage:
Es werden GPU's entwickelt, die immer mehr die Funktionen der CPU übernehmen und dann sollen diese Funktionen wieder an die CPU zurueck gegeben werden?
Und warum sollte dies dann schneller sein?

Quasar
2004-11-15, 09:56:52
Es kommt immer drauf an, wo der Flaschenhals sitzt. Schlauer Zug von ATi - aber ich denke, nVidia macht genau dasselbe für den Murks05.

Gandharva
2004-11-15, 10:01:00
Die Idee ist vom Grundsatz her sicherlich nicht schlecht nur da die meisten Spiele sowieso eher CPU limitiert sind dürfte es dort wenig bringen. Bei reinen Funktionsbenchmarks hat die CPU aber oft noch Luft. Diese Treiberfunktion könnte dabei also unter Umständen GPU-Leistung zeigen die gar nicht da ist.

kommt auch immer auf die rechnerkonfig an. wenn ich mir da so einige discounter-pcs ansehe in denen z.b. ne cpu > 3ghz und ne x600 verbaut ist, könnte ich mir vorstellen das dies doch einiges helfen könnte.

wer dagegen einen ausgewogenen pc besitzt wird wohl eher weniger davon bemerken.

Quasar
2004-11-15, 10:07:13
Sollte sich mit A.I. doch eigentlich abschalten lassen, dieses Verhalten, oder?

Bei mir (9700M, also nur zwei VS) und einem 3,06GHz-P4 bewirkt deaktivieren von A.I. im Murks 05 irgendwie gar nix.

Demirug
2004-11-15, 10:51:01
Sollte sich mit A.I. doch eigentlich abschalten lassen, dieses Verhalten, oder?

Bei mir (9700M, also nur zwei VS) und einem 3,06GHz-P4 bewirkt deaktivieren von A.I. im Murks 05 irgendwie gar nix.

A.I. deaktiviert nur Filteroptimierungen und applikationsspezifische Optimierungen. Die einzige offizielle App-Optimierung ist ja das D3 Shaderreplacement.

Quasar
2004-11-15, 10:54:23
...und eine inoffizielle ist der Ersatzshader für den Nature-Test im Murks01SE, der auf meiner M9700 rund 25-30% bringt.

Was wohl noch so alles im Treiber versteckt ist?

edit:
Und das, wo ATi doch angekündigt hat, keine Synhties erkennen zu wollen:
http://www.elitebastards.com/page.php?pageid=6931&head=1&comments=1
They [Anm.: ATi] have also assured users that only games will ever be detected - Synthetic benchmarks will remain untouched (Although of course they will remain to be affected by ATIs adaptive filtering).
Adaptive Filtering fällt ziemlich flach für den Nature-Test, da nur bilinear gefiltert wird und kein AF verwandt.

Gast
2004-11-15, 10:56:27
Möglicherweise steht das HTT CPU Verhalten beim 3dmarks05 damit im Zusammenhang.

Dann müsste aber mit HTT auch bessere Ergebnisse zustande kommen (im Vgl. zu Athlon 64 z.b. ), was aber nicht der Fall ist (es geht nur in eine Richtung (bergab) mit niedriegerem Takt, nicht umgekehrt ).

Prinzipiell finde ich die Idee die dahinter steckt aber sehr gut.

HOT
2004-11-15, 11:17:24
Das ist ein Alter Traum, den schon S3 mit S3TL damals träumte.

Demirug
2004-11-15, 11:20:30
Dann müsste aber mit HTT auch bessere Ergebnisse zustande kommen (im Vgl. zu Athlon 64 z.b. ), was aber nicht der Fall ist (es geht nur in eine Richtung (bergab) mit niedriegerem Takt, nicht umgekehrt ).

Wenn der Treiber auf die Idee kommt das noch mehr entsprechend CPU Leistung übrig ist obwohl eigentlich keine mehr da ist und dann versucht Berechnungen auf die CPU zu verlagern kann das auch nach hinten losgehen.

Gerade bei HTT ist es schwer aufgrund der messbaren CPU-Auslastung darauf zu schliessen wie viel Leistung man wirklich noch hat.

Exxtreme
2004-11-15, 11:44:42
Nur' so'ne Frage:
Es werden GPU's entwickelt, die immer mehr die Funktionen der CPU übernehmen und dann sollen diese Funktionen wieder an die CPU zurueck gegeben werden?
Und warum sollte dies dann schneller sein?
Naja, man muss schauen was überhaupt limitiert. Wenn z.B. die Bandbreite der Flaschenhals ist dann kann es Sinn machen die T&L-Engine/Vertexshader per CPU zu machen etc. IIRC hat es Nvidia bei der GF2 ab einer bestimmten Auflösung so gemacht um die Speicherbandbreite zu entlasten. Ausserdem gibt es Bereiche, bei denen die CPU immer noch schneller ist. Bei sehr vielen Lichtquellen ist das z.B. so.

seahawk
2004-11-15, 12:21:25
Also ich finde ide Lösung ausgesprochen clever. Dem User kann nir daran glegen sein, dass CPU und GPU beide maximal ausgenutzt werden.

Dr Hake
2004-11-15, 12:32:53
Also ich finde ide Lösung ausgesprochen clever. Dem User kann nir daran glegen sein, dass CPU und GPU beide maximal ausgenutzt werden.
Der Ansatz mag ja clever sein, allerdings sind wie so ueblich vorgefertigte Benchmarks, bei denen die CPU keine KI berechnen muss noch mehr mit Vorsicht zu geniessen, da eben hier Leistungssteigerungen ausgewiesen werden, die in der Praxis des oefteren nicht anzutreffen sind. Fazit: gute Idee da evtl die Karten auch spaeter noch besser mit einer staerkeren CPU skalieren koennen, in Bezug auf Benchmarks najahaltso...kein Ch**, aber auch nicht 100% koscher.
FRAPS wird immer wertvoller

Quasar
2004-11-15, 12:42:32
Vielleicht sollten THG ihren PCIe-Faktor Test nochmal mit aktuelleren Treibern wiederholen? Die nVs sind ja unterhalb von PCIe-8x etwas eingebrochen, die ATis damals noch nicht.