PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : HW T&L vs. SW T&L, der nächste Versuch


Raff
2007-06-11, 22:59:05
3DMark2001SE

Hardware-T&L: ----------------------- Software-T&L:
http://666kb.com/i/ap4soe92qhqf0um0m.jpg http://666kb.com/i/ap4sowxa0z5olorna.jpg

HW stellt eine GeForce2 mit Ultra-Takt (250/230 MHz), SW macht ein Allendale @ 3,1 GHz. Erklärt mir jemand, warum die GF2 noch immer meist schneller ist? Das einzig Interessante ist der High-Poly-Test, wo die Unit der GF2 bei acht Lichtern total absackt, während der C2D "nur" 41 Prozent verliert.

MfG,
Raff

mapel110
2007-06-11, 23:05:22
Da scheints wohl ein Limit beim 3DMark zu geben. 21.1 Mio Triangles/s bei beiden ist denke ich kein Zufall.
Und was ist daran so verwunderlich, dass dedizierte Hardware schneller ist?! Gings in den Jahren seit Geforce2 besonders vorran im CPU-Bereich?! Also nicht dass ich wüsste. Damals gabs 1 Ghz und mehr. Athlon B iirc. Heute sind wir nicht viel weiter, was die reine Rechenleistung angeht. Hat sich imo seit dem gerade mal vervierfacht, würde ich schätzen.

Gast
2007-06-12, 00:14:28
Mal so ins Blaue geraten:
Das HW T&L verstopft die VRAM-Bandbreite so übel, dass die GPU kaum zum Rendern kommt, während SW T&L den Cache der CPU gut nutzen kann und der GPU wieder ein wenig Luft bei der Bandbreite verschafft?

Coda
2007-06-12, 00:34:36
Da scheints wohl ein Limit beim 3DMark zu geben. 21.1 Mio Triangles/s bei beiden ist denke ich kein Zufall.
Ich denke eher beim Rastern.

Bei SW-T&L muss auch über den Bus viel mehr übertragen werden. Vor allem bei "nur" AGP 4x (?) ist das schon einiges.

Gast
2007-06-12, 01:31:35
Hi

Es wäre interresant, wenn die User hier das alle mitmachen würden.
Auch wäre es schön zu Wissen welche Auflösung Du benutzt hast.

Gruss Labberlippe

Raff
2007-06-12, 08:33:09
Ich denke eher beim Rastern.

Bei SW-T&L muss auch über den Bus viel mehr übertragen werden. Vor allem bei "nur" AGP 4x (?) ist das schon einiges.

Jo, AGP4x. Auf 78 MHz übertaktet.

Hi

Es wäre interresant, wenn die User hier das alle mitmachen würden.
Auch wäre es schön zu Wissen welche Auflösung Du benutzt hast.

Gruss Labberlippe

Hoppla, vergessen. 640x480x16. In 1024x768x32 sind es nicht einmal 7000 Punkte und die Bandbreite limitiert GF2-typisch extrem.

MfG,
Raff

Coda
2007-06-12, 10:46:04
Die Allendale-CPU sollte übrigens wirklich schneller sein als ne GeForce 2 bei T&L

Tigershark
2007-06-12, 13:56:21
Hm. Komisch irgendwie - ich hab jetzt zum Vergleich mal mit C2D (E6400) @ 2,4GHz gebencht, und die Resultate unterscheiden sich doch deutlich. Sollte der E6400 so viel mehr Leistung bringen aufgrund seines Cache?

GraKa ist hier übrigens eine 7900GT, was aber ja aufgrund von SW T&L egal sein sollte - odeR?

http://img513.imageshack.us/img513/7391/3dmk01vv3.jpg

*edit*
Ich meine jetzt nicht die Gesamtscore, dass die sich unterscheidet ist ja aufgrund vom fehlenden Game4 oben klar, aber die Light-Tests z.B...

Scud
2007-06-12, 13:58:14
hab hier mal interessantes:

Intel Core Duo T2500 2x 2GHz
1280MB RAM DDR2 533
Intel GMA950 (holt sich 224MB)

Alles in 640x480x16 und D3D Software T&L.

Raff
2007-06-12, 14:34:46
Hm. Komisch irgendwie - ich hab jetzt zum Vergleich mal mit C2D (E6400) @ 2,4GHz gebencht, und die Resultate unterscheiden sich doch deutlich. Sollte der E6400 so viel mehr Leistung bringen aufgrund seines Cache?

GraKa ist hier übrigens eine 7900GT, was aber ja aufgrund von SW T&L egal sein sollte - odeR?

http://img513.imageshack.us/img513/7391/3dmk01vv3.jpg

*edit*
Ich meine jetzt nicht die Gesamtscore, dass die sich unterscheidet ist ja aufgrund vom fehlenden Game4 oben klar, aber die Light-Tests z.B...

Ich hatte auch den Verdacht, dass AGP4x bremst – und es scheint sich zu bewahrheiten, wofür nicht nur deine Werte sprechen. Wenn ich nämlich mit meiner Radeon X1800 XT benche, habe ich auch 15,5k in 640 mit SW TnL.

Der E6400 hat übrigens nicht mehr Cache als der E4400. ;) Erst der E6600 bzw. 6320/6420 hat 4 MiB.

MfG,
Raff

MadManniMan
2007-06-12, 14:44:01
Bei mir (C2D @1.87, X800 XL AGP, 1 Gig) sieht man sehr gut, wie wichtig inzwischen Hardware Vertex Processing geworden ist - aber auch, daß dieses an anderer Stelle einen Flaschenhals für die Grafikkarte darstellt, wie man an der ST-Füllrate und beim EMBM deutlich erkennen kann!

http://www.madmanniman.de/bilder/hwTnL.png http://www.madmanniman.de/bilder/swTnL.png

Tigershark
2007-06-12, 15:03:53
Ich hatte auch den Verdacht, dass AGP4x bremst – und es scheint sich zu bewahrheiten, wofür nicht nur deine Werte sprechen. Wenn ich nämlich mit meiner Radeon X1800 XT benche, habe ich auch 15,5k in 640 mit SW TnL.

Der E6400 hat übrigens nicht mehr Cache als der E4400. ;) Erst der E6600 bzw. 6320/6420 hat 4 MiB.

MfG,
Raff

Ach hoppla....das war nur der FSB als Unterschied zwischen den 4x00 und den 6x00 bis 6600, gell? Schäm on mi... :)

Naja, dann siehts ja wirklich stark nach AGP-Bremse aus, das seh ich genauso. Leider hab ich mein AGP-Sys momentan nicht lauffähig, sonst hätte ich das mal gegentesten können (bei ansonsten fast gleicher HW) - aber evtl. ist ja jemand mit nem Dual-VSTA hier und willens das mal zu machen? ;)

MadManniMan
2007-06-12, 15:39:20
Naja, dann siehts ja wirklich stark nach AGP-Bremse aus, das seh ich genauso. Leider hab ich mein AGP-Sys momentan nicht lauffähig, sonst hätte ich das mal gegentesten können (bei ansonsten fast gleicher HW) - aber evtl. ist ja jemand mit nem Dual-VSTA hier und willens das mal zu machen? ;)

Hier! Wie was wo soll ich jetz machen? Bin grad im Geiste nicht richtig bei der Sache.

Gast
2007-06-12, 16:25:44
aber evtl. ist ja jemand mit nem Dual-VSTA hier und willens das mal zu machen? ;)Dann aber mit der S939-Version. Das 775-Dual-Dingens hat nur 4 Lanes für den PEG-Slot.

Tigershark
2007-06-12, 16:40:04
Hier! Wie was wo soll ich jetz machen? Bin grad im Geiste nicht richtig bei der Sache.

Hervorragend ;)

Naja eigentlich geht es ja hauptsächlich drum, Raffs Theorie zu untermauern, indem man mit SW T&L einmal mit PCIe Karte und einmal mit AGP Karte laufenlässt und schaut, ob sich da dann (erhebliche) Unterschiede zeigen...wärst du so freundlich und würdest uns erleuchten? :D

Henry
2007-06-12, 16:46:30
Hervorragend ;)

Naja eigentlich geht es ja hauptsächlich drum, Raffs Theorie zu untermauern, indem man mit SW T&L einmal mit PCIe Karte und einmal mit AGP Karte laufenlässt und schaut, ob sich da dann (erhebliche) Unterschiede zeigen...wärst du so freundlich und würdest uns erleuchten? :D

jetzt kommt er bestimmt an, dass er keine PCIe-Karte hat ;D

aths
2007-06-12, 16:46:56
Ich denke eher beim Rastern.

Bei SW-T&L muss auch über den Bus viel mehr übertragen werden. Vor allem bei "nur" AGP 4x (?) ist das schon einiges.Bei SW T&L kann Backface-Culling vor dem Senden der Vertices gemacht werden, bei HW T&L nicht. Sofern keine Vertexbuffer genutzt werden, hat man bei SW T&L dann weniger AGP-Last.

HW stellt eine GeForce2 mit Ultra-Takt (250/230 MHz), SW macht ein Allendale @ 3,1 GHz. Erklärt mir jemand, warum die GF2 noch immer meist schneller ist? Das einzig Interessante ist der High-Poly-Test, wo die Unit der GF2 bei acht Lichtern total absackt, während der C2D "nur" 41 Prozent verliert.Wie mapel schon schrieb dürfte der Flaschenhals hier nicht bei SW T&L liegen.

MadManniMan
2007-06-12, 16:48:29
jetzt kommt er bestimmt an, dass er keine PCIe-Karte hat ;D

;(

Ich sags ja, bin nicht richtig bei der Sache...

Tigershark
2007-06-12, 16:51:41
Gut...äh.... Nächster? :D

stav0815
2007-06-12, 17:32:55
Gut...äh.... Nächster? :D
ich hätte ein Dual-SATAII...
auch mit PCIe und AGP... :confused:

Tigershark
2007-06-12, 17:37:48
Ja prima - und Du hast auch sowohl ne AGP als auch ne PCIe Karte? Dann nix wie los ;)

Pirx
2007-06-12, 17:41:52
Reicht es nicht, ein bisschen mit der AGP-Rate zu spielen?

stav0815
2007-06-12, 17:54:49
Ja prima - und Du hast auch sowohl ne AGP als auch ne PCIe Karte? Dann nix wie los ;)
Muss mir erst den 3D Mark besorgen :D

/e: hab aber keine AGP Karte die passt X-D

Coda
2007-06-12, 18:22:52
Bei SW T&L kann Backface-Culling vor dem Senden der Vertices gemacht werden, bei HW T&L nicht.
Bei HW-T&L sendet man gar nichts (außer den Renderbefehl) sondern rendert direkt mit Geometrie aus dem VRAM. Außer bei dynamischer Geometrie versteht sich, was hier nicht der Fall ist. Und natürlich wird gecullte Geometrie bei SW-T&L nicht übertragen, das spart im Durchschnitt so ~50%.

Sofern keine Vertexbuffer genutzt werden, hat man bei SW T&L dann weniger AGP-Last.
Man kann bei Direct3D ausschließlich aus Vertexbuffern rendern ab DX7. Deshalb versteh ich das jetzt nicht ganz.

RavenTS
2007-06-12, 18:46:00
Reicht es nicht, ein bisschen mit der AGP-Rate zu spielen?

Theoretisch denke ich schon. Müsste man dann in Prozentangaben umrechnen um zu sehen ob es da immer kritischer wird mit sinkender Bandbreite, aber da nur mit AGP4x (GF2U) getestet wurde gibt es da vielleicht Probleme beim Runterschalten.

Nebenbei: Sollte nicht Fastwrites hier etwas bringen?

Raff
2007-06-12, 18:47:18
Fast Writes war an, Aperture Size auf 128 MiB. :)

MfG,
Raff