PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Dynamic Branching Benchmark


Mr. Lolman
2006-05-08, 20:27:14
http://www.humus.ca/index.php?page=3D&ID=67

1. Demo ziehen (1.2MB):Klick (http://www.humus.ca/3D/DynamicBranching3.zip)
2. Fraps Benchmarkdauer auf 20 sec setzen
3. Benchen!

3700+ @3GHz, X1900XTX:

2006-05-08 23:24:22 - DynamicBranching3 ON
Frames: 12661 - Time: 20000ms - Avg: 633.050 - Min: 502 - Max: 723

2006-05-08 23:29:43 - DynamicBranching3 OFF
Frames: 11056 - Time: 20000ms - Avg: 552.800 - Min: 484 - Max: 564

AnarchX
2006-05-08, 20:40:23
P4 3000MHz 6800GT (FW 84.25)

2006-05-08 20:38:30 - DynamicBranching3
Frames: 3018 - Time: 20000ms - Avg: 150.900 - Min: 133 - Max: 177


mit 6800GT @ 400/550MHz:

2006-05-08 20:41:30 - DynamicBranching3
Frames: 3437 - Time: 20000ms - Avg: 171.850 - Min: 152 - Max: 202

Dynamic Branching = off
2006-05-08 20:52:18 - DynamicBranching3
Frames: 3604 - Time: 20000ms - Avg: 180.200 - Min: 176 - Max: 184

Man merkt, dass auf ATI-Hardware programmiert wurde... ;)

Black-Scorpion
2006-05-08, 20:41:34
Venice 3000+ und X800XL (beide Standardtakt)

Frames, Time (ms), Min, Max, Avg
4147, 20000, 194, 212, 207.350

Fullscreen
Frames, Time (ms), Min, Max, Avg
4345, 20000, 214, 221, 217.250

Branching off
Frames, Time (ms), Min, Max, Avg
4367, 20000, 214, 222, 218.350

Branching off und Fullscreen
Frames, Time (ms), Min, Max, Avg
4171, 20000, 194, 213, 208.550

reunion
2006-05-08, 21:09:08
Ähm, eine X800XL sollte eigentlich kein dyn. Branching können. :|

Nerothos
2006-05-08, 21:13:40
Opteron 146 @ 2.8GHz, X1800XT 512MB @ 700/800

Frames, Time (ms), Min, Max, Avg
10355, 20000, 436, 646, 517.50

AnarchX
2006-05-08, 21:15:05
reunion[/POST]']Ähm, eine X800XL sollte eigentlich kein dyn. Branching können. :|

Kann sie auch nicht, wie unschwer an den Ergebnissen von Anonym_001 zu erkennen ist.
Die Option bleibt ohne Wirkung.

reunion
2006-05-08, 21:17:51
6600GT @550/625:

Frames, Time (ms), Min, Max, Avg
969, 20000, 40, 61, 48.450

Ohne Branching habe ich durchgehend exakt 50fps.

AnarchX[/POST]']
Man merkt, dass auf ATI-Hardware programmiert wurde... ;)

Naja, beim Einsatz von dyn. Branching sind die Ergebnisse kein Wunder, die nV-Karten verlieren dadurch ja sogar noch an Leistung. Interessant wäre mal ein Ergebnis von Lolman ohne dyn. Branching.

Black-Scorpion
2006-05-08, 21:19:50
Dann schau nochmal genau hin.

AnarchX
2006-05-08, 21:23:49
Anonym_001[/POST]']Dann schau nochmal genau hin.

Da scheint wohl das Überspringen der Codezeilen für DB etwas Performance zu kosten.
Etwas suspekt dieses Programm.

Undertaker
2006-05-08, 21:27:54
db on

Frames, Time (ms), Min, Max, Avg
13141, 20000, 567, 742, 657.050

db off

Frames, Time (ms), Min, Max, Avg
11754, 20000, 578, 598, 587.700


a64 512kb 2,7ghz, x1900xt @ 675/775

The_Invisible
2006-05-08, 21:32:14
Geforce 7900GTX @ 680/866

Branching on:
2006-05-08 21:31:03 - DynamicBranching3
Frames: 9445 - Time: 20000ms - Avg: 472.250 - Min: 429 - Max: 530

Branching off:
2006-05-08 21:35:40 - DynamicBranching3
Frames: 9317 - Time: 20000ms - Avg: 465.850 - Min: 460 - Max: 475

Geforce 6200Go @ 400/350

Branching on:
2006-05-08 21:49:58 - DynamicBranching3
Frames: 278 - Time: 20000ms - Avg: 13.900 - Min: 13 - Max: 15

Branching off:
2006-05-08 21:50:51 - DynamicBranching3
Frames: 280 - Time: 20000ms - Avg: 14.000 - Min: 13 - Max: 14

mfg

Odal
2006-05-08, 22:01:39
dynamic-branching=OFF Fullscreen

Frames: 6462 Time (ms): 20000 Min: 311 Max: 329 Avg: 323.100

Zwischen dynamic Branching=ON und OFF ist das der selbe Content? Kann mal einer mit X1800XT oder X1900XT mal mit On und OFF Benchen?

Oh ich sehe wurde ja gemacht....das DB bringt zumindest auf ner X1900 was

The_Invisible
2006-05-08, 22:09:54
ähm, könnten wir uns mal auf ein setting einigen, da gibts nämlich gravierende unterschiede zwischen fenstermodus / maximierter fenstermodus / fullscreen

mfg

Odal
2006-05-08, 22:18:07
na ich denk wie lolman also standardeinstellungen (640x480) Fullscreen kein aa oder af und einmal mit DB on und einmal mit DB off

The_Invisible
2006-05-08, 22:22:27
ok, hab vorher im fenstermodus gebencht, in fullscreen hab ich n paar fps mehr:

Mit db:
2006-05-08 22:20:49 - DynamicBranching3
Frames: 10119 - Time: 20000ms - Avg: 505.950 - Min: 451 - Max: 603

Ohne db:
2006-05-08 22:21:27 - DynamicBranching3
Frames: 10587 - Time: 20000ms - Avg: 529.350 - Min: 521 - Max: 540

ohne db sind die werte viel stabiler und man hat höhere min fps werte, ich würde da nicht unbedingt nen vorteil sehen für db

mfg

reunion
2006-05-08, 22:29:37
The_Invisible[/POST]']ähm, könnten wir uns mal auf ein setting einigen, da gibts nämlich gravierende unterschiede zwischen fenstermodus / maximierter fenstermodus / fullscreen

mfg

Das kann man laut sagen. Mal eben annähernd die dreifachen fps bei mir.

reunion[/POST]']6600GT @550/625:

Frames, Time (ms), Min, Max, Avg
969, 20000, 40, 61, 48.450

Ohne Branching habe ich durchgehend exakt 50fps.


Fullscreen:

mit dB:
Frames, Time (ms), Min, Max, Avg
2626, 20000, 115, 163, 131.300

ohne dB:
Frames, Time (ms), Min, Max, Avg
2787, 20000, 137, 141, 139.350


The_Invisible[/POST]']ohne db sind die werte viel stabiler und man hat höhere min fps werte, ich würde da nicht unbedingt nen vorteil sehen für db

mfg

Das kommt auf die Graka an. Karten mit ausreichend schnellem dB gewinnen natürlich Performance, was auch der eigentliche Sinn von dB ist. Bei aktuellen nV-Karten ist die Performance leider derart unterirdisch, dass die Karten meist sogar Leistung verlieren.

Mr. Lolman
2006-05-08, 22:45:41
Odal[/POST]']na ich denk wie lolman also standardeinstellungen (640x480) Fullscreen kein aa oder af und einmal mit DB on und einmal mit DB off

Bei der Demo ist doch standardmässig 4xAA aktiv, oder? aber 640x480 stimmt.

Odal
2006-05-08, 22:50:17
The_Invisible[/POST]']

ohne db sind die werte viel stabiler und man hat höhere min fps werte, ich würde da nicht unbedingt nen vorteil sehen für db

mfg

miese granularität der NV Karten (NV40, G79/71) bezüglich der Sprungweite....wurde hier im Forum schon ein paar mal durchgekaut das die durch DB oftmals gar etwas langsamer werden...

vom SM3 ist DB derzeit nicht wirklich brauchbar (laut einiger Aussagen hier im Forum) zumindest auf NV KArten....
von SM3 bringt bisher nur statisches branching und erhöhter instruktioncount was

Odal
2006-05-08, 22:52:13
Mr. Lolman[/POST]']Bei der Demo ist doch standardmässig 4xAA aktiv, oder? aber 640x480 stimmt.

öhm k.a. ich hatte dummerweise auf max. auflösung gestellt und erst etwas mit rumgespielt bevor ich gebencht hab..also mir alles angeguckt...dummerweise bringt löschen und neuentpacken nix...da sind trotzdem die letzten einstellungen geladen..k.a. wo die demo das hinpackt...

ich konnte mich nur noch an 640x480 erinnern...genau weiss ich es nicht ob ich am AA gedreht hab...

misterh
2006-05-08, 22:53:41
7900 GT 512MB @ 615/775

Default Einstellung.

DynamicBranching3
Avg: 440.850 - Min: 396 - Max: 501

The_Invisible
2006-05-08, 23:19:40
Odal[/POST]']miese granularität der NV Karten (NV40, G79/71) bezüglich der Sprungweite....wurde hier im Forum schon ein paar mal durchgekaut das die durch DB oftmals gar etwas langsamer werden...

vom SM3 ist DB derzeit nicht wirklich brauchbar (laut einiger Aussagen hier im Forum) zumindest auf NV KArten....
von SM3 bringt bisher nur statisches branching und erhöhter instruktioncount was

naja, aber selbst bei aktuellen ati karten sind die min fps ohne db höher als mit, und zwischen min und max hat man nen 200fps sprung der je nach game nicht optimal ist (ja, bei den frameraten sicher egal). das die nv karten durch db nichts gewinnen ist eh bekannt, aber das durch db die min fps raten sinken ist auch nicht gerade optimal

mfg

saddevil
2006-05-08, 23:29:12
Frames, Time (ms), Min, Max, Avg
4215, 20000, 188, 244, 210.750

7600GT 620/810

Odal
2006-05-08, 23:41:18
The_Invisible[/POST]']naja, aber selbst bei aktuellen ati karten sind die min fps ohne db höher als mit, und zwischen min und max hat man nen 200fps sprung der je nach game nicht optimal ist (ja, bei den frameraten sicher egal). das die nv karten durch db nichts gewinnen ist eh bekannt, aber das durch db die min fps raten sinken ist auch nicht gerade optimal

mfg

das würde ich nicht an einer Demo festmachen....die ist eben dazu da die performance von DB zwischen verschiedenen GPU Architekturen zu vergleichen...


[Vertex shader]

uniform vec3 camPos;
uniform vec3 lightPos[LIGHT_COUNT];
uniform float invRadius[LIGHT_COUNT];

attribute vec2 textureCoord;
attribute vec3 tangent;
attribute vec3 binormal;
attribute vec3 normal;

varying vec3 lVec[LIGHT_COUNT];
varying vec2 texCoord;
varying vec3 vVec;
#ifdef SHADOWS
varying vec3 shadowVec[LIGHT_COUNT];
#endif

void main(){
gl_Position = ftransform();

texCoord = textureCoord;

for (int i = 0; i < LIGHT_COUNT; i++){
vec3 lightVec = invRadius[i] * (lightPos[i] - gl_Vertex.xyz);

#ifdef SHADOWS
shadowVec[i] = -lightVec;
#endif
lVec[i].x = dot(lightVec, tangent);
lVec[i].y = dot(lightVec, binormal);
lVec[i].z = dot(lightVec, normal);
}

vec3 viewVec = camPos - gl_Vertex.xyz;
vVec.x = dot(viewVec, tangent);
vVec.y = dot(viewVec, binormal);
vVec.z = dot(viewVec, normal);
}


[Fragment shader]

uniform sampler2D Base;
uniform sampler2D Bump;
uniform samplerCube ShadowMap;

uniform vec3 lightColor[LIGHT_COUNT];
uniform vec2 plxCoeffs;

uniform bool hasParallax;

varying vec3 lVec[LIGHT_COUNT];
varying vec2 texCoord;
varying vec3 vVec;
#ifdef SHADOWS
varying vec3 shadowVec[LIGHT_COUNT];
#endif

void main(){
// float atten[LIGHT_COUNT];
vec3 atten;
for (int i = 0; i < LIGHT_COUNT; i++){
atten[i] = 1.0 - dot(lVec[i], lVec[i]);
}
atten = max(atten, 0.0);


vec3 viewVec = normalize(vVec);

vec2 plxTexCoord = texCoord;
if (hasParallax){
float height = texture2D(Bump, texCoord).w;
float offset = height * plxCoeffs.x + plxCoeffs.y;
plxTexCoord += offset * viewVec.xy;
}

vec3 base = texture2D(Base, plxTexCoord).rgb;
vec3 lighting = 0.1 * base;

#ifdef BRANCHING
if (dot(atten, atten) > 0.0)
#endif
{

vec3 bump = texture2D(Bump, plxTexCoord).xyz * 2.0 - 1.0;
bump = normalize(bump);
vec3 reflVec = reflect(-viewVec, bump);

for (int i = 0; i < LIGHT_COUNT; i++){
#ifndef BRANCHING
atten[i] *= float(lVec[i].z > 0.0);
#else
if (atten[i] > 0.0)
if (lVec[i].z > 0.0)
#endif
{

#ifdef SHADOWS
# ifndef BRANCHING
atten[i] *= float(length(shadowVec[i]) < textureCube(ShadowMap, shadowVec[i])[i]);
# else
if (length(shadowVec[i]) < textureCube(ShadowMap, shadowVec[i])[i])
# endif
#endif
{
vec3 lightVec = normalize(lVec[i]);

float diffuse = saturate(dot(lightVec, bump));
float specular = pow(saturate(dot(reflVec, lightVec)), 16.0);

lighting += atten[i] * lightColor[i] * (diffuse * base + 0.6 * specular);
}
}
}
}

gl_FragColor.rgb = lighting;
}

man müsste den shadersource jetzt hernehmen (jedenfalls jemand der sich etwas damit auskennt) und jede anweisung bewerten wie "teuer" diese ist...es kann nämlich durchaus sein das dort auch DB genutzt wurde wo die If-Anfrage schon deutlich teurer als der rest ist.

wer hat das ding eigentlich geschrieben?

reunion
2006-05-08, 23:50:23
Odal[/POST]']wer hat das ding eigentlich geschrieben?

humus.

Raff
2006-05-09, 00:04:33
Branching an (Default):
Frames: 10948 - Time: 20000ms - Avg: 547.400 - Min: 459 - Max: 680

Branching aus:
Frames: 8369 - Time: 20000ms - Avg: 418.450 - Min: 415 - Max: 423

Mordsunterschied. R520 @ 729 MHz, RAM @ 900 MHz.

€dit:

Ein klein wenig CPU-limitiert ist's auch – zumindest mit Branching:

Frames: 11213 - Time: 20000ms - Avg: 560.650 - Min: 459 - Max: 680
Frames: 8368 - Time: 20000ms - Avg: 418.400 - Min: 414 - Max: 422

2,54 vs. 2,57 GHz. :D

MfG,
Raff

Spasstiger
2006-05-09, 00:48:41
reunion[/POST]']Ähm, eine X800XL sollte eigentlich kein dyn. Branching können. :|
Vielleicht hat Humus hier zusätzlich seine eigene DB-Methode eingebaut, die auch auf SM2-Karten lauffähig ist. Die Methode wurde in seiner ersten Dynamic-Branching-Demo verwendet:
http://www.humus.ca/index.php?page=3D&ID=50

This demo however shows a way to implement dynamic branching without pixel shader 3.0, using basic graphics functionality such as alpha testing and stencil testing. Not only is it doable, but also gives every bit of the performance of real dynamic branching.

AnarchX
2006-05-09, 08:19:38
P4 3300Mhz 6800GT@ 400/550Mhz

Fullscreen

DB=on
2006-05-09 08:16:17 - DynamicBranching3
Frames: 3704 - Time: 20000ms - Avg: 185.200 - Min: 163 - Max: 229

DB=off
2006-05-09 08:16:48 - DynamicBranching3
Frames: 4109 - Time: 20000ms - Avg: 205.450 - Min: 201 - Max: 209

Black-Scorpion
2006-05-09, 11:54:05
Spasstiger[/POST]']Vielleicht hat Humus hier zusätzlich seine eigene DB-Methode eingebaut, die auch auf SM2-Karten lauffähig ist. Die Methode wurde in seiner ersten Dynamic-Branching-Demo verwendet:
http://www.humus.ca/index.php?page=3D&ID=50
Glaube ich nicht.
Wenn du diese Ergebnisse mit denen der aktuellen Vergleichst, wirst du den Unterschied sehen.
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=4283447&postcount=3
Aktuell ist Branching off schneller und in der ersten Version langsamer.
Das ist ein Vergleichsbench mit der 1. Version.
Venice 3000+ und X800 XL (beide Standardtakt)

Frames, Time (ms), Min, Max, Avg
8014, 20000, 366, 436, 400.700

Branching off
Frames, Time (ms), Min, Max, Avg
2743, 20000, 129, 141, 137.150

BUG
2006-05-09, 15:15:43
Celeron M 1300@2600 MHz
MSI X1600 Pro @ 700/420
FullScreen 640x480

DB=ON
Frames, Time (ms), Min, Max, Avg
3741, 20000, 163, 212, 187.050

DB=OFF
Frames, Time (ms), Min, Max, Avg
3309, 20000, 162, 170, 165.450

cu
BUG

tombman
2006-05-09, 15:41:12
2006-05-09 15:35:50 - sam2
Frames: 13037 - Time: 20000ms - Avg: 651.850 - Min: 580 - Max: 761

Anmerkung:

1.) cpu limit is da (4ghz presler)
2.) Crossfire keine Auswirkung
3.) gebenched auf FULLSCREEN (X1900 @ 670/800)

p.s. könnten die SLI user mal schauen, ob das Ding überhaupt mit 2 KArten rennt gscheid?

reunion
2006-05-09, 16:34:58
Raff[/POST]']Branching an (Default):
Frames: 10948 - Time: 20000ms - Avg: 547.400 - Min: 459 - Max: 680

Branching aus:
Frames: 8369 - Time: 20000ms - Avg: 418.450 - Min: 415 - Max: 423

Mordsunterschied. R520 @ 729 MHz, RAM @ 900 MHz.


Hier sieht man sehr gut die ausgezeichnete dB-Performance des R520. Selbst ein R580 hat in dieser Hinsicht einen deutlichen Nachteil.

Undertaker
2006-05-09, 16:50:43
reunion[/POST]']Hier sieht man sehr gut die ausgezeichnete dB-Performance des R520. Selbst ein R580 hat in dieser Hinsicht einen deutlichen Nachteil.

warum sollte der r580 da schlechter sein, hat man das wieder beschnitten?

Undertaker
2006-05-09, 16:55:50
Undertaker[/POST]']db on

Frames, Time (ms), Min, Max, Avg
13141, 20000, 567, 742, 657.050

db off

Frames, Time (ms), Min, Max, Avg
11754, 20000, 578, 598, 587.700


a64 512kb 2,7ghz, x1900xt @ 675/775


mit fullscreen nocheinmal kräftig mehr:

db on

Frames, Time (ms), Min, Max, Avg
13967, 20000, 610, 811, 698.350

Fetza
2006-05-09, 17:04:59
Undertaker[/POST]']warum sollte der r580 da schlechter sein, hat man das wieder beschnitten?

das frage ich mich auch, soweit ich weiss, sind r520 und r580 gleich schnell im db.

greetz

Fetza

Mr. Lolman
2006-05-09, 17:05:37
Undertaker[/POST]']mit fullscreen nocheinmal kräftig mehr:

db on

Frames, Time (ms), Min, Max, Avg
13967, 20000, 610, 811, 698.350

Welcher Treiber? 640x480, 4xAA? Sonst was in den Treibersettings geändert?

Mr. Lolman
2006-05-09, 17:08:26
reunion[/POST]']Hier sieht man sehr gut die ausgezeichnete dB-Performance des R520. Selbst ein R580 hat in dieser Hinsicht einen deutlichen Nachteil.

Imo profitiert der R520 nur deswegen scheinbar so stark vom dynamischen Branching, weil er auch in den Szenen wo nix weggebrancht wurde, auch stärker einbricht. => Pixelpipes Limititation.

A.Wesker
2006-05-09, 17:10:42
geile sache :D
Graka 7900 GTX @ 800/1920


3300 MHz
Avg: 552.950 - Min: 503 - Max: 641

3200 MHz
Avg: 579.100 - Min: 524 - Max: 663

3050 MHz
Avg: 658.600 - Min: 595 - Max: 790

3000 MHz
Avg: 665.300 - Min: 593 - Max: 757

2800 MHz
Avg: 707.400 - Min: 629 - Max: 804

2600 MHz
Avg: 766.700 - Min: 686 - Max: 875

2400 MHz
Avg: 826.350 - Min: 738 - Max: 940


1 MHz = 100000 FPS ? :D

Undertaker
2006-05-09, 17:15:03
cat 6.3, quali standard was das ccc so einstellt

am aa hab ich nix verstellt, steht das von vornherein auf 4x?

Undertaker
2006-05-09, 17:16:43
A.Wesker[/POST]']geile sache :D
Graka 7900 GTX @ 800/1920


3300 MHz
Avg: 552.950 - Min: 503 - Max: 641

3200 MHz
Avg: 579.100 - Min: 524 - Max: 663

3050 MHz
Avg: 658.600 - Min: 595 - Max: 790

3000 MHz
Avg: 665.300 - Min: 593 - Max: 757

2800 MHz
Avg: 707.400 - Min: 629 - Max: 804

2600 MHz
Avg: 766.700 - Min: 686 - Max: 875


1 MHz = 100000 FPS ? :D

haha das ist ja mal witzlos... evntl bin ich auch deshalb vor den anderen x1900 nutzern, weil ich nur 2,7ghz habe ;)

A.Wesker
2006-05-09, 17:20:43
und hier sind die 1000 FPS @ 2 GHz
Avg: 1003.494 - Min: 886 - Max: 1128

saddevil
2006-05-09, 17:53:10
lustig
nicht so krass aber mit 1,6GHZ hab ich auch mehr FPS als mit 2,6GHZ

AnarchX
2006-05-09, 18:04:28
AnarchX[/POST]']P4 3300Mhz 6800GT@ 400/550Mhz

Fullscreen

DB=on
2006-05-09 08:16:17 - DynamicBranching3
Frames: 3704 - Time: 20000ms - Avg: 185.200 - Min: 163 - Max: 229

DB=off
2006-05-09 08:16:48 - DynamicBranching3
Frames: 4109 - Time: 20000ms - Avg: 205.450 - Min: 201 - Max: 209

P4 2000MHz

DB=on
2006-05-09 18:45:43 - DynamicBranching3
Frames: 5402 - Time: 20000ms - Avg: 270.100 - Min: 239 - Max: 314


DB=off
2006-05-09 18:02:04 - DynamicBranching3
Frames: 5643 - Time: 20000ms - Avg: 282.150 - Min: 277 - Max: 286

:uponder:

Undertaker
2006-05-09, 18:05:16
damit kann man die aussagekraft dieses benches wohl vergessen... :|

Black-Scorpion
2006-05-09, 18:09:55
Das sollte mal jemand mit einer AMD CPU testen.
Denn diese seltsamen Ergebnisse sind ja bis jetzt nur mit Intel CPUs gemacht.

AnarchX
2006-05-09, 18:25:37
Anonym_001[/POST]']Das sollte mal jemand mit einer AMD CPU testen.
Denn diese seltsamen Ergebnisse sind ja bis jetzt nur mit Intel CPUs gemacht.

Nur seltsam, dass es bei Raff mit dem C-M so aussah als wäre es cpu-limitiert.

Branching an (Default):
Frames: 10948 - Time: 20000ms - Avg: 547.400 - Min: 459 - Max: 680

Branching aus:
Frames: 8369 - Time: 20000ms - Avg: 418.450 - Min: 415 - Max: 423

Mordsunterschied. R520 @ 729 MHz, RAM @ 900 MHz.

€dit:

Ein klein wenig CPU-limitiert ist's auch – zumindest mit Branching:

Frames: 11213 - Time: 20000ms - Avg: 560.650 - Min: 459 - Max: 680
Frames: 8368 - Time: 20000ms - Avg: 418.400 - Min: 414 - Max: 422

2,54 vs. 2,57 GHz.

Vielleicht hat es seine Ursache in HT oder Dualcore...
edit: Bei mir nicht die Ursache.

Black-Scorpion
2006-05-09, 18:34:01
AnarchX[/POST]']Nur seltsam, dass es bei Raff mit dem C-M so aussah als wäre es cpu-limitiert.


Vielleicht hat es seine Ursache in HT oder Dualcore...
Da fällt mir gerade auf das Raff ja eine ATI Karte und ihr eine nVidia Karte habt.
Vielleicht liegt es am Zusammenspiel CPU und Treiber bei euch?
Aber um das festzustellen müßen noch andere testen.

Vielleicht wäre dafür sogar ein Thread in dem Unterforum (http://www.forum-3dcenter.org/vbulletin/forumdisplay.php?f=105) besser geeignet um darüber zu diskutieren warum und weshalb das passiert.

saddevil
2006-05-09, 18:46:10
habe NV karte + opteron

AnarchX
2006-05-09, 18:51:38
@ Anonym_001: Ein paar Werte mit niedrigerem CPU-Takt von dir wären auch interessant.

Odal
2006-05-09, 19:47:39
A.Wesker[/POST]']geile sache :D
Graka 7900 GTX @ 800/1920


3300 MHz
Avg: 552.950 - Min: 503 - Max: 641

3200 MHz
Avg: 579.100 - Min: 524 - Max: 663

3050 MHz
Avg: 658.600 - Min: 595 - Max: 790

3000 MHz
Avg: 665.300 - Min: 593 - Max: 757

2800 MHz
Avg: 707.400 - Min: 629 - Max: 804

2600 MHz
Avg: 766.700 - Min: 686 - Max: 875

2400 MHz
Avg: 826.350 - Min: 738 - Max: 940


1 MHz = 100000 FPS ? :D

Na so ein Schmarrn... meine CPU lief während des Tests auf knapp 2,6 Ghz...

ich werd morgen früh nochmal neu testen mit ähm sowenig wie möglich :D

tombman
2006-05-09, 19:58:35
LOL; thx @ wesker, damit kann man den benchmark vergessen ;)

reunion
2006-05-09, 20:25:21
Undertaker[/POST]']warum sollte der r580 da schlechter sein, hat man das wieder beschnitten?

Beschnitte ist das falsche Wort. Durch die dreifache Anzahl an ALUs stieg natürlich auch die Granularität beim dB auf das dreifache, wobei diese bei R520 schon annähernd perfekt war (16Pixel AFAIK). Zum Vergleich: G70 hat 1024 Pixel.

Frank1974
2006-05-09, 20:44:19
Hier mal A64+1900XT


3700+@2650MHz
Branching an Fullscreen/4xAA

Frames, Time (ms), Min, Max, Avg
10804, 20000, 386, 630, 540.200



3700+@1325MHz
Branching an Fullscreen/4xAA

Frames, Time (ms), Min, Max, Avg
10721, 20000, 436, 629, 536.050

mfg
Frank

AnarchX
2006-05-09, 20:49:43
Frank1974[/POST]']Hier mal A64+1900XT


3700+@2650MHz
Branching an (Default):

Frames, Time (ms), Min, Max, Avg
10804, 20000, 386, 630, 540.200



3700+@1325MHz
Branching an (Default):

Frames, Time (ms), Min, Max, Avg
10721, 20000, 436, 629, 536.050

mfg
Frank

Sehr seltsam, dass sich bei dir nichts bei Avg tut. :|
Ich glaube das sollte man humus fragen, ob er weiß worin das seine Ursache haben kann.

Frank1974
2006-05-09, 20:52:22
AnarchX[/POST]']Sehr seltsam, dass sich bei dir nichts bei Avg tut. :|
Ich glaube das sollte man humus fragen, ob er weiß worin das seine Ursache haben kann.

Ich habe den Post noch mal geändert, war nicht Default, war mit 4xAA :redface:.
Aber ohne ist es auch fast gleich, habe ich gerade nochmal getestet.

Hier nochmal wirklich mit Default:

3700+@2650MHz
Branching an (Default):

Frames, Time (ms), Min, Max, Avg
12662, 20000, 554, 727, 633.100



3700+@1325MHz
Branching an (Default):

Frames, Time (ms), Min, Max, Avg
12743, 20000, 556, 742, 637.150



mfg
Frank

AnarchX
2006-05-09, 21:04:53
Also scheinen eindeutig nur die NV-Karten betroffen zu sein.
Dualcore-Optimierung des FW kann es auch nicht sein.

Vielleicht kann einer der Gurus hier mal eine Vermutung abgeben, weshalb die Performance bei einem niedrigeren CPU-Takt so steigen kann.
Bei mir 30% weniger CPU -> 50% mehr Avg-FPS.

Frank1974
2006-05-09, 21:11:53
AnarchX[/POST]']Vielleicht kann einer der Gurus hier mal eine Vermutung abgeben, weshalb die Performance bei einem niedrigeren CPU-Takt so steigen kann.
Bei mir 30% weniger CPU -> 50% mehr Avg-FPS.

Ist wohl ein Joke-Programm :biggrin:, dürfte Technisch nicht gehen das :|, ist wohl beim programmieren was schief gelaufen, oder?

mfg

AnarchX
2006-05-09, 21:25:51
Frank1974[/POST]']Ist wohl ein Joke-Programm :biggrin:, dürfte Technisch nicht gehen das :|, ist wohl beim programmieren was schief gelaufen, oder?

mfg

Ich ereiche mit 1,7Ghz mit meiner 6800GT schon fast 300 FPS, wenn man da die Werte der ATI-Karten sieht, kann das doch einfach nicht stimmen.

Das die FPS ab berechnet werden ist eine Tatsache bzw. wird von Fraps bestätigt.

edit: humus wurde schon von Quasar unterrichtet von dieser Anomalie, mal sehen was er meint..

Spasstiger
2006-05-09, 21:39:14
Mr. Lolman[/POST]']Imo profitiert der R520 nur deswegen scheinbar so stark vom dynamischen Branching, weil er auch in den Szenen wo nix weggebrancht wurde, auch stärker einbricht. => Pixelpipes Limititation.
So wird es wohl sein. Ist ja alles eine relative Betrachtung und keine absolute, d.h. die X1800 XT ist mit DB immer noch langsamer als eine X1900 XT mit DB.

reunion
2006-05-09, 21:43:36
Spasstiger[/POST]']So wird es wohl sein. Ist ja alles eine relative Betrachtung und keine absolute, d.h. die X1800 XT ist mit DB immer noch langsamer als eine X1900 XT mit DB.

Natürlich spielt das auch mit rein. Auf jeden Fall brancht ein R520 wesentlich effizienter, die wesentlich höhere PS-Leistung des R580 gleicht das natürlich locker aus.

Quasar
2006-05-09, 21:58:18
Maximal können R520 und R580 bei ausreichend feinkörnigem Shading auf dieselbe PS-Leistung pro Takt kommen.

On-Topic:
Mein PC bricht mit geringerem CPU-Takt (-450 MHz) nicht ein in der Demo. Ich benutze aktuell eine EAX800 XL mit dem Cat6.4.

Allerdings kostet das, was die Demo auf SM2-Karten als dynamisches Branching nutzt bei mir ca. 6% Performance (51 Fps ohne, 47-48 Fps mit der entspr. Option angehakt in 1600x1200 Fullscreen).

AnarchX
2006-05-11, 16:19:33
Nochmal was zur FPS-Anomalie:
Ich hatte jetzt einfach mal noch andere Demos von humus getestet die ich noch auf der HDD hatte und bei allen erhöhten sich die FPS als ich die CPU heruntertaktete.
Also wird es wohl generell an seiner Programmierweise liegen...

saddevil
2006-05-11, 16:21:47
das sollten sich vieleicht mal einige spieleentwickler ansehen

AnarchX
2006-05-11, 16:28:28
saddevil[/POST]']das sollten sich vieleicht mal einige spieleentwickler ansehen

"Nvidiakarten machen alte CPUs schnell"... ;)
Ich glaube eher, da er mehr mit ATI-Hardware proggt, dass eine Inkompatibilität gibt wodurch ein Timer ausser Kontrolle gerät.