Archiv verlassen und diese Seite im Standarddesign anzeigen : PCIE 2.0 Bottleneck bei DirectX 12/Mantel gegenüber 3.0?
Der HeinZ
2015-04-10, 10:16:38
Hallo zusammen,
ich habe jetzt ein bißchen den relativen Hype um DirectX bzw vorher der Mantel API verfolgt.
Ich habe bisher leider keinen Thread gefunden in dem die PCIe Performance durchgemessen oder nachgefragt wurde.
So wie ich das verstehe (als laie) nutzt Directx 12 die vorhandene Hardware grob gesagt besser aus, wenn das Spiel über diese API angesprochen programmiert wird. Die CPU kann durch die parallelisierung mehr berechnen und somit die Grafikkarte schneller beliefern.
In der Vergangenheit war das ja weniger ein Problem, aber nun scheint sich der Durchsatz auf dem Bussystem zu vervielfachen, wenn ich theoretische benchmarks Sehe bis zu einem Faktor von bis zu 5x, und das ist ja nun erstmal der Anfang, die meisten Spielhersteller haben da ja noch garkeine Erfahrung und mit der Zeit wird sich da wahrscheinlich noch einiges zugunsten von Direct X12 tun.
Inwiefern wird denn der PCIe Bus dann zum Flaschenhals?
Nehme ich z.B. mal den Worstcase einen AMD FX der maximal nur 2.0 unterstützt. Dann muss ich doch bei der optimalen Auslastung automatisch davon ausgehen, dass System bei entsprechend hoher Belastung trotz ausreichender parallesierung viel früher in die Knie gehen wird als ein Intel System welches über einen PCIe 3.0 Bus verfügt. Oder gar ein Core2Duo/Quad, der von der Rechenleistung ja locker ausreicht aber wohlmöglich max. PCIe 1.1 hat. Gerade im hinblick auf SLI/Crossfire-Konfigurationen könnte da einiges an Potenzial verloren gehen? Oder irre ich mich da? hat da jemand Erkenntnisse oder theoretische Ansätze?
Leonidas
2015-04-10, 13:20:45
DirectX 12, Mantle & Vulkan erhöhen ja nur die Anzahl der DrawCalls an die CPU. Das ist vermutlich nur ein Bruchteil des PCI-Express-Datenverkehrs und wird daher kaum Auswirkungen auf die benötigte PCI-Express-Bandbreite haben.
Denke ich. Lasse mich gern korrigieren.
del_4901
2015-04-10, 13:24:29
SLi und Xfire Transfers gehen auch ueber den PCIe Bus.
Der HeinZ
2015-04-10, 15:18:15
DirectX 12, Mantle & Vulkan erhöhen ja nur die Anzahl der DrawCalls an die CPU. Das ist vermutlich nur ein Bruchteil des PCI-Express-Datenverkehrs und wird daher kaum Auswirkungen auf die benötigte PCI-Express-Bandbreite haben.
Denke ich. Lasse mich gern korrigieren.
Interessanter Ansatz, ich glaube aber durch die erhöhte Leistung an Drawcalls, also durch die höhere Anzahl an möglichen Objekten, erhöht sich doch auch exobitant die Polygonmenge und ebenso die benötigte Texturmenge, oder liege ich da falsch? Oder wird das dann einfach durch einen größeren Speicher auf der Karte ausgeglichen? Dafür ist mein Wissen zu gering.
Der HeinZ
2015-04-10, 15:31:51
Anmerkung: Das Thema macht natürlich nur dann Sinn wenn die Grafikkarte nicht generell ein Flaschenhals ist, hoffe das kommt aus der Frage logisch hervor.
Tesseract
2015-04-10, 15:41:11
drawcalls sind doch nur ein paar bit lang, das aufwändige daran ist es diese vor dem senden zu codieren und genau da setzen die neuen APIs an. ich kann mir nicht vorstellen, dass PCI-e da signifikant stärker limitieren wird als davor.
Der HeinZ
2015-04-10, 16:33:38
drawcalls sind doch nur ein paar bit lang, das aufwändige daran ist es diese vor dem senden zu codieren und genau da setzen die neuen APIs an. ich kann mir nicht vorstellen, dass PCI-e da signifikant stärker limitieren wird als davor.
Und die erhöhte Menge durch die neuen API´s ist nicht so signifikant, das man dadurch irgendwelche Einbußen hat? Wäre ja cool, dann würde das alte System noch in bißchen laufen können.
Kriton
2015-04-10, 16:58:01
SLi und Xfire Transfers gehen auch ueber den PCIe Bus.
SLI auch schon? Ich dachte das läuft nur über die Brücke und allein AMD geht über PCIe - oder ist die Brücke nur zusätzlich?
Hacki_P3D
2015-04-10, 21:08:35
btw, das "Bootleck" sollte wohl ein "Bottleneck" werden :)
Der HeinZ
2015-04-10, 23:26:23
btw, das "Bootleck" sollte wohl ein "Bottleneck" werden :)
Jap, vertippet!
SLI auch schon? Ich dachte das läuft nur über die Brücke und allein AMD geht über PCIe - oder ist die Brücke nur zusätzlich?
Die Brücke ist soweit ich weiß nur für's Bild. Könnte mich aber täuschen.
Der HeinZ
2015-04-11, 07:36:55
Thanx für die Themen Korrektur!
Der HeinZ
2015-04-11, 07:50:30
Die Brücke ist soweit ich weiß nur für's Bild. Könnte mich aber täuschen.
Laut diverser User/Foren macht es Speedmäßig keinen Unterschied ob man die Brücke draufmacht oder nicht, ich kann mir höchstens vorstellen dass man die Bandbreite bei z.B. 16x + 4x konfigurationen damit unterstützten kann, der hauptanteil aber weiter über den PCIe Bus läuft. Die meisten User haben aber auch ausreichend Bandbreiten (2x 16x mit ausreichend lanes) so dass man da eigentlich keine Rückschlüsse auf "leichtere" Konfigurationen ziehen sollte. Dazu habe ich aber mal garkeine Infos wieviel diese propritären Anschlüsse überhaupt an Bandbreite haben."XCrossfire" läuft ja ebenfalls nur über den PCie Bus, bei "Crossfire" war das ja noch anders.
nun zum Thread... Ich glaube wir werden mal abwarten müssen bis sich damit jemand auseinander setzt und das mal testet. Pauschal kann man das dann wohl doch noch nicht sagen. Für mich aber weiterhin ein interessantes Thema.
bnoob
2015-04-13, 09:36:36
Auch ohne neue API ist der Performanceunterschied heute schon *messbar* (http://www.computerbase.de/2013-01/bericht-pcie-3.0-vs-pcie-2.0/), aber so einen Unterschied dürften auch die vermehrten Drawcalls nicht machen.
Da lobe ich mir doch meine PCIe 3.0 Kaveri-Plattform :D
rentex
2015-04-13, 10:44:27
Die unterschiede werden sich mit den neuen Karten (Fiji & Pascal) und Auflösungen (4K)vergrößern. Ich wird erstmal ein komplett neues System basteln.
aufkrawall
2015-04-13, 10:48:45
Mit hohen Auflösungen verringert sich der Unterschied.
Der HeinZ
2015-04-14, 09:54:16
Mit hohen Auflösungen verringert sich der Unterschied.
Meinst du den Unterschied zwischen den API´s oder den verschiedenen PCIe Busstandards?
Der HeinZ
2015-04-14, 10:05:30
Die unterschiede werden sich mit den neuen Karten (Fiji & Pascal) und Auflösungen (4K)vergrößern. Ich wird erstmal ein komplett neues System basteln.
Da reicht doch aber schon downsampling + 8xAA aus. Und dabei kann ich sogar bei DirectX 8 Games ganz schnell ins Limit der GPU laufen ohne das es den PCI Bus juckt.
Bei mehr Drawcalls kann ich doch auch mehr gleichzeitig sichtbare objekte texturieren und sie ggf. mit mehr details (Polygonen) ausstatten und so die last auf dem Bus vervielfachen, wenn ich das möchte / brauche. Limitiert da nicht der Bus, ist der 16x in allen Versionen dermaßen überdimensoniert das das tatsächlich keinen Unterscheid macht?
Das die reine anzahl an Drawcalls den Bus nicht großartig mehr belastet habe ich soweit verstanden.
Schrotti
2015-04-14, 15:25:32
Auch ohne neue API ist der Performanceunterschied heute schon *messbar* (http://www.computerbase.de/2013-01/bericht-pcie-3.0-vs-pcie-2.0/), aber so einen Unterschied dürften auch die vermehrten Drawcalls nicht machen.
Da lobe ich mir doch meine PCIe 3.0 Kaveri-Plattform :D
Hier (http://www.techpowerup.com/reviews/NVIDIA/GTX_980_PCI-Express_Scaling/15.html) sind die Unterschiede fühlbar.
Auch wenn es nur das Spiel betrifft und Full HD betrifft.
RavenTS
2015-04-14, 19:15:59
Meinst du den Unterschied zwischen den API´s oder den verschiedenen PCIe Busstandards?
Wie man am MANTLE gesehen hat, wohl beides. Die CPU-Entlastung bringt tendenziell mehr bei niedrigeren Auflösungen bzw. schwächeren CPUs und angesichts des anstehenden neuen Auflösungsstandards 4K werden die Auflösungen sowieso weiter steigen...
Der HeinZ
2015-04-15, 10:36:38
Hier (http://www.techpowerup.com/reviews/NVIDIA/GTX_980_PCI-Express_Scaling/15.html) sind die Unterschiede fühlbar.
Auch wenn es nur das Spiel betrifft und Full HD betrifft.
Okay, das scheint ein gutes Beispiel dafür zu sein wenn die CPU und GPU Leistung ausreichend ist und der Bus nicht mehr genug rüberschaufelt.
Klar in 4K macht die GPU langsam schlapp. Mehr als 10% unter 1600x900 ist aber wirklich nicht ohne, dürfte bei einer schnelleren GPU nochmal nach oben gehen, der Speicher der Karte hingegen scheint da ja nicht großartig zu limitieren wenn man sich die x4 Werte so anschaut.
So stelle ich mir dass bei Low Level API´s vor, nur noch ein bißchen schlimmer. Bei ausreichender CPU/GPU Leistung wird dann auch mal endlich der unterbau interessant. PCIe 4.0 kommt da wohl ganz gelegen.
sulak
2015-05-02, 23:20:03
Passt vielleicht nicht ganz zum Thema, aber CB hat beim neuen Benchmark mit einem alten Sandy festgestellt, das AC:Unity merklich ruckelt bei Grakas unter 4GB RAM.
Mit dem Haswell trat es nicht auf:
http://www.computerbase.de/2015-05/grafikkarten-17x-amd-radeon-und-nvidia-geforce-im-vergleich/5/
Zitat: "Dafür gibt es in Assassin's Creed Unity den interessanten Effekt, dass sämtliche Zwei- und Drei-Gigabyte-Grafikkarten auf dem Core i5-2500K zwar hohe Frameraten erzeugen, jedoch ab und zu kurze Hänger aufweisen, die den Spielspaß stören. Der Grund ist wahrscheinlich an dem großen VRAM-Hunger des Spiels (vier Gigabyte werden bereits in Full HD belegt) und dem PCIe-2.0-Interface des Sandy-Bridge-Prozessors zu suchen. Während PCIe 3.0 anscheinend schnell genug ist, auch den Speicher der Grafikkarte mit neuen Daten zu versorgen, ist es der ältere PCIe-2.0-Standard offenbar nicht."
Sind ja ca. 8GB/s vs 15GB/s Bandbreite laut Wiki, wenn die Graka schon Texturen auslagert, wird es eng auf dem Bus. BTW gab es doch bereits mit Vista und dem neuen Treibermodell "mehr Drawcalls" günstiger http://www.forum-3dcenter.org/vbulletin/showthread.php?t=364604
aufkrawall
2015-05-03, 02:24:15
Ich habe selbst gesehen, wie AC: U in WQHD auf einer 780 Ti mit 4770k übelst stockt, was es mit einem 2500k und 4GB VRAM nicht der Fall ist.
vBulletin®, Copyright ©2000-2025, Jelsoft Enterprises Ltd.