PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Tester mit PCIe 2.0 und Radeon gesucht (am besten Hawaii)


aufkrawall
2016-03-03, 21:58:23
Hallo,
ich möchte herausfinden, ob bei AMD mit madVR NNEDI3 Scaling per OpenCL immer noch ein unnötiger Copyback über PCI Express stattfindet, der die Benutzung einschränkt. Es gab vor ein paar Monaten eine Änderung in madVR, die evtl. Anlass zur Hoffnung gibt.
Dafür muss nur jemand testen, ob ein 1080p 60fps Video mit OpenCL NNEDI3 in madVR ohne Framedrops hochskaliert werden kann. Findet der unnötige Copyback statt, dürfte das mit PCIe 2.0 nicht ohne Drops funktionieren.
Der Testvorgang sollte nicht nennenswert mehr als fünf Minuten in Anspruch nehmen.

Ich brauche einen Tester mit
-PCI Express 2.0, also etwa Sandy Bridge- oder Bulldozer-CPU
-relativ schneller GCN-Radeon (am besten Hawaii, Fiji sollte aber auch gehen)
-am besten Windows 10 oder 8.1, notfalls ginge auch 7
-einem Monitor >1080p oder einer VSR-Auflösung, die >1080p ist

Wenn hier das jemand testen könnte, bitte melden.
Ich poste dann eine Anleitung, was zu tun wäre.

samm
2016-03-03, 22:24:24
Hier. Nicht die perfekte Ausstattung für den Test, aber:

Piledriver mit PCIe 2.0
Fiji
Win 7
Monitor mit 1440p

aufkrawall
2016-03-03, 22:51:28
Schön. :)

Wir brauchen:
MPC HC (https://mpc-hc.org/downloads/) (nehmen wir einfach mal x64)
madVR (http://madshi.net/madVR.zip)

MPC HC & madVR installieren, madVR noch in MPC HC als Videorenderer auswählen.
Die an den Post angehängte settings.bin in den madVR-Ordner kopieren.
Ein 1080p 60fps Video bekommt man hier:
http://distribution.bbb3d.renderfarming.net/video/mp4/bbb_sunflower_1080p_60fps_normal.mp4
Das wollen wir auf WQHD hochskalieren.

Durch die settings.bin sollten meine Einstellungen übernommen werden und mit Strg + J sollte uns madVR Folgendes mitteilen, wenn wir 1080p auf WQHD hochskalieren (bitte zur Kontrolle auch einen Screenshot des OSDs posten):
http://abload.de/thumb/madvr7qsa0.png (http://abload.de/image.php?img=madvr7qsa0.png)
Das "NNEDI3" neben Luma ist das Entscheidende, und natürlich, ob madVR während des Abspielens Framedrops feststellt. Dass es zu Anfang zu dem ein oder anderen Drop kommt, ist normal. Es dürfen während des Abspielens aber nicht mehr werden. Gleiches gilt für Glitches.
Falls es doch zu Drops kommt, bitte mal auf NNEDI3 16 neurons in den madVR Optionen für das Profil "> 1.0" einstellen.

Falls das jetzt alles etwas zu schnell ging, kann ich auch gerne eine sehr genaue Anleitung posten. Ich weiß auch nicht, ob das Sharen der Settings über verschiedene Systeme so gut funktioniert.

Edit: Ach so, bitte noch in den Video-Dekoder Einstellungen von MPC HC den Software-Dekoder oder DXVA2 Copyback auswählen.

Gast_samm
2016-03-04, 17:48:55
Danke für die Info! Ich werde frühestens Sonntag, vermutlich erst Dienstag zum Testen kommen. Evt. findet sich ja nochmal jemand, z.B. mit Hawaii - kann doch nicht soo selten sein, dass noch PCIe 2.0 eingesetzt wird, oder? o_O

aufkrawall
2016-03-04, 22:10:34
Dienstag ist auch gut. :)

Aber jeder andere ist auch herzlich eingeladen, das auszuprobieren.

Schnoesel
2016-03-05, 12:22:07
Done: System siehe unten. OS ist Win 10. Monitor ist native 1440p.

http://s24.postimg.org/fzffa8651/image.png

Und jetzt? Framedrops konnte ich nicht beobachten. Deine Anleitung ist im Übrigen sehr rudimentär und nicht gerade hilfreich für jemanden der nicht mit den Programmen arbeitet. Hat mich Zeit gekostet das so hinzubekommen. Wenn du willst das noch mehr dran teilnehmen würde ich die Anleitung überarbeiten.

dargo
2016-03-05, 12:41:54
Ich brauche einen Tester mit
-PCI Express 2.0, also etwa Sandy Bridge- oder Bulldozer-CPU
Warum diese Voraussetzung eigentlich? Jedes PCIe 3.0 Brett sollte sich auch mit PCIe 2.0/1.0 betreiben lassen.

Gast
2016-03-05, 13:48:46
Done: System siehe unten. OS ist Win 10. Monitor ist native 1440p.

http://s24.postimg.org/fzffa8651/image.png

Und jetzt? Framedrops konnte ich nicht beobachten. Deine Anleitung ist im Übrigen sehr rudimentär und nicht gerade hilfreich für jemanden der nicht mit den Programmen arbeitet. Hat mich Zeit gekostet das so hinzubekommen. Wenn du willst das noch mehr dran teilnehmen würde ich die Anleitung überarbeiten.
Und wo ist der Screenshot dazu? Ich sag dann mal, nein es finden immer Framedrops statt.

Gast
2016-03-05, 13:52:05
Ah, man sieht zwar in quote deinen Link aber nicht in deinem originalen Posting! Stelle das mal anders ein oder ist das Browserding?

Gast
2016-03-05, 13:57:52
http://abload.de/img/image.pngctpq3.jpg (http://abload.de/image.php?img=image.pngctpq3.jpg)

fondness
2016-03-05, 14:12:58
Also ich sehe das Bild auch in seinem Beitrag.

Schnoesel
2016-03-05, 14:31:31
Ich habe die forumsinterne Grafik einfügen Funktion mit direct link zum Bild genutzt. Sollte eigentlich der Standard sei und bei jedem sichtbar?!

Gast
2016-03-05, 14:37:32
Ok dann liegt es noScript. Kann der Mod ja dann löschen - wegen Doppelpost.

Gast
2016-03-05, 14:39:28
Jetzt sehe ich es auch mit noScript on.

Ich hätte eine Hawaii da und auch den rest, aber müsste sie erst einbauen. Da samm schon dran ist lasse ich das.

aufkrawall
2016-03-05, 14:43:44
Done: System siehe unten. OS ist Win 10. Monitor ist native 1440p.

http://s24.postimg.org/fzffa8651/image.png

Und jetzt? Framedrops konnte ich nicht beobachten.

Sieht gut aus.
Könntest du mal auf 64 Neurons gehen? Vielleicht schafft Fiji das sogar.
http://abload.de/thumb/nnedi364susdh.png (http://abload.de/image.php?img=nnedi364susdh.png)

Btw: Mit 59,95Hz kannst du keine Videos mit genau 60fps ohne Framedrops abspielen (sagt dir das madVR OSD ja auch). Ich würd mal, z.B. mit CRU, eine Auflösung erstellen, bei der die Refreshrate so nah an 60Hz herankommt wie möglich, ohne diese dabei zu unterschreiten. Ist für den Test hier jetzt aber egal.


Deine Anleitung ist im Übrigen sehr rudimentär und nicht gerade hilfreich für jemanden der nicht mit den Programmen arbeitet. Hat mich Zeit gekostet das so hinzubekommen. Wenn du willst das noch mehr dran teilnehmen würde ich die Anleitung überarbeiten.
Habe ich ja selber geschrieben. Gut, dass es hier nicht einschläft, ich poste später noch eine sehr genaue Anleitung. Ein Test mit Hawaii wär schon schön.

@dargo: Bei Achill hat GPU-Z weiterhin PCIe 3.0 angezeigt, obwohl er im Bios 2.0 eingestellt hatte. Ist das bei dir nicht so?

Screemer
2016-03-05, 14:45:49
Könnte ich heute Nacht bzw. Morgen mal machen. 2500k, Asus p6p67-m und r290. Hoffe ich finde Zeit.

dargo
2016-03-05, 14:54:06
@dargo: Bei Achill hat GPU-Z weiterhin PCIe 3.0 angezeigt, obwohl er im Bios 2.0 eingestellt hatte. Ist das bei dir nicht so?
Klar... angezeigt wird weiterhin PCIe 3.0. Die Bandbreite entspricht aber der von PCIe 2.0.
55073

Und darum gehts doch letztendlich.

Schnoesel
2016-03-05, 15:41:22
Könntest du mal auf 64 Neurons gehen? Vielleicht schafft Fiji das sogar.

http://s16.postimg.org/533ibisf9/image.png

Nach was suchst du eigentlich? Versteh nur Bahnhof. Videodecoding/filtering ist nicht mein Ding.

Gast
2016-03-05, 15:46:23
Klar... angezeigt wird weiterhin PCIe 3.0. Die Bandbreite entspricht aber der von PCIe 2.0.
55073

Und darum gehts doch letztendlich.
Klar angezeigt wird ein vorhandenes Interface mit 3.0 und die Bandbreite von 2.0, guck nochmal genau hin.

3.0 ist nur abwärtskompatibel aber nicht 2.0. Das ist ein Fallbackmodus bei 3.0 hat sich aber das Protokoll geämdert und fallen die Latenzen der PCI-SIG anders aus was die Effizienz erhöht.

Einfach mal einen schalter drücken "ist nicht", da hat aufkrawall völlig recht. Man sollte schon das tasten was er will, nicht was einem gefällt.

aufkrawall
2016-03-05, 15:48:50
http://s16.postimg.org/533ibisf9/image.png

Cool, das schafft meine 980 nicht mehr.


Nach was suchst du eigentlich?
madVR nutzt seit ein paar Versionen eine andere OpenCL-Extension (D3D11 statt 9 Interop), mit der alten gab es mit Radeons leider einen unnötigen, langsamen PCIe Copyback. Dadurch war man mit PCIe 2.0 ziemlich eingeschränkt, was die Datenmenge anging, die sich aus Framegröße und -anzahl ergibt. Du hättest mit deiner Fury X nicht mal 16 neurons geschafft, obwohl die Rechenleistung auch für 64 reicht, wie man ja jetzt sieht.
Das war für mich leider, ähnlich fehlendem prerenderlimit 1, ein ziemlich gewichtiger Grund, keine Radeon zu verwenden.
Mir diesem Thread möchte ich ein für alle Mal klären, dass das wirklich gefixt ist. Dürfte auch den madVR-Entwickler interessieren, dann kann er sich das Einbauen einer Nicht-OpenCL Variante von NNEDI3 in Zukunft vielleicht sparen.

Gast
2016-03-05, 15:54:03
Das war für mich leider, ähnlich fehlendem prerenderlimit 1, ein ziemlich gewichtiger Grund, keine Radeon zu verwenden.
Mir diesem Thread möchte ich ein für alle Mal klären, dass das wirklich gefixt ist. Dürfte auch den madVR-Entwickler interessieren, dann kann er sich das Einbauen einer Nicht-OpenCL Variante von NNEDI3 in Zukunft vielleicht sparen.
Das wäre interessant...anscheinend arbeitet AMD an einem Gleichstand, bei bestimmten Videomaterial gabs auch Probleme, Stocker und Hacker, die jetzt gefixt zu sein scheinen. Ich hatte denen selbst schon mal einen Bericht das Thema betreffend per Forumals zugeschickt. Jedenfalls war madVR auf Hawaii ein Krampf, wobeu man klar sagen muss das wenn man zuviel will, das Programm die Hardware schnell überfordern kann. Schreibt der Entwickler ja selbst.

aufkrawall
2016-03-05, 20:10:51
Genaue Anleitung:
Wir wollen herausfinden, ob ein unnötiger Copyback des Video-Frames über PCI Express stattfindet, wenn der Bild-Scaler NNEDI3 genutzt wird, der über OpenCL läuft. Dazu gehen wir wie folgt vor:

1.)
MPC HC downloaden und installieren:
https://binaries.mpc-hc.org/MPC%20HomeCinema%20-%20x64/MPC-HC_v1.7.10_x64/MPC-HC.1.7.10.x64.exe

2.) madVR downloaden:
http://madshi.net/madVR.zip
und in einen Ordner entpacken, z.B. in ein dafür erstelltes Unterverzeichnis im Ordner von MPC HC.

3.) madVR mittels der install.bat registrieren, indem man es mit Adminrechten ausführt. Den madVR-Ordner nicht löschen und auch nicht mehr verschieben.

4.) MPC HC starten, das Menü Ansicht und dann Optionen auswählen.

5.) Unter Wiedergabe das Untermenü Ausgabe auswählen. Dort sollte in dem Menü Video-Renderer der Eintrag madVR auftauchen. Auf OK/Übernehmen klicken und den Player neu starten.

6.) Nun das 1080p 60fps Video (Download (http://distribution.bbb3d.renderfarming.net/video/mp4/bbb_sunflower_1080p_60fps_normal.mp4)) mit MPC HC öffnen (Menü Datei -> Mediendatei öffnen) und ggf. das Abspielen pausieren, falls das nervt.

(Ich hab jetzt mal auf Bilder für den MPC HC verzichtet, da das Programm recht übersichtlich und einfach zu verstehen ist.)

7.) Im Systemtray taucht nun das madVR-Symbol auf, ein Doppelklick darauf öffnet die madVR-Optionen. Erstmal definieren wir das Anzeigegerät als Monitor:
http://abload.de/thumb/device72shj.png (http://abload.de/image.php?img=device72shj.png)

8.) Wir wählen auch ansonsten praxisnahe Settings aus: In dem Menü-Baum scaling algorithms wählen wir für chroma upscaling und image upscaling Jinc sowie die Checkboxes sigmoidal light + anti-ringing Filter aus:
http://abload.de/thumb/chromajhsb9.png (http://abload.de/image.php?img=chromajhsb9.png) http://abload.de/thumb/imageidk4t.png (http://abload.de/image.php?img=imageidk4t.png)
(image upscaling ist für den Test zwar jetzt egal, aber wir tun mal so, als ob wir in der Realität wären)

9.) In dem Menü image doubling (immer noch in dem Baum scaling algorithms) machen wir einen Haken bei double luma resolution rein, sind mit der Vorauswahl NNEDI3, 16 neurons zufrieden und wählen noch die runde checkbox always - 2x supersampling aus und klicken apply:
http://abload.de/thumb/nnedi3rgxf0.png (http://abload.de/image.php?img=nnedi3rgxf0.png)
Damit wird schon bei der kleinsten Bildvergrößerung das gesamte Bild pro Achse verdoppelt und ggf. runterskaliert, falls die Zielauflösung niedriger ist.
Für die Realität eine idiotische Einstellung, aber wir wollen ja nur wissen, ob die Performance stimmt bzw. ob die PCIe-Bandbreite limitiert, was bei einem Copyback des Video-frames über PCIe 2.0 der Fall wäre, wenn 4k (die Auflösung wurde ja von NNEDI3 pro achse verdoppelt, was bei 1080p dann 4k ergibt) 60fps der Fall ist.

10.) Für image downscaling wählen wir die realistische Einstellung bicubic sharpness: 150 mit beiden Checkboxen aktiviert:
http://abload.de/thumb/downscaling4hyq5.png (http://abload.de/image.php?img=downscaling4hyq5.png)

11.) Wir öffnen den Baum rendering und deaktivieren die Checkbox enable automatic fullscreen exclusive mode:
http://abload.de/thumb/renderingdfy1w.png (http://abload.de/image.php?img=renderingdfy1w.png)
Ab Windows 8 sollte dieser Modus kaum noch nötig sein.

12.) Immer noch unter dem Menü-Baum rendering wählen wir das Menü smooth motion, aktivieren die Option und wählen die Checkbox "always":
http://abload.de/thumb/smoothmotion4ysjr.png (http://abload.de/image.php?img=smoothmotion4ysjr.png)
Die Option sorgt dafür, dass das Playback absolut ruckelfrei sein sollte, sofern die Refreshrate höher als die fps-Rate des Videos ist, auf Kosten von geringen Ghostings.

13.) Wir gehen in das Menü trade quality for performance und nehmen alle Haken raus:
http://abload.de/thumb/tradefazj1.png (http://abload.de/image.php?img=tradefazj1.png)

14.) Nun beenden wir MPC HC und öffnen das Video erneut. Wir lassen es abspielen und gehen mit dem Player in den Vollbildmodus (z.B. F11 drücken).

15.) mit Strg + J lassen wir uns die madVR-Statistiken einblenden. Diese sollten so aussehen:
http://abload.de/thumb/screenshotnhpcm.png (http://abload.de/image.php?img=screenshotnhpcm.png)
Um die auf Bild festzuhalten, einfach die Druck-Taste drücken und das Bild bei Paint einfügen.

Es sollten während des Abspielens mit einer Hawaii-GPU keine Framedrops auftreten, eine 980 schafft auch NNEDI3 mit 32 neurons (was wesentlich höhere Anforderungen an die GPU stellt als 16 neurons). Schnoesels Fiji hat ja schon 64 geschafft.

aufkrawall
2016-03-06, 19:28:01
Mag noch jemand?

samm
2016-03-06, 20:09:53
Es gehen nicht mehr alle Bilder in der detaillierten Anleitung, aber Text ist genügend ausführlich :)

Für 64 Neurons reicht es bei mir nicht (auch mit DX11 und excl. Fullscreen getestet, Screenshots hier ohne excl. fullscreen und mit Default DX9):

16 Neurons:
http://abload.de/thumb/16neuronsufuok.jpg (http://abload.de/image.php?img=16neuronsufuok.jpg)

32 Neurons:
http://abload.de/thumb/32neuronsrcus6.jpg (http://abload.de/image.php?img=32neuronsrcus6.jpg)

64 Neurons:
http://abload.de/thumb/64neuronsgxuip.jpg (http://abload.de/image.php?img=64neuronsgxuip.jpg)

aufkrawall
2016-03-06, 20:16:17
Ahh, super. Thx!
Füllen sich die Queues mit 32 neurons manchmal noch etwas?

Müsste so aber gut sein. Würd die PCIe-Bandbreite limitieren, sollte es sofort dropped frames hageln.
Edit: Manchmal werden die Queues auch falsch angezeigt. Kann gut sein, dass die voll sind.

samm
2016-03-06, 20:48:16
Füllen sich die Queues mit 32 neurons manchmal noch etwas?Sie sind im Schnitt etwa so wie im Screenshot oder etwas höher - habe aber zwischendrin bei der Render-Queue auch schon sowas wie 0-3 / 8 gesehen, was dann ja wohl sowas wie "kurz vor drop" heisst...

aufkrawall
2016-03-06, 21:13:10
Kommt drauf an. Was passiert, wenn du unter processing, artifact removal den Deband-Filter auf high stellst?

samm
2016-03-06, 21:19:06
Dann droppen fast jede Sekunde ein paar Frames, average rendering ist > 14.5

aufkrawall
2016-03-06, 21:24:43
Könnte trotzdem hinkommen, die 980 droppt auch ohne Deband bei 32 neurons schon Frames mit ansonsten vergleichbaren Einstellungen.
Im Vergleich zur 980 Ti sieht die Fury dann aber wohl recht schlecht aus.

Na ja, nicht so schlimm. NNEDI3 ist wichtig für Quellen mit niedriger Auflösung, was nicht so viel Leistung kostet.

Nochmal thx fürs testen. :)

Möchte es irgendjemand noch mit Hawaii testen? Den hatten wir nämlich immer noch nicht.

Screemer
2016-03-07, 18:10:16
bin endlich dazu gekommen.

xfx 290 dd black
2600k@4,4Ghz
p8p67-m pro
16GB DDR3 1333

http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=55133&stc=1&d=1457370582

allerdings kommt mir die zeile scale komisch vor. hab auch nen 1440p monitor wie krawall.

aufkrawall
2016-03-07, 18:32:28
In der Tat, du hast das Video nicht im borderless fullscreen Modus laufen.

Screemer
2016-03-07, 22:57:07
das ist richtig ;( hier noch mal boarderless

samm
2016-03-07, 23:05:03
Könnte trotzdem hinkommen, die 980 droppt auch ohne Deband bei 32 neurons schon Frames mit ansonsten vergleichbaren Einstellungen.
Im Vergleich zur 980 Ti sieht die Fury dann aber wohl recht schlecht aus.Kann das evt. OS- oder CPU-abhängig sein? Bei Schnoesel läuft es ja auch mit 64 neurons mit schön voller Queue auf der Fury X, und so viel leistungsfähiger als die Fury sollte die ja nicht sein.

Was wäre ein Vergleichswert mit 980 Ti?

Nochmal thx fürs testen. :)NP! Endlich ein Grund, mich bisschen mehr mit MadVR auseinanderzusetzen ;)

aufkrawall
2016-03-07, 23:06:23
das ist richtig ;( hier noch mal boarderless
Kannst du mal bei MPC HC in den Optionen bei Interne Filter Video-Decoder... Die Hardware-Acceleration deaktivieren, indem du None auswählst und den Player neu startest?
Wär sonst ungut, wenn das nichts bringt.

Kann das evt. OS- oder CPU-abhängig sein? Bei Schnoesel läuft es ja auch mit 64 neurons mit schön voller Queue auf der Fury X, und so viel leistungsfähiger als die Fury sollte die ja nicht sein.

Was wäre ein Vergleichswert mit 980 Ti?

Ich weiß es nicht. :(
Edit: Bei dem zweiten Versuch mit der genauen Anleitung sind die anderen Einstellungen anders. :)

Screemer
2016-03-08, 13:14:49
hier noch mal ohne hwa.

aufkrawall
2016-03-08, 13:59:16
Thx!
Jetzt gibt es wohl zwei Möglichkeiten: Gleichzeitig DXVA Decoding scheint ihm nicht zu schmecken oder der Videoprozessor auf der Karte ist einfach zu lahm für 1080p60 bei diesem Video. :freak:
Edit: Es ist der Videodecoder, die Upload-Queue füllt sich ja gar nicht.

Aber das Copyback-Problem ist offenbar gefixt. Sehr gut, nochmal Danke an alle Tester!

Screemer
2016-03-08, 22:18:58
kein Problem.

aufkrawall
2016-03-22, 21:47:55
Hab nun selbst eine 390 da, funzt tadellos. Man muss allerdings den Low Level-Zugriff von Afterburner nutzen, wenn man diesen aktiv hat. Aber nicht weiter tragisch, scheint keine negativen Effekte zu haben.
Übrigens schafft der Videoprozessor von Hawaii hier auch das Big Buck Bunny 1080p 60fps Video mit DXVA2 copyback. Nur 4k kann er nicht, aber Kepler ist da auch zu langsam für höhere Bitraten.

Die 390 scheint für madVR auf ziemlich ähnlichem Level zu sein wie die 980 OC, schon ganz nett. Mit -100mV und manueller Lüfterkurve auch akustisch angenehm mit der MSI Gaming.