Cat 15.7 und DxClTest [Archiv]

aufkrawall

2015-07-11, 00:56:41

Ok, du hast PCIe 3.0. Ich kenne keine anderen Radeon-Vergleichszahlen, aber damit sollte NNEDI3 Scaling per OpenCL halbwegs nutzbar sein. Mit PCIe 2.0 wär es wohl weiterhin ziemlich wackelig.

Der Benchmark ermittelt, wie viele fps zwischen OpenCL und D3D geteilt werden können. AMD macht da dummerweise einen Copyback über PCIe und den mit Treibern nach 13.12 auch noch unbrauchbar langsam.
Jetzt geht das vielleicht wieder besser.

Mit der 980 hab ich 1200fps, weil der NV-Treiber keinen Copyback macht.

Gast

2015-07-11, 01:21:42

Guardians of the Galaxy?
:up:

Wie viele fps schafft ihr bei dem Benchmark?
Ich hab weniger, bzw. 2 Werte, 7950 und 860k, erst 147.374 dann 53.3174 oder wie lange muss man den Test laufen lassen?

Achill

2015-07-11, 01:26:35

~74 fps (290x Tri-X) ... die Karte scheint nichts zu tun, die Temp. steigt auch nach ein paar Minuten nicht - soll das so sein xD

anddill

2015-07-11, 01:29:24

101fps auf Fury in AMD-Monokultur. PCIe 2.

aufkrawall

2015-07-11, 01:31:55

~74 fps (290x Tri-X) ... die Karte scheint nichts zu tun, die Temp. steigt auch nach ein paar Minuten nicht - soll das so sein xD
Ist schon etwas wenig, anddill ist trotz PCIe2.0 ja ein Drittel schneller.

anddill, könntest du es evtl. in den Bench-Bereich splitten? Hat etwas mehr Resonanz gefunden als ich dachte.

Achill

2015-07-11, 01:34:58

...

Der Benchmark ermittelt, wie viele fps zwischen OpenCL und D3D geteilt werden können. AMD macht da dummerweise einen Copyback über PCIe und den mit Treibern nach 13.12 auch noch unbrauchbar langsam.
Jetzt geht das vielleicht wieder besser.

...

Wäre für D3D nicht DirectCompute die 'bessere' Wahl da gleiches Öko-System?

aufkrawall

2015-07-11, 01:38:44

Ja, aber damit läuft es seltsamerweise langsamer. Sowohl madshi's als auch Zachs' Implementierung zeigen dieses Verhalten.
Kannst du mit MPDN und seinen Extensions vergleichen, der bietet DirectCompute und OpenCL für NNEDI3 an:
http://forum.doom9.org/showthread.php?t=171120
Kann natürlich ein sinnvoller Notnagel sein, Fiji hat ja Compute-Leistung bis zum Abwinken.

Seth

2015-07-11, 02:50:48

192,xxx fps (R9 390 / PCI-E 3.0 x16)

Lightning

2015-07-11, 08:28:46

102 fps @ PCIe 2.0 mit R9 280. Bestätigt also anddills Wert.

grobi

2015-07-11, 09:00:33

ca 36fps Radeon 290 1050\1350 @PCIe 2.0

Da stimmt doch was nicht.

tdon

2015-07-11, 10:29:32

Die AMD Werte sind äußerst mies. Meine integrierte Intel HD4600 kommt auf 480 fps.

Troyan

2015-07-11, 10:36:36

Meine GTX980TI@1500MHz kommt auf 1400FPS und PCIe 3.0 16x

grobi

2015-07-11, 10:39:13

Ich habe sonst keine Performanceprobleme.

Achill

2015-07-11, 11:24:55

Ich habe sonst keine Performanceprobleme.

Ich habe auch keinen Top-Wert und auch keine Perf.Probleme ... :D

@aufkrawall, ich habe den MPDN inkl. Extensions installiert. Dann mein Desktop auf virtuelle 3360x2100 gestellt und Big Bad Bunny in 1080p gestartet. Mit NNEDI3 (DirectCompute?) ist Fullscreen dann butter weich gewesen. Stelle ich auf OpenCL NNEDI3 wird es dann zu ruckel Orgie ... passt das so von der Beobachtung?

Dann wäre für die r290 (AMD generell?) die DirectCompute Variante die bessere Wahl.

aufkrawall

2015-07-11, 14:06:07

Ja, das passt von der Beobachtung.
Allerdings frage ich mich gerade, warum die maximale Qualitätseinstellungs-Option im MPDN hier nicht mehr ruckelfrei läuft.

Wie viele Neuronen kannst du nutzen?
Auf der 980 kann ich auch mit DirectCompute 64 Neuronen bei 1080p30 nutzen.
Allerdings ist die GPU-Auslastung ~2 Prozentpunkte höher als mit madVR OpenCL, wo ich noch bessere Chroma-Up- und Bild-Downscaling (NNEDI3 verdoppelt immer beide Achsen) sowie gutes Postprocessing und Frameblending aktiviert habe.

Die GTX 780 Ti meines Bruders schafft übrigens 1600fps beim Benchmark. :D

Achill

2015-07-11, 15:10:41

Bei DirectCompute gehen 64 Neuronen bei einen 1080p30 Film auf 3360x2100 (VSR). Ab 128 Neuronen gibt es Frame-Drops laut Statistik von MPDN.

Die GPU-Auslastung liegt im Mittel bei rund 41% ... es schwankt aber bei GPU-Z - mit OpenCL sind es durchgängig 100%.

aufkrawall

2015-07-11, 15:23:10

Kannst du mal auf den Takt mit DirectCompute achten? Die GPU-Auslastung konnte in manchen Situationen oder von manchen Tools nicht richtig ausgelesen werden bei Radeons.

Achill

2015-07-11, 15:38:24

Takt ist bei 1011 Mhz, Temp. geht nicht über 71°C - auch der Verbrauch ist nicht max ... das spricht für die 41% Auslastung.

OT: Finde den Player gut, mir ist aber ein Upsampling der Framerate wichtiger, darum bevorzuge ich SmoothVideo Project (http://www.svp-team.com/) - oder geht das auch mit einer Extension vom MPDN?

aufkrawall

2015-07-11, 15:51:16

Mit SVP bin ich überfragt. Ich war nie so wirklich zufrieden mit dem Ergebnis, weshalb ich es nie weiter benutzt hatte.
Kann aber sein, dass es mit MPDN geht. Es geht ja auch mit madVR und MPDN setzt auch auf DirectShow-Filter.

Hm, wenn der Takt konstant nur knapp unter dem Maximalwert liegt, gibt es wahrscheinlich nicht mehr so viele Reserven. Mit fps-Limiter ging der in Spielen viel weiter runter.

Achill

2015-07-11, 17:12:54

Neuroen | Avg. Takt in Mhz | Avg. Load in % | Temp in °C
16 | 865 | 49 | 66
32 | 927 | 55 | 71
64 | 1021 | 71 | 75
---
128 | 1040 | 100 | 78 (mit Frame Drops)
=> Übertakten auf 1200/1500 bringt nicht wirklich was - ggf. limitiert hier etwas anderes...

aufkrawall

2015-07-11, 17:22:31

Ok, thx. Wenn du noch Bock drauf hast, kannst du ja mal testen, ob du mit 64 Neurons noch andere Settings im MPDN aufdrehen kannst.
Jinc mit 16 Taps (funktioniert anders als in madVR) + AR-Filter für alle anderen Skalierungsfälle etwa, oder das Aktivieren von Fluid Motion, eine Script Chain mit Deband und Sharpening-Shader (AdaptiveSharpen könnte man wohl einfach als hlsl laden).
Ich sage allerdings nicht, dass es Sinn macht, 1080p mit NNEDI3 aufzupumpen, sofern man keinen 4k-Monitor hat. ;)

anddill

2015-07-11, 18:06:29

Falls es von Interesse ist, auf meiner APU läuft der Test mit 162fps

aufkrawall

2015-07-11, 18:19:48

Das ist von Interesse.
Wieso läuft es langsamer als PCIe 3.0?

Wahrscheinlich aus dem gleichen Grund, warum gleiche PCIe-Versionen bei Usern unterschiedlich schnell laufen: Irgendwas macht der Treiber gehörig falsch. :freak:

anddill

2015-07-11, 18:23:58

Ich dachte halt es sollte ohne PCIe schneller laufen. Tut es auch, aber anscheinend der Sprung erscheint zu klein, ohne daß da noch was anderes begrenzt.

gedi

2015-07-11, 18:24:09

Hier schließt sich der Test sofort. In GPU-Z wird analog dazu angezeigt, dass bei mir kein Compute verfügbar sei - o_O. Ich installiere jetzt doch mal den 353.49 Treiber ....

aufkrawall

2015-07-11, 18:31:58

Du musst nach Windows 10 Build-Updates den Nvidia-Treiber neu installieren. Sonst fehlt alles, außer der Core-Treiber.
Danach erzählt GPU-Z zwar weiterhin, Cuda würde fehlen, das stimmt aber nicht.

Wo wir gerade bei Cuda sind: Ich kann mir gut vorstellen, dass Nvidia durch die Cuda-Integration in Spielen (PhysX) großen Wert auf eine hohe Interop-Performance des Treibers gelegt hat. OpenCL ist ja bei NV nur ein Cuda-Wrapper.

gedi

2015-07-11, 18:35:49

Bereits geschehen. 240.6FPS bei 1G Takt. PhysX war allerdings aktiviert nur OpenCL ebend nicht.

aufkrawall

2015-07-11, 18:41:44

Bei dir klemmt aber immer noch gehörig etwas, du musst locker über 1000fps kommen.

gedi

2015-07-11, 18:54:32

Mehr ist es aber nicht. Vielleicht liegt es am RTSS (welches in dem Bench nur Mist ausspuckt), allerdings mache ich mir darüber auch keine Gedanken, da der Rest soweit problemlos läuft.

aufkrawall

2015-07-11, 18:58:13

Der Bench ermittelt seine fps selber in der Titelleiste. Keine OSDs injecten etc...

gedi

2015-07-11, 19:11:50

Am RTSS lag es auch nicht. Ich habe aus Verdacht mal den Kompatibilitätsmodus aktiviert und vergessen ihn wieder zu deaktivieren. Nun sind es ~1570FPS.

bleikrone

2015-07-11, 19:15:06

82,5 fps

5850 XFX BE

EDIT: PCIe 2.0

-/\-CruNcher-/\-

2015-07-11, 19:28:06

Am RTSS lag es auch nicht. Ich habe aus Verdacht mal den Kompatibilitätsmodus aktiviert und vergessen ihn wieder zu deaktivieren. Nun sind es ~1570FPS.

Also das ist quer normalerweise würdest du mit dem Kompatibilitätsmodus einen slow down haben aber nicht ohne, was ich mir bei den meisten Gamern besser vorstellen kann da die ja immernoch glauben DWM ist böhse und muss deaktiviert werden koste es was es wolle ;)

Mr. Lolman

2015-07-11, 19:36:39

Hier ein kleiner Vergleichstest von verschiedenen Upscaling Methoden.

http://www.infognition.com/articles/video_resize_shootout.html

Ich schwör ja auf eine Kombination zwischen Lancos, xsharpen und Warpsharp mittels ffdshow + Kantenanhebung@1 im CCC. Damit bin ich qualitativ irgendwo zwischen Lancos3+sharp und VideoEnhancer, während harte Kanten (dank Warpsharp) größtenteils auf NNEDI3-Niveau sind. Am Ende wird (je nach Video) noch sanftes mplayer Rauschen drüber gelegt, was a) ein bisschen einen Filmkorneindruck vermittelt, b) den Informationsgehalt gefühlt erhöht (schließlich gibts jetzt Pixel in dem Video, welche nur 1/4 der Originalpixelgröße haben und seiens nur Rauschpixel) und außerdem wird auch das ein oder andere Kompressionsartefakt überdeckt:

Raff

2015-07-11, 20:08:15

1.174,5 Fps

Phenom II X6 @ 4 GHz (NB: 2,94 GHz), AMD 790FX, PCI-Express 2.0 @ 130 MHz, GTX 980 @ 1.500/4.001 MHz; Windows 8.1 x64, Geforce 353.49 Hotfix

Ein Unterbau biblischen Alters, sieht aber angesichts aufkrawalls 1.200 Fps normal aus. :)

MfG,
Raff

grobi

2015-07-11, 20:25:54

Kann mir denn keiner meine 36FPS erklären?

-/\-CruNcher-/\-

2015-07-11, 20:27:12

Geforce GTX 970
353.30 WHQL WDDM 1.1

http://abload.de/thumb/1080wfgtx9703szm0.png (http://abload.de/image.php?img=1080wfgtx9703szm0.png) http://abload.de/thumb/1080wgtx970zqxno.png (http://abload.de/image.php?img=1080wgtx970zqxno.png)

@grobi
OS ?

grobi

2015-07-11, 20:34:42

@-/\-CruNcher-/\-

Ich nutze Win10 in der neusten Build mit dem Catalyst 15.7 auf einer Radeon 290

aufkrawall

2015-07-11, 20:44:44

Hier ein kleiner Vergleichstest von verschiedenen Upscaling Methoden.

http://www.infognition.com/articles/video_resize_shootout.html

Allerdings NNEDI3 nur mit 32 Neuronen, nicht 64. Ob die anderen Settings mit madVR vergleichbar sind, weiß ich nicht.

Ich schwör ja auf eine Kombination zwischen Lancos, xsharpen und Warpsharp mittels ffdshow + Kantenanhebung@1 im CCC. Damit bin ich qualitativ irgendwo zwischen Lancos3+sharp und VideoEnhancer, während harte Kanten (dank Warpsharp) größtenteils auf NNEDI3-Niveau sind. Am Ende wird (je nach Video) noch sanftes mplayer Rauschen drüber gelegt, was a) ein bisschen einen Filmkorneindruck vermittelt, b) den Informationsgehalt gefühlt erhöht (schließlich gibts jetzt Pixel in dem Video, welche nur 1/4 der Originalpixelgröße haben und seiens nur Rauschpixel) und außerdem wird auch das ein oder andere Kompressionsartefakt überdeckt:
Lanczos geht imho gar nicht wegen des Ringings.
Bei mir sieht das so aus mit NNEDI3 64 und Adaptivesharpen 0.2 (eine Breitenreihe hat Paint geklaut):
http://abload.de/thumb/avneuo5r65.png (http://abload.de/image.php?img=avneuo5r65.png)
Ich würde sagen, bei dir erzeugt das Ringing einfach zufällig einen optischen Eindruck, der dem Original etwas näher kommt. Bei geraderen Strukturen dürfte es dann wesentlich bröseliger aussehen als es sollte.

grobi, niemand weiß das. Der Fehler liegt nur mit ziemlicher Sicherheit bei AMD.

-/\-CruNcher-/\-

2015-07-11, 20:56:07

Allerdings NNEDI3 nur mit 32 Neuronen, nicht 64. Ob die anderen Settings mit madVR vergleichbar sind, weiß ich nicht.

Lanczos geht imho gar nicht wegen des Ringings.
Bei mir sieht das so aus mit NNEDI3 64 und Adaptivesharpen 0.2 (eine Breitenreihe hat Paint geklaut):
http://abload.de/thumb/avneuo5r65.png (http://abload.de/image.php?img=avneuo5r65.png)
Ich würde sagen, bei dir erzeugt das Ringing einfach zufällig einen optischen Eindruck, der dem Original etwas näher kommt. Bei geraderen Strukturen dürfte es dann wesentlich bröseliger aussehen als es sollte.

grobi, niemand weiß das. Der Fehler liegt nur mit ziemlicher Sicherheit bei AMD.

Viel besser bei Lolman seinem Ergebnis sieht man zu sehr Warpsharp rumfuschen ;)

Vor allem bei so vielen Passes ist das ziemlich ineffizient

aufkrawall

2015-07-11, 21:05:01

Ist übrigens NNEDI3 + Jinc, der Skalier-Faktor ist größer als 2x pro Achse. Eine weitere Vervierfachung per NNEDI3 und dann runterskalieren (etwa mit Catmull-Rom) sieht aber kaum noch erahnenswert besser aus.
Ja, Lolmans Bild wirkt wesentlich verrauschter als das Original.

Ich mag bei NNEDI3, dass es wirklich überhaupt kein Aliasing und Ringing einführt und dabei Linien am besten wiederherstellt. Das macht es bisher ziemlich einzigartig. Es gibt mit genügend Neurons damit eigentlich keine Artefakte, die man irgendwie ohne Vergleich sicher bemerken könnte.

-/\-CruNcher-/\-

2015-07-11, 21:22:47

Persönlich find ich ja Super-XBR sehr spannend :)

hat was von SmartEdge algorithmus von Dmitry seinem Ex kollegen Lukin vom MSU Graphics Lab den haben sie zusammen in kooperation mit dem SAIT (Samsungs R&D) entwickelt

http://audio.rightmark.org/lukin/graphics/resampling.htm

aufkrawall

2015-07-11, 21:47:38

Wie du ja bestimmt schon gesehen hast, hab ich da auch schon meinen Senf zu gegeben:
http://forum.doom9.org/showpost.php?p=1729687&postcount=31646

Ich hab hier an anderer Stelle mal geschrieben, dass ich es mir gut als Monitor-Scaler vorstellen könnte.
Nicht so rechenintensiv und je nach Einstellung deutlich schärfer als NNEDI3 und hat wohl prinzipiell weniger Schwächen mit dem Rekonstruieren natürlicher Strukturen. Probleme bei Letzterem sind mir mit 64 Neuronen allerdings auch mit NNEDI3 eigentlich noch nie aufgefallen. Deshalb, weil Linien klarer sind es keine Probleme mit Ringing hat, bevorzuge ich es immer noch für Video, obwohl es zigfach teurer ist. Mit GM204 nicht wirklich ein Problem.

Mr. Lolman

2015-07-11, 21:49:22

Ich würde sagen, bei dir erzeugt das Ringing einfach zufällig einen optischen Eindruck, der dem Original etwas näher kommt. Bei geraderen Strukturen dürfte es dann wesentlich bröseliger aussehen als es sollte.

Hm, dann schlag mal ein anderes Bild aus dem von mir open geposteten Vergleich vor.

aufkrawall

2015-07-11, 21:55:31

Ich hatte mir zufällig smiths 1 als erstes angesehen.
Hier fällt die Artefaktfreiheit von NNEDI3 sogar noch viel mehr auf.

Mr. Lolman

2015-07-11, 22:04:31

Ich hatte mir zufällig smiths 1 als erstes angesehen.
Hier fällt die Artefaktfreiheit von NNEDI3 sogar noch viel mehr auf.

smiths1 sieht bei mir so aus:

-/\-CruNcher-/\-

2015-07-11, 22:08:54

sorry aber da sieht man warpsharps typischen fractal like verzerungseffekt (repaint) zu deutlich, das sieht einfach nur künstlich aus

aufkrawall

2015-07-11, 22:09:14

Ja.
Nicht bös gemeint: Voller Ringing und wie ein Ölgemälde.

Mr. Lolman

2015-07-11, 22:19:37

Und nnedi3 sieht hier so toll aus? Nach dem YPSNR ist Lanczos+sharpen hier weit vorne. Und xsharpen+warpsharp holt da noch ein bisschen was raus.

Ein Ölgemälde wirds eher mit nnedi3:

aufkrawall

2015-07-11, 22:44:36

Nicht, wenn mans richtig macht:
http://abload.de/thumb/paint2cqy2g.png (http://abload.de/image.php?img=paint2cqy2g.png)

Edit: Zuätzlich auch noch Quadrupling mit NNEDI3 64 bringt hier sogar etwas, die Beine des Pferdes im Hintergrund sind besser rekonstruiert:
http://abload.de/thumb/qd26lsd0.png (http://abload.de/image.php?img=qd26lsd0.png)
Edit 2: super-xbr 75 ist fürs Quadrupling aber auch vollkommen ausreichend.

Die Bilder vom Video Enhancer dort finde ich auch relativ unangenehm.

Lard

2015-07-12, 00:34:46

super-xbr 100/Jinc AR/AdaptiveSharpen 0.5
http://abload.de/thumb/smithsw0utw.png (http://abload.de/image.php?img=smithsw0utw.png)

aufkrawall

2015-07-12, 00:54:28

Heftig sind halt die Linien oben, nur NNEDI3 rekonstruiert die ohne neues Aliasing und Ringing. :)
Habs auch schon mit super-xbr verglichen. ;)
http://forum.doom9.org/showpost.php?p=1729808&postcount=31678

-/\-CruNcher-/\-

2015-07-12, 07:48:21

http://www.resampling.narod.ru/

scheint momentan am interessantesten von seinen Ergebnisen auch wie Triticals NNEDI3 Neuronal Trainiert :)

Das Ergebnis ist schon irre :)

NNEDI3 256

http://madvr.com/doom9/clown/clownNNEDI3_256.png

Neural Spline 2

http://resampling.narod.ru/image/Clown_neural-spline_x4.png

Da wird die Performance wohl auch noch dementsprechend weit von NNEDI3 entfernt sein und wohl noch jahre von Super XBR ;)

Mr. Lolman

2015-07-12, 09:19:11

Gerade bei dem Besiepiel find ich NNEDI3 schöner. Zwar nicht so scharf, dafür aber natürlicher. Außerdem sind die Stromleistungen nicht so stufig.

Bezüglich NNEDI3: Kann mir jemand ein avisynth script für (gut eingestelltes) NNEDI3 geben? Ich würds ja doch gern einmal in Kombination mit ffdshow ausprobieren. :)

-/\-CruNcher-/\-

2015-07-12, 10:16:52

Währe interessant sich mal einen Samsung UHD beim Upscaling anzuschauen, gut möglich das Samsung momentan Smart Edge 2 nutzt beim Old content upscaling (in einer FPGA solution) ;)

w0mbat

2015-07-12, 13:00:45

76 FPS

HD 7870 @ 1100/1300 @ PCIe 2.0

Lard

2015-07-12, 17:33:04

HD 7970 - PCI-E 2.0:
300/150 MHz 86 FPS (PowerPlay aus)
1200/1700 MHz 100 FPS

aufkrawall

2015-07-12, 22:39:54

Bezüglich NNEDI3: Kann mir jemand ein avisynth script für (gut eingestelltes) NNEDI3 geben? Ich würds ja doch gern einmal in Kombination mit ffdshow ausprobieren. :)
Ich habe es nie mit avs genutzt, die CPU ist zu langsam für NNEDI3 in Echtzeit. Notfalls capture einfach einen Screenshot mit Snipping Tool aus dem madVR Videobild. Wenn du prescale Filter mit Avisynth nutzt, kannst du auch einfach das Script im Player mit madVR öffnen.

Mr. Lolman

2015-07-13, 09:03:45

Ich habe es nie mit avs genutzt, die CPU ist zu langsam für NNEDI3 in Echtzeit.

Ich habs mittlerweile am Laufen (nnedi3ocl) - und es ist tatsächlich der mit Abstand beste Upscaler der mir jemals unter die Finger gekommen ist. :biggrin:

Nur kommen jetzt andere Begehrlichkeiten dazu: Deinterlacing. Mein Fernsehbild wurde bisher immer von yadif deinterlaced (bzw intern unter berücksichtigung des interlacing flags mit lanzcos upgescaled und erst dann deinterlaced) Damit aber nnedi3x_rpow2 ordentlich funktioniert muss das Material progressiv sein. Mein TV-Bild ist jedoch interlaced und soll deinterlaced und auch upgescaled werden.

Nun dachte sich der Lolli folgendes: Sobald ich 576 Zeilen hab, kommt yadifmod + nnedi3ocl als Deinterlacer zum Einsatz. Wenn das Bild weniger als 1280 Spalten hat nehm ich nochmal nnedi3ocl und scale das Bild mit rpow2 hoch (das fertige TV-Bild hat dann 1440x1152 Pixel)

So weit so gut. Problem ist nur:

a) Ich kann momentan nur über die Zeilenanzahl steuern ob das Bild deinterlaced werden soll (kennt jemand ein avisynthscript mit dem ich checken kann, ob mein Sourcematerial interlaced ist?)
b) 2x den nnedi3 Filter auf Echtzeitmaterial anzuwenden geht auf meiner 290X nur mehr grenzwertig. Ich kann maximal noch ein leichtes Rauschen (aber kein mplayer, das ist schon zu langsam), und evtl noch xsharpen einsetzen ohne Framelosses. An zusätzliches Warpsharp und/oder Entrauschungsfilter ist hier nicht mehr zu denken. Gibts da evtl noch bessere Möglichkeiten für den Echtzeiteinsatz?

THEaaron

2015-07-13, 12:50:40

115FPS mit meiner 280X.

Achill

2015-07-13, 12:56:44

HD 7970 - PCI-E 2.0:
300/150 MHz 86 FPS (PowerPlay aus)
1200/1700 MHz 100 FPS

Das war der fehlende Tip, mit "PowerPlay aus" mittels RadeonPro sind es bei mir dann auch 99 FPS ... :)

=> Kein Problem mit PCIe 2.0

aufkrawall

2015-07-13, 14:10:28

b) 2x den nnedi3 Filter auf Echtzeitmaterial anzuwenden geht auf meiner 290X nur mehr grenzwertig. Ich kann maximal noch ein leichtes Rauschen (aber kein mplayer, das ist schon zu langsam), und evtl noch xsharpen einsetzen ohne Framelosses. An zusätzliches Warpsharp und/oder Entrauschungsfilter ist hier nicht mehr zu denken. Gibts da evtl noch bessere Möglichkeiten für den Echtzeiteinsatz?
Mit der SM5.0 Extension für MPDN kannst du verschiedene Optimierungs-Pfade wählen. Prefer Vector läuft hier auf Maxwell wesentlich schneller als Prefer Scalar.
Ansonsten versuche ich madshi schon einige Zeit zu beschwatzen, NNEDI3 neben OpenCL noch mit SM5.0 oder DirectCompute als Alternative für Radeon-User einzubauen. Er hat schon durchblicken lassen, dass er das irgendwann machen möchte.

Ich hatte meine Bilder ja wie gesagt mit AdaptiveSharpen nachgeschärft (post-resize):
http://forum.doom9.org/showthread.php?t=172131
Das wirkt Wunder zusammen mit NNEDI3.

Was genau macht PowerPlay?

Mr. Lolman

2015-07-13, 15:10:53

Hm, MPDN hab ich nur mal kurz probiert, der ist mir in der 32bit Standaloneversion sofort abgeschmiert, als ich in 3840x2160 Fullscreen gehen wollte. Bisher hab ich das Deinterlacing halt über ffdshow regeln lassen, da ich als TV-Programm ProgDVB nutze, welches Deinterlacing den DirectShowdecodern überlässt. Und sollt ich über MPHC mal ein Video laufen lassen, welches trotz progressiv-Flag interlaced ist, war das auch simpel über eine Checkbox im ffdshow Traymenü zu steuern.

aufkrawall

2015-07-13, 16:55:14

Uff, nochmal gelesen: du brauchst interlaced als Ausgangsmaterial? :(
Ganz ehrlich: Notfalls würd ich einen neuen TV kaufen.

Lard

2015-07-13, 23:07:39

Was genau macht PowerPlay?
PowerPlay wechselt zwischen den drei Powerstates 2D/Low3D/3D.
Bei mir ist es immer deaktiviert. (http://www.computerbase.de/forum/showthread.php?t=1099278)
Damit habe ich z.B. die Möglichkeit den 2D Powerstate (300/150 MHz 0,8V) zu benchen, ohne das die Karte in den 3D Powerstate wechselt.

aufkrawall

2015-07-13, 23:44:51

wth. Dann erkennt der Treiber nicht richtig, dass er in einen anderen P-State wechseln müsste, um die bestmögliche Leistung zu erreichen. :|

Lard

2015-07-14, 00:01:10

Die Karte taktet hoch falls es erforderlich ist, wenn ich ein 3D Profil anwähle oder manuell etwas einstelle.
Falls die Leistung nicht gebraucht wird, verbleibt die Karte bei 300/150 MHz 0,8V.

aufkrawall

2015-07-14, 01:18:58

Aber warum hat Achill ohne Powerplay mehr fps?

Mr. Lolman

2015-07-14, 11:00:03

Uff, nochmal gelesen: du brauchst interlaced als Ausgangsmaterial? :(

Najo, ich hab zT interlaced als Ausgangsmaterial. ffdshow+avisynth sollen jegliches Video aus jeglicher Quelle bearbeiten. U.a. eben auch interlaced Videos von ProgDVB. Und es rennt insgesamt eh gut (gerade mit dem MT-Mod von avisynth 2.6.0). Jetzt bin ich nur mehr im Dilemma, dass mein Rechner auf Volllast rennt, wenn ich mittels ProgDVB (+ yadifmod/nnedi3x Deinterlacing + nnedi3_rpow2 Scaling) fernsehe. Ökonomisch geht anders :freak: