PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : TMPGEnc Video Mastering Works 5 Cuda Bench


dildo4u
2011-06-20, 04:44:52
Trail Version

http://tmpgenc.pegasys-inc.com/en/download/tvmw5.html

1080p Test Clip

http://betav2.gamersyde.com/download_battlefield_3_e3_thunder_run-21382_en.html

Ich hab mich mal wieder umgeguckt und muss sagen das Tool überzeugt mich voll bei der GPU Nutzung.Qualität ist 1 A und kaum vom CPU Encoder zu unterscheiden.Als Test hab ich das File als mkv neu encodiert,ausgewählt wird dadurch 1080p 30fps,avg Bitrate wurde im VBR Modus per Hand auf 13000 gestellt unter Format->Rate control Mode zusätzlich muss in dem Untermenu bei Encode Avanced auf 1 pass gestellt werden.Dann das ganze einmal mit und ohne Cuda testen.Bei Format unter Video->Videoencoder umstellen x264(CPU) vs Cuda(GPU).Für den Cuda Test ist wichtig unter Preferences Cuda und Cuda Nutzung fürs Filtering zu wählen und das Programm nach dem Optimieren für Cuda neu zu starten.

Meine Ergebnisse.

x264 CPU Encode mit einem AMDX6@3.2Ghz 20:37

Mit Cuda AMDX6@3.2ghz und GTX 460@Default 10:30

Beide Files müssten nach dem Encoden jeweils was um 750mb haben.Was mich interresiert ist ne 570 bzw 580 deutlich schneller und was leistet Sandy Bridge mit dem CPU Encoder.

Raff
2011-06-20, 07:22:18
Also nur die Fps-Rate auf 30 setzen und die Bitrate auf 13000, das war's? Plus CUDA für Encoding und Filtering.

Habe mich eben schnell in das Programm eingearbeitet, nun ist aber keine Zeit mehr für 'nen Bench. X-D Teste ich nachher, wenn du das Go gibst. :)

MfG,
Raff

Jonny1983
2011-06-20, 07:31:15
@dildo4u

Das was wir einstellen müssen, einfach mal mit Screenshots darstellen, damit es auch jeder versteht und man unter gleichen Bedingungen testen kann.

Raff
2011-06-20, 08:11:09
Das wäre natürlich am besten. Das Programm ist auf den ersten Blick nämlich nicht sehr intuitiv bedienbar.

MfG,
Raff

TheBrother
2011-06-20, 09:30:59
Ich besitze das Programm schon eine Weile.

Ich kann jetzt aber leider (aus Zeitmangel) nur mit Cuda Ergebnissen dienen:
Core-I5 2500k@4,7 und ne 580GTX DDR3-1333: 5:45

Die CPU war aber nur 60% ausgelastet und die GPU maximal 20%.

Ich finde die Qualität aber mit CPU-Only und Dual-Pass immernoch besser als mit CUDA.

tombman
2011-06-20, 10:13:42
Ich poste später Werte, aber...dieses Video....:eek: ...:massa:

Ist ja fast wie der "Crysis-Moment" 2007 :eek:

Nem alten Menschen könnte man das im TV zeigen und als echt verkaufen :eek:

deekey777
2011-06-20, 11:14:06
Ich weiß nicht, wie es bei dieser Version ist, aber mit der Februar-Version war x264-Encodng extrem langsam. Es wäre hilfreich, den x264 mit einer anderen GUI gegenzutesten.

Des Weiteren: Das Ausgangsvideo ist alles andere als passend, um die Bildqualität zu beuteilen.

Gorkon
2011-06-20, 11:18:16
So soll es wohl eingestellt werden:

Hauptmenu
http://www.abload.de/img/tmpgenc_00oubs.png

Preferences (Correct Performance Optimation anklicken, laufen lassen, neustarten)
http://www.abload.de/img/tmpgenc_02qub1.png

Dann "New Project" im Hauptmenu und "From Files" auswählen. Datei auswählen und das nächste Fenster mit OK bestätigen.
http://www.abload.de/img/tmpgenc_037n68.png

Hier dann einfach auf "Format" klicken und MP4-AVC oder MKV auswählen. Macht am Ende keinen Unterschied ;)
http://www.abload.de/img/tmpgenc_06yuu0.png

Den Rest anhand dieser beiden Bilder einstellen
http://www.abload.de/img/tmpgenc_07guzg.png

"Settings" bei Rate Control Mode:
http://www.abload.de/img/tmpgenc_05anvp.png

Danach einfach auf "Encode" klicken > Export > Warten bis es fertig ist ;)

---

Ich habe nur mal fix nen CUDA-Run gemacht. Das kam hier raus:
Phenom II X6 1090T @ 3,6GHz + GTX580 @ 850/1700/2200 (FW 275.36)
http://www.abload.de/img/tmpgenc_01adnau.png

GPU war gerade mal zu 10% ausgelastet. Liegt aber auch wohl daran, dass hier nur 1 Kern wirklich ausgelastet war und die CPU trotzdem noch eine Menge zu sagen hat. Sandy ftw :freak:

Edit: Ok, nochmal mit einer DVD-Quelle gegengetestet. Es geht natürlich weitaus schneller wegen der geringeren Auflösung, aber die GPU dreht trotzdem Däumchen bei max. 15%. Ich spekulier mal wild drauf los, dass der Phenom es einfach nicht schafft, die GPU mit genügend Daten zu versorgen. Da hier jedenfalls nur wie gesagt 1 Kern richtig ausgelastet wird (Gesamtauslastung bei ~ 25%) läuft die Datenversorgung wohl nur Single-Threaded. Aber wahrscheinlich ist das Teil auch einfach abartig für Intel-CPUs optimiert :D

mfg

Ronny145
2011-06-20, 11:28:40
Von VBR hat er aber nichts erwähnt. Damit wird average bit rate gemeint sein. Mit CBR kann ich dann nämlich auch keine Maximum Bitrate einstellen. Dazu gehört halt auch ein screenhot damit man das verlässlich nachstellen kann.

Aber man könnte sich jetzt auf die settings von Gorkon einigen.

dildo4u
2011-06-20, 11:48:42
Hab die selben Einstellungen wie Gorkon genutzt VBR ist richtig wie gesagt das File muss bei ca 750mb landen.Wichtig für den CPU Test muss Cuda unter Preferences wieder deaktiviert werden sonst nutzt es immer Cuda auch wenn man x264 als Encoder auswählt.




Des Weiteren: Das Ausgangsvideo ist alles andere als passend, um die Bildqualität zu beuteilen.
Nope in der Nacht bzw Termosicht gibt's ein sehr feines Bildrauschen was Potenziel viele Artefakte produziert.

deekey777
2011-06-20, 12:34:19
Hab die selben Einstellungen wie Gorkon genutzt VBR ist richtig wie gesagt das File muss bei ca 750mb landen.Wichtig für den CPU Test muss Cuda unter Preferences wieder deaktiviert werden sonst nutzt es immer Cuda auch wenn man x264 als Encoder auswählt.



Nope in der Nacht bzw Termosicht gibt's ein sehr feines Bildrauschen was Potenziel viele Artefakte produziert.
Was heißt hier "nope"?
Du kannst doch nicht ein schon vorher komprimiertes Video aus einem Spiel als Grundlage für einen Encoder-Vergleich nehmen.

Ronny145
2011-06-20, 12:39:15
2500k 3,3 Ghz Turbo Off= 21:55/91 Watt
Intel Quick Sync HD3000= 8:11/~65 Watt


Die CPU Auslastung liegt ziemlich konstant bei 100% auf allen Cores. Mit Quicksync nur um die 35%.

dildo4u
2011-06-20, 14:01:59
2500k 3,3 Ghz Turbo Off= 21:55/91 Watt
Intel Quick Sync HD3000= 8:11/~65 Watt


Die CPU Auslastung liegt ziemlich konstant bei 100% auf allen Cores. Mit Quicksync nur um die 35%.
Nich schlecht vermutlich gehts mit Quick Sync noch wesentlich schneller wenn die CPU mit 4.5Ghz laufen würde.Frag mich ob man mit Cuda 4.0 die GPU mit allen Cores speisen könnte zur Zeit nutzt das Programm nur 3.1.

tombman
2011-06-20, 19:13:20
Dildo4u: könntest du bitte Screenshots von ALLEN settings machen, damit wir auch ja wirklich gleich benchen? Sowas gehört sich einfach :)

dildo4u
2011-06-20, 19:17:45
Besser als Gorkon kann ichs auch nicht machen alle Einstellungen passen.

tombman
2011-06-20, 19:19:48
Ok, also die Gorkon Pics :)

Byteschlumpf
2011-06-20, 20:23:36
Meine Werte (i7 860 @ 4Ghz, GTX460 1GB @ 800Mhz (FW 270.61)):

tombman
2011-06-20, 20:47:21
Ohne Cuda: 11:04 :D

Gorkon
2011-06-20, 20:54:27
Jetzt interessiert mich wirklich Raffs 4GHz Thuban + GTX 580. Der müsste ja so im Bereich von ~ 8:30min mit CUDA liegen ^^ Ansonsten echt "armselig" was bei AMD hinten rauskommt, auch wenn da wie gesagt wahrscheinlich brutalst auf Intel optimiert wurde (oder einfach SSE4 fehlt) :ugly:

Achja...zumindest hier reicht sogar der P8-State (405/810/324) locker mit CUDA. GPU dümpelt dann immer noch bei ~25% rum, Ergebnis auch quasi gleich. Schon lustig...

EDIT: Komm Tombi...die 5:45 von TheBrother knackst du noch :D

mfg

dildo4u
2011-06-20, 21:06:43
Jetzt interessiert mich wirklich Raffs 4GHz Thuban + GTX 580. Der müsste ja so im Bereich von ~ 8:30min mit CUDA liegen ^^ Ansonsten echt "armselig" was bei AMD hinten rauskommt, auch wenn da wie gesagt wahrscheinlich brutalst auf Intel optimiert wurde (oder einfach SSE4 fehlt) :ugly:

Achja...zumindest hier reicht sogar der P8-State (405/810/324) locker mit CUDA. GPU dümpelt dann immer noch bei ~25% rum, Ergebnis auch quasi gleich. Schon lustig...

EDIT: Komm Tombi...die 5:45 von TheBrother knackst du noch :D

mfg
Warum auf Intel optimiert?Wenn bei Cuda nur ein Core genutzt wird ist doch klar das ein 4.7Ghz Sandy ein Phenom 2 mit 3.6Ghz vernichtet.Der Unterschied kommt auch ohne AVX Nutzung hin und SSE4 hat auch der AMDX6.

derguru
2011-06-20, 21:06:52
intel HD3000/2600k@4,8ghz
http://www.abload.de/img/testcnfv.jpg

Byteschlumpf
2011-06-20, 21:16:19
Warum auf Intel optimiert?Wenn bei Cuda nur ein Core genutzt wird ist doch klar das ein 4.7Ghz Sandy ein Phenom 2 mit 3.6Ghz vernichtet.Der Unterschied kommt auch ohne AVX Nutzung hin und SSE4 hat auch der AMDX6.
Selbst ein 4Ghz Lynnfield (i860) macht das schon mit einer GTX460!

dildo4u
2011-06-20, 21:23:04
Normal mit dem CPU Encoder und Multicorenutzung ist schon mein 3.2Ghz X6 auf dem Level eines 2500k passt alles.Sieht nicht danach aus das es speziell optimiert ist.

tombman
2011-06-20, 21:23:54
Ich check das nicht, Cuda wird praktisch nicht verwendet:

http://www.abload.de/img/cudazh82.png (http://www.abload.de/image.php?img=cudazh82.png)

Raff
2011-06-20, 21:24:26
Audio Low Complexity oder Main Profile? Das schwankt sogar bei Gorkon. ;)

Jetzt mal Standard-Audio mit CUDA für alles:

http://666kb.com/i/buj1gntpmp61ny9k2.png

Phenom II X6 (Thuban) @ 255x11 = 2.805 MHz, NB @ 2.550 MHz, 2x 4.096 MiB DDR3 @ 850 MHz bei 9-9-9-24-1T, GeForce GTX 580/1,5G @ 900/1.800/2.400 MHz, GF 275.27, W7ndows x64 SP1

MfG,
Raff

dildo4u
2011-06-20, 21:26:10
Audio Low Complexity oder Main Profile? Das schwankt sogar bei Gorkon. ;)

MfG,
Raff
mkv/MP4-AVC auswählen und an der Audio Einstellung nix ändern.

derguru
2011-06-20, 21:27:55
Ich check das nicht, Cuda wird praktisch nicht verwendet:

http://www.abload.de/img/cudazh82.png (http://www.abload.de/image.php?img=cudazh82.png)
kann ja die prozentangabe nicht stimmen wenn du ohne cuda 11:04 brauchst.sie wird schon gut verwendet sonst wärs du nicht auf 7 minuten.

dildo4u
2011-06-20, 21:28:58
Die Angabe ist kein avg am Anfang ist sie höher.

Morpheus2200
2011-06-20, 21:30:27
na toll mein laptop ueberhitzt gleich, und rechnet schon seit 38 min :-( .
weiss wer ob ich die integrierte grafik meines i5 in dem programm nutzen kann? der hat doch eine oder? wo muss ich das einstellen?

mfg Richard

derguru
2011-06-20, 21:34:45
Die Angabe ist kein avg am Anfang ist sie höher.
ja dann passt es ja.
tsss eine 250€ cpu macht ein gulftown+gtx580 cuda nieder. X-D

na toll mein laptop ueberhitzt gleich, und rechnet schon seit 38 min :-( .
weiss wer ob ich die integrierte grafik meines i5 in dem programm nutzen kann? der hat doch eine oder? wo muss ich das einstellen?

mfg Richard

stelle unter format bei video encoder auf intel media sdk hardware um.

tombman
2011-06-20, 21:36:51
LOL; jetzt hab ich Cuda deaktiviert und performance auf "fastest" gestellt- und die Golfstadt braucht 7 Minuten ;)

Raff
2011-06-20, 21:55:16
Ich gewinne noch 3 Sekunden, wenn die GPU mit 950 anstelle von 900 MHz läuft. ;D 11:38 vs. 11:41 Minuten. Kann aber auch Messtoleranz sein.

MfG,
Raff

tombman
2011-06-20, 22:02:07
Ok, war mein Fehler....hatte CUDA im encoder gar nicht aktiv :rolleyes:

6:21 sinds geworden...

-=Popeye=-
2011-06-20, 22:04:01
i5 2500k @ 4,0GHz
2x4GB DDR3 1333 CL9-9-9-24-1T
GTX570 @ stock GF 275.33 WHQL

CUDA-Run: 6:38
http://www.abload.de/img/aufzeichnenhdzx.png

derguru
2011-06-20, 22:07:00
Ok, war mein Fehler....hatte CUDA im encoder gar nicht aktiv :rolleyes:

6:21 sinds geworden...
also knapp doppelt so schnell wie Raffs amd sys.:biggrin:

tombman
2011-06-20, 22:09:51
Ich hab nur 480er, keine 580er....

derguru
2011-06-20, 22:12:19
und meinste das ändert irgendwas?trotzdem ~doppelt so schnell.

tombman
2011-06-20, 22:13:47
Daß X6 nix kann, wiß ma eh alle :)

Aber das Proggi bzw CUDA ist nicht sehr optimiert. Wenn das Teil alle Gpus im Sys nutzen würde -> 2 Min ;D

Ich hab grade mal 30sec Unterschied zwischen Cuda und Nicht-Cuda :rolleyes:

Gorkon
2011-06-20, 23:20:05
Warum auf Intel optimiert?Wenn bei Cuda nur ein Core genutzt wird ist doch klar das ein 4.7Ghz Sandy ein Phenom 2 mit 3.6Ghz vernichtet.Der Unterschied kommt auch ohne AVX Nutzung hin und SSE4 hat auch der AMDX6.

Es wird aber nur SSE4.1 und 4.2 von Pegasys unterstüzt. AMD hat nur mit SSE4a ihr gepimptes SSE3. Jetzt denk dir deinen Teil ;) Außerdem haben die Jungs und Mädels da schon immer Intel präferiert...wie halt die meisten Firmen. Aber bei der Marktpräsenz ja nun auch kein Wunder und klar verständlich.

Audio Low Complexity oder Main Profile? Das schwankt sogar bei Gorkon. ;)

Auch mir rutscht mal ein falsches Bild in ein spontanes improvisiertes How-To :tongue:
Aber die Audio-Einstellungen machen wirklich keinen Unterschied...egal ob AAC-LC oder DD5.1, dafür sind ja noch die restlichen Kerne da :freak:

mfg

Ronny145
2011-06-20, 23:29:48
Die AMD Ergebnisse sehen normal aus. Sandy Bridge rechnet so ungefähr 40% pro Kern schneller. Auf 4 Kerne hochgerechnet kann daher der 2500k die 2 zusätzlichen Kerne vom Thuban sehr gut ausgleichen. Die Anwendung muss als die Kerne sehr gut ausnutzen damit Thuban noch vorm 2500k liegt. Genau das ist hier zutreffend.

Man From Atlantis
2011-06-21, 01:22:52
Q9650 @4.00GHz (8x500)
Gigabyte EP45-DS3P
GTX 460 1GB (950/1900/4600)
2x2GB Corsair DDR2 1000MHz 5-5-5-15-2T
Win 7 x64 SP0

x264 performance = normal
22:33
http://www.abload.de/img/desktop_2011_06_21_01_qfz8.png

x264 performance = fastest
10:13
http://www.abload.de/img/desktop_2011_06_21_01_5caa.png

CUDA
07:57
http://www.abload.de/img/cudaugsl.png

CUDA (MMX and others off (http://www.abload.de/img/desktop_2011_06_21_03_3m7u.png))
10:20
http://www.abload.de/img/desktop_2011_06_21_03_zk9d.png

Raff
2011-06-21, 08:21:38
Daß X6 nix kann, wiß ma eh alle :)

Das trifft auf die Pro-Kern-Leistung zu. Wenn ein Programm alle 6 Kerne inklusive aller Funktionen ausnutzt, ist das Teil aber auf 2600K-Niveau (bei gleichem Takt). Dieses Programm hier jedoch ... Nachsitzen FTW.

MfG,
Raff

Ronny145
2011-06-21, 09:50:33
Das trifft auf die Pro-Kern-Leistung zu. Wenn ein Programm alle 6 Kerne inklusive aller Funktionen ausnutzt, ist das Teil aber auf 2600K-Niveau (bei gleichem Takt). Dieses Programm hier jedoch ... Nachsitzen FTW.

MfG,
Raff


Auf 2600k Niveau? In welchen Rosinen Benches soll das denn sein? Das schaffst du nichtmal im Cinebench.

daywalker4536
2011-06-21, 15:53:04
Hmm bei mir benutzt er CUDA obwohl ich es unter Video Encoder nicht ausgewählt habe?. Ich werd das Programm mal weiter testen. Die Auslastung wird bei mir 50/50% aufgeteilt.

dildo4u
2011-06-21, 16:09:38
Hmm bei mir benutzt er CUDA obwohl ich es unter Video Encoder nicht ausgewählt habe?. Ich werd das Programm mal weiter testen. Die Auslastung wird bei mir 50/50% aufgeteilt.
Du musst Cuda hier http://www.abload.de/img/tmpgenc_02qub1.png wieder abwählen,dann das Programm neu starten und x264 als Encoder auswählen für den CPU Test.

daywalker4536
2011-06-21, 17:33:50
Du musst Cuda hier http://www.abload.de/img/tmpgenc_02qub1.png wieder abwählen,dann das Programm neu starten und x264 als Encoder auswählen für den CPU Test.

Ah ok ^^. Das Programm ist garnicht schlecht. Das mit der CUDA Auslastung hängt irgendwie mit den Einstellungen zusammen die man wählt ist mir aufgefallen.

http://www.abload.de/img/14fle.jpg

Ronny145
2011-06-21, 19:22:03
Ah ok ^^. Das Programm ist garnicht schlecht. Das mit der CUDA Auslastung hängt irgendwie mit den Einstellungen zusammen die man wählt ist mir aufgefallen.

http://www.abload.de/img/14fle.jpg


Welche Einstellungen? Wäre mal interessant zu sehen wie die Qualität dabei aussieht und im Vergleich mit CPU Encoding.

Jonny1983
2011-06-22, 00:29:50
i2400@Stock: Performance=normal: 22:50min
Gigabyte 460GTX OC@Stock-OC: 8:08 CPU@93,1% CUDA@6,9%

Scorpius
2011-06-25, 16:09:58
i7-2600k @4,5
gtx460hawk @781/1804
CUDA 6:15min

PrefoX
2011-06-26, 11:25:25
bencht ihr auch mit High Profile und nem höheren level? 4.1 und höher?
sonst braucht ihr gar kein x64 bench machen.

Don Magic
2011-06-26, 11:58:51
Intel 2500K @3.8 Ghz + Nvidia 460 1GB

Scorpius
2011-06-26, 17:55:05
bencht ihr auch mit High Profile und nem höheren level? 4.1 und höher?
sonst braucht ihr gar kein x64 bench machen.

Siehste doch auf den Screenshots auf der ersten Seite.
High Profile und Level 4 (automatik) :confused:

kommt Level 4.1 raus.