DXO PhotoLabs 4 - DeepPrime AI Denoiser [Archiv]

Archiv verlassen und diese Seite im Standarddesign anzeigen : DXO PhotoLabs 4 - DeepPrime AI Denoiser

Savay

2020-10-21, 18:46:52

Moin Zusammen,

DxO hat PL4 veröffentlicht.
https://www.heise.de/news/DxO-PhotoLab-4-Raw-Fotos-intelligent-entrauschen-4927384.html
https://blog.dxo.com/denoising-technology/

Raw Entwickler kennt man ja schon länger und ich würde deswegen jetzt keinen extra Faden aufmachen. So weit so langweilig. (vorallem wenn man LR als Maßstab nimmt)
Aber der Release hier hat nen Twist den ich so bei derartiger Bildbearbeitungs-SW für Desktops noch nicht in der Form gesehen habe.

Technisch interessant ist m.E. nämlich der neue ML (DNN) basierte Denoiser & Demosaicer DeepPrime der auch über die GPU (signifikant) beschleunigt werden kann! (ich vermute OpenCL basiert) (Edit: unter Windows wohl doch WinML bzw. DirectML wenn man der Config und der vorhandenen .dll trauen kann.)

Hier mal ein paar Quick and Dirty Vergleichswerte mit meiner Kiste.

Ein 32MPix RAW @Stock 2700X & Vega64:

CPU + OpenCL mit HQ Denoiser dauert ca. 4-5s/Bild
CPU only HQ Denoiser dauert ca. 6-7sek/Bild
CPU only PRIME Raw dauert um die 20sek/Bild
CPU + GPU DeepPRIME dauert ca. 10-11sek/Bild (UND sieht deutlich besser als das schon ganz gute PRIME Raw!)
CPU only DeepPRIME dauert ca. 100Sek/Bild(!) :freak: (Bei fast durchgehend 100% Auslastung und ner Package Power von ~120-140W)

Bei Batches könnte sich an den Werten dann evtl. noch was verändern aber man erkennt das Potenzial auch so denke ich.
Jetzt wären natürlich etwas ausführlichere Benchmarks dazu mal ganz interessant! :wink:

Nachtrag:
Auf meinem 13" QuadCore Convertible mit 15W APU lässt sich die GPU leider nicht automatisch zuschalten ohne gelegentlich einen Fehler zu produzieren am Ende...dementsprechend ist das auch eine ziemlich zähe Geschichte.

CPU + OpenCL mit HQ Denoiser auch ca. 4-5s/Bild
CPU only PRIME Raw dauert um die 75sek/Bild
CPU only DeepPRIME dauert ca. 6,5+ Minuten/Bild(!)

Manuell forcierte Berechnung über die GPU resultiert übrigens an sich in einer Exportzeit von knapp über einer Minute (65-66sek/Bild)...gibt halt nur evtl. einen Error am Ende. (Edit: nach einem Treiberupdate sind bislang keine Fehler mehr aufgetreten)

czuk

2020-10-22, 10:17:14

Das Thema interessiert mich, da mir DXO recht zugänglich ist und ich dem Abo Modell von LR nicht folgen möchte (nutze eine alte Version).

Kannst du von einem Beispielbild ein 100% Crop eines Bildes hochladen (dunkle kontrastreiche Zone)?

Savay

2020-10-22, 11:35:23

czuk

2020-10-24, 09:08:43

Was besseres habe ich grade leider nicht.
Es gibt aber eine 30 Tage Trial ohne Funktionseinschränkung. :smile:

https://www.dropbox.com/s/c6hlskh9ob6hn7n/Screenshot%202020-10-22%20104045.png?dl=0

https://www.dropbox.com/s/8pxsgtzxlb3yt9q/Screenshot%202020-10-22%20103949.png?dl=0

Wow, danke, die Unterschiede sind wirklich deutlich zu sehen. Den Mehraufwand bzgl Processing Time ist es auf jeden Fall Wert.

Savay

2020-10-24, 20:23:04

Hier gibt es übrigens ein paar erste Community generierte Benchmarks aus dem DXO Forum:

https://docs.google.com/spreadsheets/d/1Yx-3n_8D3OreyVwQLA-RVqiQCAgNdXDkxScpXTur1Gs/edit#gid=0

Vega64 bislang noch knapp King of the Hill vor RTX2080Ti. :uponder:

FP32 Rohleistung scheint recht gut durchzuschlagen.
FP16 spielt wohl keine Rolle wie es bislang aussieht, genauso wenig wie TensorCores. Obwohl es über DirectML läuft.

Nachtrag: 3080 und 1080Ti drin. Große Ampere erwartbar schneller, Pascal erstaunlicherweise deutlich langsamer als Vega10. FP16 spielt evtl. doch eine Rolle.