PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Künstliche/Synthetische Stimmen


tobor
2012-02-17, 12:52:24
Vor kurzem mal wieder Skyrim gespielt and war nach einer Weile wieder ziemlich genervt durch: Npc sagen immer wieder dasselbe und auch hier sind es nur wenige Sätze.
Für mehrere Npc wird der selbe Synchronsprecher verwendet.
Hier wird ja ziemlich oft über photorealistische Grafik diskutiert. Wie weit ist man denn bei der Erzeugung von synthetischen Stimmen die vom Menschen nicht mehr als solche wahrgenommen werden können? So das Dialoge in Spielen wie Skyrim wieder so umfangreich wie etwa in Morrowind werden können.( kosten Sprecher wirklich so viel?/die Erstellung des "Contents" und Marketing verursachen doch wesentlich mehr Kosten)

Käsetoast
2012-02-17, 13:03:53
Also für Englisch gibt es Software die wirklich sehr gut klingt, aber bei anderen Sprachen sieht das oft nicht so gut aus. Das wäre schonmal ein Grund gegen den Einsatz synthetischer "Sprecher". Auch merkt man es schon, ob ein echter Sprechen aufgenommen, oder so eine Software benutzt wurde - von einer komplett realisitischen Sprachsimulation ist man noch weit entfernt. Außerdem wären synthetische Sprecher wohl auch ein gutes Stück teurer - man müsste ja nicht nur für jeden Sprecher ein komplett eigenes Sprachprofil erstelle von wegen Stimmhöhe, Akzent, Sprachfehler und so weiter, sondern man müsste ja auch in mühevoller Handarbeit die Betonung jeder einzelnen Dialogzeile zusammenstellen, damit der Text so gesprochen wird wie gedacht. Da denke ich dann auch, dass es für ein Rufen oder Schreien noch gar keine Software gibt die das nachstellen kann. Ganz zu schweigen von sonstigen "Lauten" wie ein gurgelndes Röcheln wenn der Charakter sterben soll...

Von daher ist es viel einfacher sich einen Sprecher zu holen der den Text unter Anleitung in der gewünschten Betonung einspricht. Warum bei NPCs Stimmen oft recycelt werden liegt am Kosten-Nutzen-Verhältnis denke ich. Ich würde den Aufwand nicht unterschätzen den das Dialogschreiben, casten der Sprecher und die Aufnahme selber darstellt. Je nachdem wird dann auch schonmal der Platz auf den Medien knapp und nur wegen ein paar NPC Sprüchen wird man wohl keine Pressung einer zusätzlichen DVD genehmigt kriegen...

Coda
2012-02-17, 13:10:10
Sehe ich auch so. Es sind viel zu viele Emotionen in der Stimme um das synthetisieren zu können ohne zusätzlichen Parameter-Track. Und wenn du den pro Sprache machen musst, kannst auch gleich synchronisieren lassen.

AnarchX
2012-02-17, 13:52:21
Langfristig geht es wohl nicht nur darum manuell geschriebene Dialog in Sprache zu übersetzen, sondern vom NPC selbst "erdachte" Dialoge entsprechend auszugeben.

Stellt sich die Frage ob die Zielgruppe eben mehr auf die cineastischen, eingesprochenen Dialoge, die mit simpler Interaktion ausgelöst werden, höher einschätzt, als die Möglichkeit mit einem NPC ein nahezu echte Konversation zu führen.

Spasstiger
2012-02-17, 14:21:48
Apples Siri zeigt eigentlich schon einen gangbaren Weg auf. Mit zunehmenden Verbesserungen könnte sowas auch für Videospiele implementiert werden und es wäre für die Publisher eine Rechtfertigung, warum man für ein Spiel eine dauerhafte Internetverbindung benötigt.

MartinB
2012-02-17, 15:33:28
Stimmsynthese wird erst sinnvoll wenn sie automatisch abläuft. Also anhand der Situation, vorangegangen Sätzen, usw erkennt das System automatisch in welcher Gemütslage es sich befinden soll und passt die Betonung entsprechend an.

Ich finde es sehr Interessant, aber mir ist kein Projekt bekannt was sich damit beschäftigt.

Coda
2012-02-17, 15:40:20
Apples Siri zeigt eigentlich schon einen gangbaren Weg auf. Mit zunehmenden Verbesserungen könnte sowas auch für Videospiele implementiert werden und es wäre für die Publisher eine Rechtfertigung, warum man für ein Spiel eine dauerhafte Internetverbindung benötigt.
Siri braucht nur eine dauerhafte Internetverbindung um Sprache auszuwerten, nicht um sie auszugeben.

RLZ
2012-02-17, 15:47:19
Stimmsynthese wird erst sinnvoll wenn sie automatisch abläuft. Also anhand der Situation, vorangegangen Sätzen, usw erkennt das System automatisch in welcher Gemütslage es sich befinden soll und passt die Betonung entsprechend an.
Die Betonung hängt noch von so viel mehr ab als nur der Gemütslage.

Ich finde es sehr Interessant, aber mir ist kein Projekt bekannt was sich damit beschäftigt.
Die Computerlinguistik ist ein eigener Fachbereich. Allerdings mühen die sich mit wesentlich "trivialeren" Themen ab, was sich in den nächsten Jahrzehnten auch nicht ändern dürfte.
Vielleicht sollte man den Thread in 10-20 Jahren nochmal ausgraben und dann nochmal abschätzen wie lange es noch dauert. :freak:

Spirou
2012-02-17, 16:10:13
Illusion Games hat das Problem m. W. in Artificial Girl recht ordentlich gelöst.

Weiß nur keiner, wie die das gemacht haben. Am Reverse Engineering scheinen sich schon einige die Zähne ausgebissen zu haben.

GTX999
2012-02-17, 19:35:57
Wie weit ist man denn bei der Erzeugung von synthetischen Stimmen die vom Menschen nicht mehr als solche wahrgenommen werden können?


http://www.youtube.com/watch?v=IlBmbt8IVv4

oldschool ist doch viel cooler ;D

tobor
2012-02-17, 20:03:30
Je nachdem wird dann auch schonmal der Platz auf den Medien knapp und nur wegen ein paar NPC Sprüchen wird man wohl keine Pressung einer zusätzlichen DVD genehmigt kriegen...

Bei Skyrim war das nicht der Fall. Von möglichen 9gb wurden nur 6 überhaupt genutzt.

tobor
2012-02-17, 20:08:30
http://www.youtube.com/watch?v=IlBmbt8IVv4

oldschool ist doch viel cooler ;D

Also so manche Synchronsprecher sind nicht mal besser als das was hier ausgegeben wird...
Die Wachen in Oblivion etwa.(deutsche Version)

mahoni
2012-02-18, 10:11:42
...( kosten Sprecher wirklich so viel?/die Erstellung des "Contents" und Marketing verursachen doch wesentlich mehr Kosten)

ich job manchmal in nem tonstudio. da machen wir auch sprachaufnahmen. der sprecher hat letztens für 2 stunden aufnahmen, 800€ bekommen. für eine DVD wo eine Golfanlage beschrieben wird, also nix wildes.

Geldmann3
2012-02-18, 19:29:56
David Nathan (http://de.wikipedia.org/wiki/David_Nathan) (u.a. Sprecher von Jack Sparrow + Stimme von Radio Bob)meinte mal, er würde für so einen Film insgesamt "nur" ein paar tausend Euro bekommen.

InsaneDruid
2012-02-19, 11:13:18
Die Kosten für den Sprecher machen allerdings auch nicht die Gesamtkosten der (Sprach-)Vertonung aus.

Spirou
2012-02-19, 12:08:16
Scripte anfertigen, Sprecher auswählen, Termine planen, ein Aufnahmetechniker, ein Regisseur, die beide etwas mehr Zeit aufwenden als die Sprecher, etwas Hardware und Räumlichkeiten samt Putzfrau -> ergo dürften die Gesamtkosten das Fünffache dessen ausmachen, was die Sprecher bekommen. Ganz ohne Gewinn und angerechnete Bereitstellungskosten macht man es nicht, also eher das Siebenfache.