PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Wird es in absehbarer Zeit (20 Jahre) jemals Spiele mit guter Sprachsynthese geben?


Gast
2007-08-23, 04:42:21
Jeder kennt sicher Sprachsysteme wie Festival,
mit denen der Computer einen Text in gesprochener Sprache vorlesen kann.

Nur klingt das heutzutage noch sehr bescheiden, so daß es bis auf extrem wenige Ausnahmen wie bei Flugsimulatoren (z.B. FlightGear)
dies bei Spielen noch nicht verwendet wird.


Daher ist meine Frage, wird es in den nächsten 20 Jahren jemals möglich sein,
daß es Spiele gibt, die eine Form der Sprachsynthese in natürlicher Qualität liefern und verwenden, anstatt aufgezeichnete vom Menschen gesprochene Sprache?


Wenn ich nämlich z.B. an Umfangreiche Rollenspiele wie Fallout oder
Morrowind denke, dann wäre eine wirklich gut funktionierende Sprachsynthese ein wahrer Segen.
Erst Recht bei Moddern, da man damit wirklich umfangreiche Geschichten erzählen und kreiiren könnte, ohne auf gesprochene Sprachausgabe verzichten zu müssen.

Bei den meisten großen RPG Projekten hat man nämlich meistens entweder nur
Standardsätze die per Sprachausgabe ausgegeben werden (z.B. Morrowind),
während der Rest der eigentlich Story als Text zum Lesen wiedergeben wird
oder eine Story mit, im Vergleich zu Textlastigen RPGs, sehr kurzen Dialogen.

Und wenn man sich dann mal die Mods anschaut, dann hat man entweder nur Text oder wenn man mal Glück hat, meist nur sehr dürftige Sprecher.

Mit der Sprachsynthese könnten menschliche Sprecher mal überflüssig werden, aber wann kann man und unter der Bedinung das es auch wirklich natürlich und gut klingt, damit bei Spielen wirklich rechnen?

Gast
2007-08-23, 04:48:45
Mit guter natürlicher Qualität meine ich übrigens, daß sie den Anforderungen
von heutigen Spiele auch völlig gerecht wird.

Also auch die Stimmung von gesprochenem Text rüberkommt und das nicht
nur nach Roboter klingt.

Gast
2007-08-23, 05:02:27
Wenn ich mir diesen Überlick mal so anhöre,
dann finde ich momentan von den kommerziellen das Sprachsynthese
von Loquendo am besten, für Spiele reicht das von der Qualität her aber
trotzdem noch nicht.

http://ttssamples.syntheticspeech.de/deutsch/index.html

Blutmaul
2007-08-23, 07:52:26
Auf 20 Jahre gesehn, ja, davon bin ich überzeugt!

Monger
2007-08-23, 10:57:10
Kann ich mir nur schwer vorstellen.

Flüssig und sauber sprechen geht auch schon heute. Mit sehr vielen Soundsamples von realen Stimmen kann man schon etwas erzeugen was von einer menschlichen Stimme nicht mehr zu unterscheiden ist.

Nur: eine gute Sprachausgabe soll ja nicht nur wie ein menschlicher Sprecher klingen, sondern wie ein wirklich guter menschlicher Sprecher. Dazu muss man auf Rhythmus und Betonung wert legen. Das erfordert eine Interpretation des vorgegebenen Textes, und davon sind wir noch wirklich meilenweit weg.

Kinman
2007-08-23, 21:53:48
Nur: eine gute Sprachausgabe soll ja nicht nur wie ein menschlicher Sprecher klingen, sondern wie ein wirklich guter menschlicher Sprecher. Dazu muss man auf Rhythmus und Betonung wert legen. Das erfordert eine Interpretation des vorgegebenen Textes, und davon sind wir noch wirklich meilenweit weg.


Es müsste dann halt nicht reiner Text sondern ein Text mit Auszeichnungen für Emotionen, Stimmungen, etc. (z.B. über XML) sein. Dann wäre das schon viel leichter.

Gast
2007-08-24, 11:25:08
Wenn man sich anschaut, wie Rechner vor über 20 Jahren mit einem Minimum an Hardware bereits sprechen konnten und das mit dem jetzigen Stand vergleicht, stellt man fest, dass sie eigentlich nur die Qualität und Natürlichkeit der Sprache gebessert hat - und dass dafür ein Vielfaches an Rechenleistung verbraucht wird.

Insgesamt bin ich nicht allzu optimistisch, allerdings heißt das nicht, dass es nicht sowas geben könnte... aber zumindest nicht in dieser absolut perfekten Art und Weise, mit der man auch locker Filme synchronisieren könnte oder ähnliches.

Gast
2007-08-24, 18:39:26
Wenn man sich anschaut, wie Rechner vor über 20 Jahren mit einem Minimum an Hardware bereits sprechen konnten und das mit dem jetzigen Stand vergleicht, stellt man fest, dass sie eigentlich nur die Qualität und Natürlichkeit der Sprache gebessert hat - und dass dafür ein Vielfaches an Rechenleistung verbraucht wird.

Insgesamt bin ich nicht allzu optimistisch, allerdings heißt das nicht, dass es nicht sowas geben könnte... aber zumindest nicht in dieser absolut perfekten Art und Weise, mit der man auch locker Filme synchronisieren könnte oder ähnliches.


Also für ein textlastiges Rollenspiel erwarte ich nicht die Sprachausgabequaltiät
wie bei einem 3d Shooter.
Es sollte natürlich natürlich klingen und auch Emotion weidergeben können.

Aber die emotionen können wenn es nach mir geht auch noch recht
generell sein, ich brauche da nicht 200 Varianten um z.B. Wut oder Freude auszudrücken.

AnarchX
2007-08-24, 18:48:23
Hatte auch schon mal einen ähnlichen Thread erstellt:
http://www.forum-3dcenter.org/vbulletin/showthread.php?t=352601

Eigentlich sollte heute schon einiges möglich sein an Sprachsynthese, deren Inhalt sogar schon auf einer KI basieren könnte, wenn man nicht gezielte Inhalte vorgetragen haben möchte.

In 20 Jahren erwarte ich doch dann schon definitiv mehr als ein paar gut vorgelesene Sätze. Eine vollständige Sprachinteraktion auf hohem Niveau sollte da doch schon Standard sein, AFAIK hatte so etwas Intel auch mal in einer Vorschau des Homecomputers in 15 Jahren.

Benedikt
2007-08-24, 20:32:14
Für richtig gute Sprachausgabe in Games (und Synchronisation von Filmen) braucht man richtig gute Sprecher, am besten Theaterschauspieler o. dgl. Es ist schier unglaublich was manche Leute aus scheinbar einfachen Texten herausholen können, jedoch ohne übertrieben oder unnatürlich zu wirken - das ist eine hohe Kunst, und für sowas ist nicht umsonst ein Studium nötig!

Richtig gute Sprachausgabe bemerkt man dann aber auch: In Call of Juarez (http://german.imdb.com/title/tt0913366/) (eng Original) durfte ich das vor kurzem erst wieder miterleben - erstklassig! Ein Beispiel für gute deutsche Sprachausgabe fällt mir jetzt nicht ein, Diablo2 oder Gothic2 vielleicht. Das Gegenteil (nämlich billg und schlecht) gibts natürlich auch - bei HL2 (Deutsch) zum Beispiel.

Bis Sprachsynthese so weit sein wird, vergeht noch eine laaange Zeit! :wink: