PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Flüssige sprachliche Interaktion mit Computern


chatman
2014-02-19, 13:27:52
Hallo!

Hoffe das Thema passt hier rein.

Ich frage mich schon länger, wie lange es noch dauert, bis man als Privatperson mit Computern per Sprache kommunizieren kann.
Als Beispiel: Ich will etwas kaufen, sagen wir eine Möbelstück.
Die Frage die ich stellen würde wäre "Computer, wo bekomme ich am günstigsten einen Tisch in Buche, 130x90 cm?"

Das hieße, meiner Anforderung nach, daß das System jetzt anfangen müsste sehr viele Shops online zu durchsuchen, vielleicht auch noch Versandkosten und -Dauer zu berücksicht und mir dann eine Liste auszugeben (am Schirm oder mündlich), die nach meinen Prioritäten geordnet ist.
Andere Anwendungsmöglichkeiten wären Haussteuereung ("Schließe die Fenster") etc.

Woran fehlt es da eurer Meinung nach heute am ehesten? An der (logischen) Spracherkennung, an den passenden Suchalgorithmen oder (am unwahrschinlichsten) an der processing power?


lG

RaumKraehe
2014-02-19, 13:37:45
Aus meiner Sicht alleining auf die Rechenleistung.

Nicht umsonst werden die Sprachbefehle beim Iphone nicht im Telefon interpretiert sondern auf den Servern von Apple.

Ich war gestern ganz erstaunt als ich zu einem Kunden musste und die Adresse nicht mit hatte. "Navigation Firmenname" hat komplett gereicht und ich bin dort gut angekommen. Den Namen hatte ich nicht in meinen Kontakten hinterlegt.

FlashBFE
2014-02-19, 15:30:36
Naja, man muss ja zuerst die einzelnen Probleme voneinander trennen, wie du schon selbst geschrieben hast.

Die reine Spracherkennung, im einfachsten Fall Sprache-zu-Text, funktioniert heute schon ziemlich gut, auch wenn es externe Rechenleistung braucht.

Die zweite Sache ist, aus diesem gewonnenen Text Befehle für eine Suchmaschine zu analysieren. Und das Navi-Beispiel ist in diesem Fall auch nichts anderes, weil ebenfalls eine Suchmaschine zum Firmennamen die Adresse raussucht und an die Navi-App übergibt. Beim Tischbeispiel kann dir eine Suchmaschine auch haufenweise Shop-Links ausspucken, wenn der Tisch mit seinen technischen Daten sauber im Shop registriert ist. Heute auch kein Problem mehr.

Das Problem kommt, wenn der Computer aus dem Befehlstext Zusammenhänge und logische Schlüsse analysieren muss. Das ist zum großen Teil ein sprachunabhängiges Problem und man ist im Dunstkreis der KI-Forschung angelangt. Hier hapert es gewaltig.

Das ist bis jetzt wie mit einem gut trainierten Hund. Er macht alle Kunststücke, die du willst, wenn er die Kommandos versteht und antwortet mit "seiner Sprache". Aber versuche ihm mal ohne langes Training zu erklären, dass er nur bellen soll, wenn es klingelt, aber nicht der Vermieter vor der Tür steht :wink:.

chatman
2014-02-19, 16:25:41
Das Problem kommt, wenn der Computer aus dem Befehlstext Zusammenhänge und logische Schlüsse analysieren muss. Das ist zum großen Teil ein sprachunabhängiges Problem und man ist im Dunstkreis der KI-Forschung angelangt. Hier hapert es gewaltig.


Ja, da hast du recht. Dabei sehe ich gerade hier die Möglichkeit einer wirklichen Effizienzsteigerung im täglichen (Arbeits)Leben. Man bedenke die Möglichkeiten einem Computer einfach anschaffen zu können z.B. ein Excel File bestehend aus x anzulegen anstatt selbst mühsam so eine Tabelle erstellen zu müssen.

Leider hört man zu diesem Forschungsgebiet sehr wenig. Liegt das daran, daß hier nicht so viel passiert wie am lukrativeren weil leicher zu vermarktenden Consumer-Bereich?

RaumKraehe
2014-02-19, 17:34:01
Also wenn man bedenkt das man mittlwerweile fast zu 100% mit einem Computer spricht wenn man eine Hotline anruft passiert dort in meinen Augen schon recht viel.

Die Frage ist: Was erwartest du? Das Problem ist eben die korrekte Interpretation des gesagten. Da haben ja sogar Menschen Probleme. Sonst würde es ja nicht so viele sprachliche Missverstände geben. ;)

Ganon
2014-02-19, 19:06:38
Es fehlt hier auch noch sehr viel Grundlagenforschung und tatsächliche Algorithmen. Auch Systeme wie Siri funktionieren eher schlecht als recht, bzw. nur auf bestimmte Anfragen brauchbar. Hier wurde auch großteils per Hand optimiert bzw. gesammelten Anfragen per Hand ein Kontext/mögliche Antworten zugeordnet.

Für universelle Sprachinteraktion fehlt es noch an allen Ecken und Enden. Der Computer müsste dazu, vor Analyse des Satzes, zum Beispiel auch erst mal den Kontext indem er sich befindet, ermitteln. Und hier fehlt es dann auch noch an allen Ecken und Enden an Sensoren.

Nehmen wir doch mal das Beispiel: "Schließe die Fenster". Ein Haushaltsroboter könnte es ggf. verstehen, da er einen begrenzten Kontext hat. Ein universeller Roboter geht dann vllt. an den PC und macht alle Programme zu...

Da finden sich auch bessere Beispiele. Lustiges was den XBOX One Nutzern wohl passiert ist:
Ein Spieler hat sich "XBOX sign out" genannt und sich schlecht benommen. Und jeder der sich über den Spieler aufgeregt hat, dessen XBOX hat sich ausgeloggt. Die XBOX hat hier einfach keine entsprechende Kontext-Ermittlung und hat nicht erkannt, dass der Nutzer gerade überhaupt nicht mit der XBOX geredet hat, obwohl das Zauberwort "XBOX" ankam.

Beim TV meiner Eltern geht auch die Spracherkennung an, wenn viele im Raum kreuz und quer quatschen...

Pennywise
2014-02-19, 19:08:46
Paar Sachen gehen mit Siri schon ganz nett. Andere wieder nicht.

Letztens fragte mich meine Holde "Wann war Karneval 2013" - hab ich direkt mal an Siri weitergereicht und es kam ein gescheites Ergebnis.

Auf die Aussage "Ich bin zu fett" kommt eine Liste von Sportstätten in der Gegend ;D

Avalox
2014-02-19, 23:51:10
H
Woran fehlt es da eurer Meinung nach heute am ehesten? An der (logischen) Spracherkennung, an den passenden Suchalgorithmen oder (am unwahrschinlichsten) an der processing power?



Das beeindruckendste was ich dort gesehen habe ist IBM Watson.

Es ist die hochentwickelste semantische Suchmaschine die ich bisher gesehen habe, obwohl man munkelt, dass Google im Hintergrund schon deutlich weiter sein soll.


Zu IBMs Watson gibt es einiges zu lesen, schon weil er so medienwirksam beworben wurde.
http://de.wikipedia.org/wiki/Watson_(K%C3%BCnstliche_Intelligenz)

Es gibt auch einiges an Youtube Videos dazu und es lohnt sich das mal anzusehen.


Absehbar, dass in sehr überschaubarer Zeit genau dein Szenario erfüllt wird.


PS ich hätte gerne die Watson Animation für den Desktop.. Wenn jemand eine Idee hat.

Coda
2014-02-20, 00:32:04
Ich geh auch davon aus, dass Google in absehbarer Zeit semantische Suche anbieten und viele damit ziemlich schocken wird.

Screemer
2014-02-20, 00:41:30
wie sieht es eigentlich mit wolfram alpha (http://de.wikipedia.org/wiki/Wolfram_Alpha) aus. geht da noch was vorwärts? das fand ich damals ziemlich beeindruckend. google dürfte da aber bestimmt mittlerweile ziemlich weit sein auf dem gebiet.

patrese993
2014-02-20, 08:35:31
bei Wolfram Alpha fand ich die Möglichkeit sehr angenehm, direkt auf dem Note eingegebene Formeln lösen zu lassen, scheint also auch etwas stärker integriert zu werden teilweise.

Btw: Zum Thema Spracheingabe und vollständige Verständigung mit dem PC per Sprache paßt dieser Film sehr gut, falls ihn jemand noch nicht kennt. Drama über die Beziehungen zwischen Menschen und KI
http://www.imdb.com/title/tt1798709/?ref_=nv_sr_1

Frozone
2014-02-20, 09:49:31
Zum Thementitel passt dieses hier vielleicht ganz gut: http://www.indiegogo.com/projects/emospark-first-a-i-home-console
Emospark: Ein Crowdfunding Projekt bei dem man mit AI kommunizieren können soll.
http://de.engadget.com/2014/02/17/emospark-kunstliche-intelligenz-kommt-in-die-wohnung-hal-ick/

Passt nicht ganz zu den Anforderungen im Ausgangspost, aber halt zum Titel.

Iruwen
2014-02-20, 10:03:57
Bei allem was sich da tun mag, für normale Endanwender sieht es so aus als hätte sich in dem Bereich in den letzten zehn Jahren kaum was getan. Spracherkennung funktioniert meist immer noch mehr schlecht als recht, Sprachsynthese klingt meist kacke.

patrese993
2014-02-20, 10:50:19
...Spracherkennung funktioniert meist immer noch mehr schlecht als recht...
och, das würd ich so nicht sagen, ich "schreibe" mittlerweile ganz gerne Texte/Nachrichten/Posts am Handy per Spracheingabe, das funktioniert sogar ziemlich gut.

chatman
2014-02-20, 11:23:33
Das beeindruckendste was ich dort gesehen habe ist IBM Watson.


Zu IBMs Watson gibt es einiges zu lesen, schon weil er so medienwirksam beworben wurde.
http://de.wikipedia.org/wiki/Watson_(K%C3%BCnstliche_Intelligenz)

Es gibt auch einiges an Youtube Videos dazu und es lohnt sich das mal anzusehen.
.

vielen Dank, sehr interessant!

Wobei lt. Wikipedia: "Der Rechnerverbund besteht aus 90 Power 750 Servern mit 16 TB RAM"

Meine Annahme, daß es nicht an der Rechenleistung scheitern kann scheint damit also wiederlegt!

Geldmann3
2014-02-22, 15:56:23
Man wird mit einem Computer keine ordentliche Konversation führen können, solange er nicht auf menschenähnliche Erfahrungen zurückgreifen kann. Aktuelle Hardware ist generell nicht dazu geeignet, wie ein Hirn zu funktionieren, da fehlt die "Braincard" im PCI-E Steckplatz.

CPU und Grafikkarte können nur dumm vorherbestimmte, un-autonome Befehle vor sich hin ausführen. Mit konventioneller Hardware funktioniert das nicht ausreichend schnell. Die ist zwar toll um ein H.264 Video zu enkodieren, aber sehr ineffizient darin, ein Bestseller zu schreiben.

JaDz
2014-02-22, 16:08:28
Das Thema erinnert mich irgendwie immer wieder an:

M0uJI1F-AHo

:D