anakin87
2014-08-17, 16:56:39
Hi,
ich hab seit längerem ein Projekt im Kopf und würde mich nun gern an ein POC heranwagen. Es geht um folgendes, unter Linux per C++ / QT einen voice command assistant zu basteln. Ja, es gibt sowas bereits wie Simon usw. - würde es aber selber versuchen. Nun möchte ich voice recognition / speech to text nicht selbst coden; so wahnsinnig bin ich nocht nicht.
Die groben Schritte sollten so aussehen:
Sprache => Text => wird auf eine Commandlist gemapped => Reaktion (Ausführung / Rückmeldung etc.)
Kenn ihr (freie) Frameworks für Linux die Sprache relativ schmerzfrei in Text umsetzen?
Das Teil muss nicht der deutschen Sprache mächtig sein, Englisch reicht (oder wird für Befehle eigentlich bevorzugt). Erkennungsfehler kann ich zum Teil beim Mapping ausbügeln... Die Architektur vom Mapping bis zur Durchführung steht schon (war auch der einfachere Teil). Viele wollen eine Trainingsphase oder sind so abgeschlossen, dass sie direkt (wie Simon) Sprache auf Befehle legen. Ich würde aber lieber den "Umweg" auf Text haben. An der Idee tüftle ich schon länger, auch mit Aussicht auf autonome Aktionen, oder später mal das Mapping durch AI-Fähigkeiten zu ersetzen (aber darüber hab ich noch nicht so genau nachgedacht) - erstmal die Basis-Variante umsetzen.
Aber egal wie man es sieht, ich brauch zuerst den Schritt der Sprache in Text umsetzt. Hat jemand von euch mit sowas Erfahrung, was habt ihr verwendet - wie habt ihr es umgesetzt?
Zur Zeit evaluiere ich CMU Sphinx -> finde ich aber etwas verwirrend
@Mods wenn es eher im "Unix / Linux Betriebssysteme uns Software" einzuodnen ist, bitte verschieben... Ich hab gedacht der Fokus liegt auf der Programmierung ;)
mfg
anakin87
ich hab seit längerem ein Projekt im Kopf und würde mich nun gern an ein POC heranwagen. Es geht um folgendes, unter Linux per C++ / QT einen voice command assistant zu basteln. Ja, es gibt sowas bereits wie Simon usw. - würde es aber selber versuchen. Nun möchte ich voice recognition / speech to text nicht selbst coden; so wahnsinnig bin ich nocht nicht.
Die groben Schritte sollten so aussehen:
Sprache => Text => wird auf eine Commandlist gemapped => Reaktion (Ausführung / Rückmeldung etc.)
Kenn ihr (freie) Frameworks für Linux die Sprache relativ schmerzfrei in Text umsetzen?
Das Teil muss nicht der deutschen Sprache mächtig sein, Englisch reicht (oder wird für Befehle eigentlich bevorzugt). Erkennungsfehler kann ich zum Teil beim Mapping ausbügeln... Die Architektur vom Mapping bis zur Durchführung steht schon (war auch der einfachere Teil). Viele wollen eine Trainingsphase oder sind so abgeschlossen, dass sie direkt (wie Simon) Sprache auf Befehle legen. Ich würde aber lieber den "Umweg" auf Text haben. An der Idee tüftle ich schon länger, auch mit Aussicht auf autonome Aktionen, oder später mal das Mapping durch AI-Fähigkeiten zu ersetzen (aber darüber hab ich noch nicht so genau nachgedacht) - erstmal die Basis-Variante umsetzen.
Aber egal wie man es sieht, ich brauch zuerst den Schritt der Sprache in Text umsetzt. Hat jemand von euch mit sowas Erfahrung, was habt ihr verwendet - wie habt ihr es umgesetzt?
Zur Zeit evaluiere ich CMU Sphinx -> finde ich aber etwas verwirrend
@Mods wenn es eher im "Unix / Linux Betriebssysteme uns Software" einzuodnen ist, bitte verschieben... Ich hab gedacht der Fokus liegt auf der Programmierung ;)
mfg
anakin87