PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Speech to Text Framework (unter Linux)


anakin87
2014-08-17, 16:56:39
Hi,

ich hab seit längerem ein Projekt im Kopf und würde mich nun gern an ein POC heranwagen. Es geht um folgendes, unter Linux per C++ / QT einen voice command assistant zu basteln. Ja, es gibt sowas bereits wie Simon usw. - würde es aber selber versuchen. Nun möchte ich voice recognition / speech to text nicht selbst coden; so wahnsinnig bin ich nocht nicht.

Die groben Schritte sollten so aussehen:
Sprache => Text => wird auf eine Commandlist gemapped => Reaktion (Ausführung / Rückmeldung etc.)


Kenn ihr (freie) Frameworks für Linux die Sprache relativ schmerzfrei in Text umsetzen?
Das Teil muss nicht der deutschen Sprache mächtig sein, Englisch reicht (oder wird für Befehle eigentlich bevorzugt). Erkennungsfehler kann ich zum Teil beim Mapping ausbügeln... Die Architektur vom Mapping bis zur Durchführung steht schon (war auch der einfachere Teil). Viele wollen eine Trainingsphase oder sind so abgeschlossen, dass sie direkt (wie Simon) Sprache auf Befehle legen. Ich würde aber lieber den "Umweg" auf Text haben. An der Idee tüftle ich schon länger, auch mit Aussicht auf autonome Aktionen, oder später mal das Mapping durch AI-Fähigkeiten zu ersetzen (aber darüber hab ich noch nicht so genau nachgedacht) - erstmal die Basis-Variante umsetzen.
Aber egal wie man es sieht, ich brauch zuerst den Schritt der Sprache in Text umsetzt. Hat jemand von euch mit sowas Erfahrung, was habt ihr verwendet - wie habt ihr es umgesetzt?
Zur Zeit evaluiere ich CMU Sphinx -> finde ich aber etwas verwirrend

@Mods wenn es eher im "Unix / Linux Betriebssysteme uns Software" einzuodnen ist, bitte verschieben... Ich hab gedacht der Fokus liegt auf der Programmierung ;)

mfg
anakin87

Thunderhit
2014-08-17, 17:44:17
Habe eine zeitlang auch CMU Sphinx getestet. Ist die einzig sinnvolle freie Möglichkeit, Spracherkennung in einem eigenen Programm nutzen zu können.
Hat sich aber nicht so toll gemacht wie ich fand. Es gab keine ordentlichen Tutorials und die Erkennungsrate war alles andere als prickelnd. Und Hilfe bei der Programmierung etc. war schwierig zu bekommen, aber habe ich bis jetzt generell bei Open Source Projekten erlebt. Auch bei OpenCV. Auf eine sinnvolle Frage kommen 30 Leute, die keine Ahnung haben und das Forum zumüllen mit wirklich dämlichen Fragen.

anakin87
2014-08-17, 22:07:23
Ja das mit den Tutorials ist etwas schräg - ich werde nicht ganz schlau draus... Naja vielleicht finde ich noch einen Guide der mir mal einen guten Einstieg bringt. Ich denke Simon basiert auch auf CMU Sphinx - also laufen müsste es ja...

Oder gibt es noch andere Vorschläge?