Speech-to-text-engine für den Pi, Erfahrungen, Empfehlungen?

Heute ist Stammtischzeit:
Jeden Donnerstag 20:30 Uhr hier im Chat.
Wer Lust hat, kann sich gerne beteiligen. ;)
  • Hey!

    Hat jemand vielleicht Erfahrungen oder Emfehlungen zu Spracherkennungssoftware die man lokal auf dem Pi laufen lassen kann und die auch die deutsche Sprache unterstützt? Letzteres ist kein Muss.

    Ich habe mir schon Julius angeschaut und CMU Sphinx ausprobiert, womit ich allerdings wenig Erfolg hatte. Die beiden Projekte sind OpenSource, aber ich habe leider nicht das Wissen und die Möglichkeiten um das Potenzial dieser Programme auszuschöpfen, wie etwa die Erkennungsrate zu optimieren oder den Wortschatz auf meine Bedürfnisse anzupassen. Die Dokumentationen haben mich nur noch mehr verwirrt.

    Falls jemand eine fertige, breit einsetzbare Lösung hat, kennt oder idiotensicher zu vermitteln weiß, wäre ich sehr sehr dankbar! Auch nach langer Suche habe ich leider kein "Paket" gefunden indem eines dieser Programme für den Endgebrauch ausgestattet und perfektioniert drinsteckt.

    Liebe Grüße, Minja

  • Speech-to-text-engine für den Pi, Erfahrungen, Empfehlungen?? Schau mal ob du hier fündig wirst!

  • Da war doch was vor kurzem ... war das Alex oder Chris????
    Da ging es auch um offline Spracherkennung.
    Da bin ich - rein interessehalber - auch neugierig ob das auf dem RPi geht.

    Mal sehen, ich such mal wenn ich Zeit hab.

    cu,
    -ds-

    Habs gefunden: hier ... war von Alex. Vielleicht den einfach mal per PN fragen?

    cheers,
    -ds-

  • Also, er meinte es gäbe da nichts Gutes. Jetzt habe ich mir eines dieser Google Voice Recognition Skripte installiert aber es funktioniert nicht... es nimmt auf, total verrauscht, und schickt es dann irgenwie nicht ab :/

    Code
    echo "Recording your Speech (Ctrl+C to Transcribe)"
    arecord -D plughw:0,0 -q -f cd -t wav -d 0 -r 16000 | flac - -f --best --sample-rate 16000 -s -o voicefile.flac;
     
    echo "Converting Speech to Text..."
    wget -q -U "Mozilla/5.0" --post-file voicefile.flac --header "Content-Type: audio/x-flac; rate=16000" -O - "http://www.google.com/speech-api/v1/recognize?lang=en-us&client=chromium" | cut -d\" -f12  > stt.txt
     
    echo "You Said:"
    value=`cat stt.txt`
    echo "$value"

    es gibt nur "Recording [...]" aus und wenn ich strg+c drücke bricht es ab

    Einmal editiert, zuletzt von Minja (14. November 2013 um 18:26)

Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!