Guten Morgen,
ich hatte vor ein paar Monaten ein Bash Script geschrieben, welches eine Variable Sekunden Zeit Audio aufnimmt und das ganze mithilfe der Google Speech2Text API in einen String umwandelt. An sich funktioniert das ganze auch und bis jetzt gab es keine Probleme.
Jetzt kam mir die Idee, dass man ja ein Script schreiben könnte, mit dem solange aufgenommen wird wie gesprochen wird.
Google schafft es auf Android/Google Suche ja irgendwie auch. Meine erste Idee war es einfach immer 0.5 Sekunden aufzunehmen und dann nachzuschauen ob noch etwas zurückgegeben wird. Es hat zwar mit dem Abbrechen funktioniert, aber nun fehleten einfach Wörter, die in der Zeit der Konvertierung gesprochen wurden.
Meine nächste Idee war es ein kleines Python Script zu schreiben, welches nach jeder Aufnahme einen neuen Thread startet und dann das ganze wieder durchlaufen lässt. Allerdings dauert die init Sequenz von arecord zu lange. Auch dort werden halbe Worte abgeschnitten.
Hat jemand noch eine Idee wie man so etwas realisieren könnte oder ist der Pi einfach dafür zu schwach auf der Brust? Wenn ja würde es mich trotzdem interessieren, ob ihr noch andere Lösungsansätze habt.