Sprachsteuerung... auch von Unterwegs

Heute ist Stammtischzeit:
Jeden Donnerstag 20:30 Uhr hier im Chat.
Wer Lust hat, kann sich gerne beteiligen. ;)
  • Hallo,

    mein Projekt ist nicht so ganz einfach zu erklären. Da es aber schon fertig ist, möchte ich es hier kurz vorstellen. Evtl. ist es ja für den ein oder anderen auch von Interesse.

    Ich bin bei der Arbeit oft mit dem Auto unterwegs oder einfach nicht im Büro. Da man ja gewöhnlich beim Autofahren nicht mit dem Handy oder anderen Geräten rumfummeln soll, habe ich nach einer Möglichkeit gesucht Infos (egal in welcher Form) per Sprache zu bekommen und Aktionen auch per Sprache auszulösen.

    In der Praxis sieht das wie folgt aus:
    Ich habe ein Bluetooth Headset welches mit meinem Android Handy gekoppelt ist.
    Sobald ich auf das Headset tippe wird auf meinem HAndy, welches sich noch in der Hostentasche befindet eine eigens programmierte Software ausgeführt die es mir erlaubt Befehle, oder ähnliches in das Headset zu sprechen. Ihr kennt das sicher von Siri.

    So ist es mir möglich mit nur einem Tipp ans Ohr z.B. Sensordaten die ich mit meinem Raspberry aufzeichne ausgeben zu lassen (und zwar nicht auf dem Handydisplay, sondern per Sprache im Headset), oder z.B. Funksteckdosen einzuschalten die ich mit dem Raspberry steuer, oder oder oder.

    So brauche ich z.B. garnicht mehr auf mein Handy zu schauen und kann viele Dinge steuern, oder viele Infos einfordern. Das ganze wird realisiert durch eine Voice recognition Engine und eine Text to Speech Engine.

    Was wird noch benötigt?
    - Ich nutze ein Galaxy Nexus Android Phone
    - Jabra Easy Go Bluetooth Headset (geht auch mit einer Smartwatch mit Mikro etc.)
    - Raspberry Pi, auf dem ich alles auswerte (Momentan mit einem einfachen PHP Script)
    - Sensoren
    - etc.

  • Was meinst du genau mit Anleitung?
    Für die Umsetzung? Oder den Gebrauch?

  • Abend erstmal,

    @Alex
    Ich glaube er meint beides. :P
    Ein paar mehr Infos fände ich aber auch nicht schlecht.

    z.B.:

    1) Welche Sensoren benutzt du, um welche Informationen zu Hause auszulesen ?
    2) Welche "Voice recognition Engine" und welche "Text to Speech Engine" benutzt du auf dem Raspi, wie unter Android.
    3) Wie leitest du deine Informationen ins Netz. Hast du einen eigenen HTTP oder Voice-Server oder ähnliches aufgesetzt ?
    4) Du hast eine eigene App für Android gebaut, um deine Ziele umzusetzen. Wie sieht diese genau aus ? Leitet sie nur Informationen durch und läuft im Hintergrund oder wie muss man sich das vorstellen ?
    5) Da du den Server über dein Handy erreichst, musst du diesen bzw. die Ports ja freigegeben haben. Wie siehts mit dem Sicherheitsaspekt aus ? Ist dein Server irgendwie speziell abgesichert.

    Ansonsten erstmal Respekt für deine Leistung !

    Gruß,

    bl4ckOut


  • 1) Derzeit nur einen Temperatur Sensor, da gibt es ja hier schon einige Tut's zu!
    2)Beides von Google über Android
    3) Nein, es reicht ein einfacher Http Server wie Apache, nginx oder lighttpd mit php
    4) Um Ressourcen und Akku zu sparen startet die APP bei einem Tastendruck auf das HEadset und lauscht dann bis zum Kommandoende gibt die Daten per Sprache wieder, danach schließt sich die App wieder von alleine.
    5) Es benötigt keinerlei extra Einstellungen... Alle Daten werden per HTTP Post übergeben und mit einem Md5 Hash gesichert.


    So, nochmals kurz erklärt wie das ganze genau abläuft:
    Ich habe ein Headet auf welches ich nur antippen muss um meine erstellte APP auf dem Android Phone in meiner Tasche zu starten.

    Diese App lauscht ab da auf ein Kommando (Beispiel: Wieviel Grad sind es, Schalte Lamp X ein, etc).
    Diese APP wandelt dann das gesprochene noch auf dem Phone in Text um und sendet diesen an den HTTPServer (Raspberry PI) per HTTP Post an ein PHP Script.
    In diesem Script prüfe ich was das Kommando will, führe es aus und gebe eine Ausgabe zurück an das Android Phone (Beispiel: Es sind derzeit 21°C, Lampe X eingeschaltet). Die APP sagt mir dann per TexttoSpeech genau diese Ausgabe.

    Das ganze funktioniert natürlich in Echtzeit innerhalb von Sekunden.

    Alles ist noch in Beta, wer aber Lust hat kann das ganze ja mit oder Ohne Headset (dann muss man die APP von HAnd öffnen) testen.
    Die APP ist oben verlinkt.

Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!