MOUNTAIN VIEW (IT BOLTWISE) – Apps zur Spracherkennung für Smartphones werden bisher in der Cloud ausgeführt und neigen deshalb zu ausgeprägten Latenzen. Zugunsten kürzerer Antwortzeiten soll neue Software die Sprachverarbeitung bald lokal durchführen. Eine erste Version für Pixel-Phones wird bald ausgeliefert.


Google hat eine neue Software für Spracherkennung angekündigt, die auf dem Smartphone statt auf dem Server ausgeführt wird. Sie gehört zu Gboard, der virtuellen Tastatur von Google. Zunächst wird diese App nur für Geräte der Marke Pixel von Google erhältlich sein. Diese erste Ausführung funktioniert nur mit amerikanischem English. Später soll die Software auch für andere Geräte und weitere Sprachen zur Verfügung stehen.

Derzeit arbeitet die Sprachverarbeitung mit Verzögerungen, die von Millisekunden bis mehrere Sekunden reichen können. Das ist noch unvermeidlich, bedingt durch Antwort- und Signallaufzeiten sowie die Verarbeitung auf Servern im Internet. Die Verarbeitung auf dem Gerät selbst ist bisher schwierig, bedingt durch die benötigte Rechenleistung und den Stromverbrauch.

Verbesserungen bei der Hardware und den Algorithmen der Sprachverarbeitung sollen das jedoch zunehmend möglich machen. Auch der Speicherbedarf für die Sprachdaten wird geringer. Mit Kompression hat Google die Sprachdaten auf dem Gerät auf 80 MB reduziert. Durch weitere Verbesserungen von Hard- und Software soll die lokale Sprachverarbeitung zukünftig für mehr Sprachen und weitere Anwendungen verfügbar sein.

Die ersten Smartphones reagieren in Sekundenbruchteilen auf Spracheingabe.
Die ersten Smartphones reagieren in Sekundenbruchteilen auf Spracheingabe. (Bild: Pixabay)



Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de
Unternehmen
34 Shares

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert