Open-Source Spracherkennung: simon

Dauer: 45min

Über den Vortrag

simon ist eine Spracherkennungslösung basierend auf Julius und HTK. Das Projekt entstand aus der Idee heraus behinderten Personen die aufgrund einer körperlichen Einschränkung keinen anderen Zugang zur Schriftsprache haben eine Möglichkeit zu geben mit Ihre Sprache zu schreiben. Allerdings mussten wir in der Praxis feststellen, dass derzeit verfügbare kommerzielle Lösungen zu sehr an das "Standarddeutsch" gebunden ist, um mit begleitenden Sprachbeeinträchtigungen umzugehen. Anders als kommerzielle Lösungen bietet simon deshalb die Möglichkeit das komplette Sprach- und Akustikmodell des Systems frei zu gestalten. simon ist somit komplett Sprach- und Dialektunabhängig. simon arbeitet außerdem nicht mit fix definierten Reaktionen auf ein gewisses Erkennungsergebnis sondern lässt sich auch hier komplett frei konfigurieren. Die verschiedenen Typen von Aktionen sind über Plug-Ins realisiert und können so jederzeit erweitert werden. Im aktuellen Entwicklungsprototypen lassen sich diese individuelle Konfigurationen sogar bereits online mit anderen simon Benutzern austauschen. Eine kurze Demonstration der Erkennungsqualität der stabilen Version 0.2 gibt es online (http://www.youtube.com/watch?v=x_9ImaiOISs http://spirit.blau.in/simon/2009/12/27/video-recognize-200-german-words/). Dieser Vortrag gibt einen Einblick in die Architektur und die Funktionen von simon und zeigt wie das System in der Praxis verwendet werden kann.

Vortragender:

Peter Grasch ist Hauptentwickler von simon. Er leitet die technische Umsetzung seit dem Start des Projektes und ist Vorstandsvorsitzender-Stellvertreter im Verein simon listens.

Vortragsunterlagen:

glt10-simon.pdf

 

Zurück zur Programmübersicht...