Fallstudie – Tonaufnahmen zu Analyse- und Trainingszwecken einer Spracherkennungssoftware

Problematik

Die Qualität sprachgesteuerter Systeme wird bedingt durch ihre Spracherkennung. Allerdings ist es schwierig, diese der Bedürfnisse der Nutzer anzupassen und gerecht zu werden. Es wird oft außen vorgelassen, dass das humane Handeln und Denken bei der Programmierung eine wichtige Rolle spielen. Denn die Eingaben der Anwender ist oftmals nicht zielführend und hat ein mehrmaliges Eingeben der Nutzerbefehle zur Folge, weil das System oft nicht angebracht reagiert. Oftmals erfordert es ein mehrmaliges Eingeben der Befehle, was den Anwendern Angespanntheit und Zeitverlust bringt.

Damit das System für die verschiedensten möglichen Anwendern funktioniert, muss es daraufhin mittels unzähliger Tonaufnahmen verschiedener Menschen trainiert werden.

Maßnahme

Die unzähligen KI-Trainer verschiedener Ethnien und Herkünfte starten Tonaufnahmen und testen das System auf bestimmte Reaktionen oder Informationen. Dabei ist keine Tonaufnahme gleich, sondern hängt sowohl von der Sprachweise, der Ausdrucksweise oder der Reihenfolge der Wörter ab.

Zur Optimierung der Algorithmen ist es erforderlich, dass das System unter bestimmten Voraussetzungen auf bestimmte Schlüsselwörter reagieren kann. Dafür wird eine Analyse der von unseren Trainern aufgezeichneten Tonaufnahmen vorgenommen, damit diese auf bestimmte Schlüsselwörter oder häufiges Vorkommen untersucht werden.

Dieser Vorgang dient dem Programmierer dazu, die Spracherkennungssoftware zielführend zu trainieren, um auf die einzelnen Handlungsweisen der Nutzer mit dem System umgehen zu können.

Projektdaten

Trainer-Qualifikationen: Muttersprachler aus den Zielregionen

Sprachen: 5 Sprachen

Anzahl der Sprachaufzeichnungen (im MP4-Format): 55.000 (Für jede Sprache 100 Aufnahmen zu 75 Szenarien)

Aufgaben:
1. Aufgabe: Erstellung der Audioaufnahmen
2. Aufgabe: Transkription der Aufnahmen
3. Aufgabe: Analyse und Auswertung

Qualitätssicherung: Überprüfung der Aufnahmen durch einen zweiten Trainer, dem Transkriptor

Datenübermittlung: Datentransfer via xls-Datei