Was ist automatisierte Sprache-Erkennung?

Automatisierte Spracheerkennung (ASR) ist eine Technologie, die entworfen, um zu erlauben, gesprochene Sprache digitalisiert zu werden, gespeichert zu werden und manipuliert. Sie hauptsächlich verwendet in der Textverarbeitung und der Übersetzung, aber auch eingeschlossen in den Programmen ng, die für Akzentverkleinerung und Sprachetherapie entworfen. Sie auch begrenzt Anwendungen im Feld der Sicherheit zu den Sprachkennzeichnungszwecken.

Automatisierte Spracheerkennung hatte seinen Anfang in den fünfziger Jahren, und die Forschung finanziert gemeinsam von der Verteidigung und von den Nachrichtendienstgemeinschaften. Die Technologie, die erfordert, um sie nützlich zu bilden, existierte nicht zu der Zeit, und die Anfangsarbeit war nicht fruchtbar. Während Technologie voranbrachte, verschob die Entwicklung der automatisierten Spracheerkennung auf unmilitärischen Gebrauch wie Lieferung der Computerzugänglichkeit für die untaugliche und mündliche Textverarbeitung.

Die grundlegendste Art der automatisierten Spracheerkennung ist getrennter Eingang. Dieses ist eine einfache Methode, in der jedes Wort und Phrase mit einer Pause zwischen ihnen ausgesprochen. Es lässt den Benutzer auf eine gestelzte Art und Weise sprechen und hervorhebt die Erklärung jedes einzelnen Wortes elnen. Entsprochen zu den langsameren Prozessoren und zu weniger vorgerückten Programmen, ist diese Methode, in hohem Grade genau aber ist in seiner Implementierung sehr langsam.

Die Entwicklung der schnelleren Computer und komplizierteren der Programmierung geführt zu das ununterbrochene sprechende System, das den Sprecher ermöglicht, in einer normalen Methode mit vollen Sätzen und einem regelmäßigen Rhythmus zu sprechen. Dieses Lautsprecher-abhängige Programm erlernt, wie der Benutzer als Einzelperson spricht und dann seine Vorhersagen für die Wortwahl kopiert, die auf dem tatsächlichen Lautsprecher basiert. Dieses Wissen bildet das Programm sehr genau, aber nur für die Einzelperson, die es erlernt, zu verstehen.

Es gibt auch unabhängige und anpassungsfähige Technologien, die mit jedem möglichem Benutzer arbeiten. Diese Programme enthalten komplizierte Subroutinen mit vorbestimmten Eigenschaften, die Phoneme gegen eine große Datenbank analysieren und dann den Text erstellen. Diese Art des Programms anpaßt, wenn fehlerhafter Eingang Benutzer-behoben, und er bildet dann die passende Folgerung nächstes Mal, der er dieses Wort antrifft. Diese Methode ist nicht so genau wie das Benutzer-abhängige System, wegen der unvereinbaren Art des Sprechens zwischen Benutzern. Die meiste moderne Software umfaßt abhängige, unabhängige und anpassungsfähige Technologie, und sie rühmt eine Anerkennungsrate von mehr als 90 Prozent.

Automatisierte Spracheerkennungtechnologie ist angetroffenes tägliches. Bänke und andere Sektoren verwenden sie in den Telefonkommunikationen und erlauben dem Kunden, Fragen anzugeben und die verschiedenen Menüwahlen durchzulaufen. Die Gerichtsreporter, die Sprachschalldämpfer verwenden, in der Lage sind, Nebengeräusch im Gerichtssaal zu beseitigen und eine vollkommene Abschrift von Gerichtsverfahren zur Verfügung zu stellen. Schließlich in einer Rückkehr zu seinem ursprünglichen Zweck, verwendet militärische Einheiten automatisierte Spracheerkennung in den Zweiwegphraselators, die sofortige Übersetzung auf dem Schlachtfeld ermöglichen.