Was ist Sprachanerkennung?

Sprachanerkennung kann eine von auf zwei Arten Informatik sich beziehen: gerichtliche Sprachkennzeichnung oder Rede-zutext Fähigkeit. Dieser Artikel adressiert die letzte Definition.

Sprachanerkennung oder Spracheerkennung in diesem Fall, ist- eine Computertechnologie, die Audioeingang für hereinkommende Daten eher verwendet, als eine Tastatur. In ein Mikrofon z.B. sprechen liefert das gleiche Resultat wie schreibenwörter manuell mit einer Tastatur. Einfach angegeben, ist Sprachanerkennungs-Software mit einer internen Datenbank der erkennbaren Wörter oder der Phrasen entworfen. Das Programm bringt die Audiounterzeichnung der Rede mit entsprechenden Einträgen in die Datenbank zusammen.

Obwohl drehenrede in Text einfach klingen konnte, ist es eine extrem schwierige Aufgabe. Die Problemlügen in der praktisch endlosen Reihe der einzelner Sprachemuster und -akzente, zusammengesetzt durch die natürliche menschliche Tendenz, Wörter zusammen laufen zu lassen.

Eine Abbildung der zugehörigen Herausforderungen von Sprachanerkennungs-Software erscheint auf einem T-Shirt, das von den Apple-Forschern hergestellt wird. Das Hemd liest, „ich half Apple, einen netten Strand zu ruinieren.“ Wenn es laut gesprochen wird, klingt es wie, ich half Apple, Rede zu erkennen.

Verschiedene Modelle von Sprachanerkennungs-Software werden für eine Reihe Anwendungen, vom persönlichen Diktat zur automatisierten Anrufhandelswegewahl, von der Unterstützung das untaugliche zum Sport und Nachrichtenereignis zu subtitling benutzt. Jedes Modell benimmt sich anders als und hat seine eigenen Fähigkeiten und Grenzen.

Sprachanerkennungsprogramme, die den Benutzer erfordern, die Software „auszubilden“, um ihre bestimmten stilisiert Muster der Rede zu erkennen, werden Lautsprecherabhängigsysteme genannt. Einzelpersonen benutzen allgemein diese Arten von Programmen zu Hause oder im Büro. EMail, Protokolle, Buchstaben, Daten und Text können durch das Sprechen in ein Mikrofon eingegeben werden.

Einige Sprachanerkennungssysteme, genannt getrennte Sprachesysteme, erfordern den Benutzer, offenbar und langsam zu sprechen und Wörter zu trennen. Ununterbrochene Sprachesysteme sind entworfen, um einen natürlicheren Modus des Sprechens zu verstehen.

Getrennte Sprachesprachanerkennungssysteme sind- für Kundendienstwegewahl am meisten benutzt. Das System ist sprecherunabhängig, aber versteht nur eine kleine Lache von Wörtern oder von Phrasen. Dem Anrufer wird eine Wahl gegeben, zum einer Frage, normalerweise mit „ja“ zu beantworten, oder „Nr.“, nachdem es eine Antwort, das System empfangen hat, entwickelt sich den Anrufer zum folgenden Niveau. Wenn der Anrufer mit einer einzigartigen Antwort antwortet, ist die automatisierte Antwort normalerweise, „traurig, ich verstand Sie nicht; ,“ mit einer Wiederholung der Frage und der vorhandenen Antworten bitte noch einmal versuchen. Diese Art der Sprachanerkennung gekennzeichnet auch als Grammatik begrenzte Anerkennung.

Ununterbrochene Rede ist eine hoch entwickeltere Form von Sprachanerkennungs-Software, worin der Anrufer natürlich sprechen kann, um ein Problem zu erklären oder einen Service zu fordern. Dieses Programm ist entworfen, um Schlüsselwörter auszuwählen, oder Phrasen und ein statistisches zu bilden gut-schätzen hinsichtlich, was der Kunde wünscht. Einfach sprechen unterstützt Sprachanerkennung, wenn es die Notwendigkeit kennzeichnet. Diese Art des Systems hat eine weit intensivere Datenbank als diskrete Sprachesysteme und gekennzeichnet auch als in einer natürlichen Sprache Anerkennung.

Automatische Sprache-Erkennung (ASR) ist ein Modell der Spracherkennung von entwürfen für Diktat. Diese Software unterscheidet sich von den vorhergehenden Modellen dadurch, dass sie sich nicht bemüht, zu verstehen, was gesagt wird, nur die Wörter kennzeichnen gesprochen. Seit vielen Wörtern im englische Sprachton gleich, werden Fehler leicht gemacht. Jedoch investieren Hauptfirmen wie Microsoft in der Sprachanerkennung, und Bill Gates eigene Vorhersage hat ASR, ununterbrochene Rede bis zum dem Jahr 2011 zu verstehen. Asr-Software wird häufig auf digitalen Sprachaufzeichnungsanlagen gefunden.

Dominierende Spieler in der Sprachanerkennungs-Software sind ScanSoft und Nuance gewesen-, wenn die ehemalige Firma die letzteren erwirbt. Kleinere Spieler schließen Fonix Rede, Aculab und Verbio unter anderem mit Hauptkorporationen wie IBM und vorher erwähnten Microsoft, das auch in der Technologie investiert mit ein. Obwohl viele noch glauben, ist es mehr Mühe, zum von Software und von korrekten Fehlern, als auszubilden, eine Tastatur einfach zu benutzen, eine Zeit kommt, wenn Sprachanerkennungs-Software wahrscheinlich diesen Abstand schließt. Tastaturen mit der absondernfähigkeit zu vergrößern, Rede zu verwenden wird vermutlich alltäglich.

Sprachanerkennungs-Software gewinnt Popularität, während sie hoch entwickelter wird. Es ist im Geschäft besonders nützlich, in dem sie einen Phasenoperator ersetzen kann, um Anrufe zu konzentrieren, Informationen zu verbreiten, Aufträge zu nehmen und andere in hohem Grade nützliche Aufgaben wahrzunehmen. Jedoch gewinnt es auch Bevorzugung als Desktop-Anwendung, entlang geholfen durch berühmte Software wie ScanSofts, DragonNaturallySpeaking und IBMs ViaVoice.