Deanna
VIS (Voice Input System) Eine Hardware-Software, die es einem Computer ermöglicht, die menschliche Stimme zu erkennen. Eine Hardware=Software-Kombination, die gesprochene Wörter in digitale Daten umwandeln kann, wird als Voice-Input-System bezeichnet. Wenn Sie über die komplexe Arbeit nachdenken, die Menschen beim Dolmetschen von Sprache leisten, können Sie die Herausforderung erkennen, Technologie zu entwickeln, die dasselbe tut. Zwei Personen können dasselbe Wort aufgrund von Akzenten, persönlichen Sprachstilen und der einzigartigen Qualität der Stimme jeder Person unterschiedlich aussprechen. Forscher haben eine Reihe von Tricks ausprobiert, um die Hindernisse zu überwinden, die der Mensch auf natürliche Weise ausgleicht.
Viele Spracheingabesysteme sind so konzipiert, dass sie unsere Hintergrundgeräusche abschirmen und kein Training von Benutzern akzeptieren, die Wörter wiederholen, bis das System die Muster in ihren Stimmen erkennt. einige Systeme vom Spracheingabetyp können nur eine begrenzte Anzahl von isolierten Wörtern erkennen, während andere versuchen, ganze Sätze zu erkennen, die aus kontinuierlicher Sprache bestehen. Dieser spätere Typ wird allgemein als kontinuierliches Spracherkennungssystem bezeichnet.
Produkte mit kontinuierlicher Erkennung haben in den letzten Jahren dramatisch an Qualität gewonnen und sind im Preis gefallen. Sie zahlen weniger als 200 US-Dollar für ein System, das über 250.000 Wörter erkennen kann. Die heutige Hauptanwendung für die kontinuierliche Spracherkennung ist das Diktieren.
Heidi
Spracheingabe oder Spracherkennung ist die einfachste Methode der Dateneingabe, auch für Leute, die nicht tippen können. Ein Benutzer gibt Daten unter Verwendung eines Mikrofons ein. Die einfachste Form sind die sprecherabhängigen Systeme, bei denen der Bediener dem Computer beibringen muss, die Wörter und den Akzent zu erkennen. Der Sprecher liest den Text in den Computer ein, um ihn an diese bestimmte Stimme anzupassen.
Lautsprecherunabhängige Systeme sind komplexer. Sie können ohne Schulung einen festen Satz von Wörtern von verschiedenen Sprechern mit unterschiedlichen Akzenten verstehen. Das Problem hier ist der begrenzte Wortschatz. Die einfacheren Systeme können nur wenige Wörter erkennen, die als Ein-Wort-Befehle verwendet werden, die komplexeren können bis zu 1.000 Wörter mit kontinuierlicher Sprache erkennen. Heute besteht das Problem darin, dass unterschiedliche Akzente und Wörter, die ähnlich klingen, unterschiedliche Bedeutungen haben, wie hier, Erben hören und somit Probleme verursachen.
Diese Systeme werden wirklich benötigt, wenn die Hände mit einer Operation beschäftigt sind und die Person Daten eingeben möchte. Wie bei der Inspektion und Qualitätskontrolle verwendet der Inspektor beide Hände und eine gleichzeitige Dateneingabe ist nicht möglich. Der Inspektor listet Fehler verbal in das Mikrofon des Computers auf, anstatt sie aufzuschreiben.
Ebenholz
Hallo. Ich kann Ihnen einen Service empfehlen, wenn Sie Hilfe beim Überspielen von Texten benötigen. Der Dienst übersetzt dank der Stimmen auf der Website Text in Sprache , und es gibt mehr als 100 davon.