¿Qué es el sistema de entrada de voz?

3 Respuestas


  • VIS (Sistema de entrada de voz) Un software de hardware que permite que una computadora reconozca la voz humana. Una combinación de hardware = software que puede convertir palabras habladas en datos digitales se conoce como sistema de entrada de voz. Si se detiene a pensar en el trabajo complejo que hacen los humanos al interpretar el habla, puede apreciar el desafío de diseñar tecnología para hacer lo mismo. Dos personas pueden pronunciar la misma palabra de manera diferente debido a los acentos, estilos personales de habla y la calidad única de la voz de cada persona. Los investigadores han probado una serie de trucos para superar los obstáculos que los humanos compensan de forma natural.

    Muchos sistemas de entrada de voz están diseñados para filtrar nuestros ruidos de fondo y no aceptan capacitación de los usuarios, quienes repiten palabras hasta que el sistema reconoce los patrones en sus voces. algunos sistemas de entrada de voz pueden reconocer solo un número limitado de palabras aisladas, mientras que otros intentan reconocer oraciones completas compuestas de habla continua. Este último tipo se denomina comúnmente sistema de reconocimiento de voz continuo.
    Los productos de reconocimiento continuo han aumentado drásticamente en calidad y han bajado de precio en los últimos años. Puede pagar menos de $ 200 por un sistema que puede reconocer más de 250.000 palabras. La principal aplicación actual del reconocimiento de voz continuo es el dictado.
  • La entrada de voz o el reconocimiento de voz es el método más fácil de entrada de datos, incluso para las personas que no saben mecanografiar. Un usuario ingresa datos usando un micrófono. La forma más simple son los sistemas dependientes del hablante, en los cuales el operador tiene que entrenar a la computadora para identificar las palabras y el acento. El hablante leyó el texto en la computadora para adaptarlo a esa voz en particular.

    Los sistemas independientes de los altavoces son más complejos. Pueden entender un conjunto fijo de palabras de diferentes hablantes con diferentes acentos sin ningún tipo de formación. El problema aquí es el vocabulario limitado. Los sistemas más simples pueden reconocer solo unas pocas palabras, utilizadas como comandos de una palabra, los más complejos pueden reconocer hasta 1,000 palabras con voz continua. Hoy en día, el problema son los diferentes acentos y palabras que suenan igual teniendo diferentes significados como por ejemplo aquí, escuchar heredero y así causar problemas.
    Estos sistemas son realmente necesarios cuando las manos están ocupadas en alguna operación y la persona quiere ingresar datos. Al igual que en la inspección y el control de calidad, el inspector usa ambas manos y no es posible ingresar datos simultáneamente. El inspector enumera verbalmente los defectos en el micrófono de la computadora en lugar de detenerse a escribirlos.
  • Hola. Puedo aconsejarle un servicio si necesita ayuda para el doblaje de texto. El servicio traduce texto a voz gracias a las voces que hay en el sitio, y hay más de 100 de ellas.

Escribe tu respuesta

Tu respuesta aparecerá después de la moderación