Inicio de automatización de Control de voz - análisis del discurso de micrófono multi-Room (4 / 5 paso)

Paso 4: Mejoras y modificaciones

Nos dimos cuenta que la transcripción del defecto realizada por esfinge es, sencillamente, terrible. Por suerte, es bastante fácil de solucionar este problema mediante la creación de un modelo de lenguaje personalizado. Esto puede restringir el rango posible de las palabras identificadas, dando como resultado menos errores de traducción.

Siga las instrucciones en el enlace de arriba para generar el modelo de lengua y descargar los archivos creados en la carpeta MultiRoomSTT. A continuación, abra main.py y proporcionar las rutas absolutas a cada archivo en las variables LM_PATH y DICT_PATH. la secuencia de comandos utiliza estos modelos de lengua la próxima vez que se ejecuta. Usted debe ver que un enorme incremento de transcripciones correctas siempre y cuando el discurso se transcribe sólo utiliza palabras de este modelo.

Cómo funciona el código:

Cuando main.py primero, busca una lista de fuentes de audio a través de la escritura de la source_discovery.py. Que script ejecuta el comando en el terminal "pacmd lista de fuentes" y analiza las fuentes de audio de los resultados, manteniendo el nombre, identificación y ruta de autobús de dispositivos de entrada. El nombre es útil para la legibilidad humana, y el ID es lo que utilizamos para identificar qué fuente de audio para grabar en.

El campo de ruta de autobús es el más interesante - contiene información acerca de puerto que el dispositivo de entrada está enchufado y puede ser referencia para determinar qué habitación un dispositivo USB es grabación de. Por ejemplo, si usted quiere tomar el audio de su sala de estar y sabes el dongle está enchufado en el puerto 6 del concentrador USB que esté conectado en el puerto 4 en su computadora, busque "usb-0:4.6:1.0" en el autobús de camino y encontrarás el ID de la mochila. Ruta de bus es persistente a través de los enchufes/desconecta y luego se reinicia, así que no tienes que ir probando IDs dispositivo al azar para encontrar el micrófono que estás buscando.

Después de reunir información de la fuente, la secuencia de comandos crea un objeto SpeechParser para cada fuente de audio y ejecuta en un bucle principal. La clase SpeechParser abstrae lejos todo el código desordenado de GStreamer: configuración de la tubería, configuración de propiedades de devolución de llamada y enlazan a la fuente de audio a PocketSphinx.

Una vez que se ejecuta el bucle principal, las tuberías escuchar en sus respectivas fuentes de audio y pasarlas a través de la esfinge (más info sobre eso aquí). Cuando la esfinge es en medio de la transcripción de una secuencia de fonemas, envía las devoluciones de llamada a través de SpeechParser a la función de partial_cb pasó con lo que piensa que escucha. Cuando el micrófono detecta silencio y Esfinge acabados análisis del discurso, el resultado se pasa a través de SpeechParser a final_cb.

Artículos Relacionados

Domótica con control de voz eco Amazonia

Domótica con control de voz eco Amazonia

El mes pasado, Amazon lanzó el eco - un pequeño cilindro capaz de reconocimiento de voz de gran alcance.El eco de sí mismo es cerrado fuente. Pero una vez que averiguar secretos de Echo, se convierte en una herramienta increíblemente poderosa para el
ESTRAGOS - domótica con Control de voz

ESTRAGOS - domótica con Control de voz

Antes de comenzar la descripción del proyecto, me gustaría agradecer a Audrey y Nicole me dan la placa Intel Edison con un montón de sensores.En este Instructable he utilizado a Intel Edison para implementar domótica con control de voz completa. Bási
UARM con CONTROL de voz – módulo EASYVR

UARM con CONTROL de voz – módulo EASYVR

Los fabricantes, estos días, hemos hecho otro caso de uso que utiliza el módulo EasyVR para controlar uArm a través del método de reconocimiento de voz.En este video, hablé 7 comandos: Start, derecha, adelante, atrás, abajo, Inicio, liberar. Módulo E
DIY los antebrazo prótesis de mano, y (control de voz)

DIY los antebrazo prótesis de mano, y (control de voz)

* actualización * sólo quería añadir un poco de cómo publicar este Instructable ha positivamente me impactó. Además de la maravillosa recepción y la retroalimentación que recibí en los concursos y el éxito que ha tenido en los concursos me ayudó defi
BRICOLAJE hogar inteligente de Control de voz

BRICOLAJE hogar inteligente de Control de voz

Si no estás familiarizado con Amazon eco - es un nuevo asistente personal que responde a los comandos de voz y, por lo tanto, realiza tareas simples para usted. Por ejemplo, puede controlar sus luces inteligentes o activar y desactivar nada enchufado
Cómo hacer un control de voz, control de dirección, control remoto, robot Android y arduino, (3 en uno)

Cómo hacer un control de voz, control de dirección, control remoto, robot Android y arduino, (3 en uno)

Esta es una versión simplificada de cualquier otro robot de control de voz, No compleja codificación fácil codificación con algoritmo fácil de entender.La aplicación está desarrollada de tal manera que convertir el comando de voz a texto y el texto d
Inteligente Robot con control de voz y visión

Inteligente Robot con control de voz y visión

Cómo hacer un robot inteligente con visión artificial, control de voz, síntesis de voz y más, usando tu teléfono Android!Paso 1: partesHardware1. un teléfono Android que soporte OTG con Android KitKat o posterior instalado. Los teléfonos más modernos
Voz controlar tu PC desde tu teléfono (android)

Voz controlar tu PC desde tu teléfono (android)

este instructable lazos con mi anterior instructable, 'voz controlada asistente PC'. Si usted no ha visto que, ir allí primero como esta ' ible se construye sobre el anterior: Este instructable le mostrará cómo controlar el asistente 'Jarvis' desde s
Agregar controles y el micrófono del iPhone Bose tranquila comodidad auriculares

Agregar controles y el micrófono del iPhone Bose tranquila comodidad auriculares

escuchar música de mi iPhone con el ruido comodidad tranquila Bose auriculares mientras trabajaba. Son grandes en mantener las distracciones a un mínimo en un ambiente un poco ruidoso. El problema es que cuando recibo una llamada tengo que llegar a m
Cómo grabar voz con micrófono USB y reproducirlo en frambuesa Pi 2

Cómo grabar voz con micrófono USB y reproducirlo en frambuesa Pi 2

Hoy, os voy a mostrar cómo grabar su voz del dongle del USB del micrófono más 2.5" micrófono jack a frambuesa Pi 2 modelo B v1.1 NOOBS cargado Raspbian sistema operativo para jugar a este registro con omxplayer que grabada por arecord controlado en f
Adición de un micrófono para el sistema de GPS Omnitech para reconocimiento de voz

Adición de un micrófono para el sistema de GPS Omnitech para reconocimiento de voz

al mismo tiempo trasteando con mi unidad he encontrado una forma fácil y rápida de añadir un micrófono a esta unidad sorda. Con un micrófono, usted será capaz de tomar ventaja de reconocimiento de voz para la navegación. Incluirá una pequeña cantidad
Inicio de automatización MSWindows XP

Inicio de automatización MSWindows XP

Mswindows: comenzando en un servidor de automatización del hogar.Ahora amigos me preguntan cómo DOMOTICA en una máquina más vieja con Microsoft windows XP para prueba de concepto. También no es un tutorial de programación. Permitever lo que podemos h
Control de voz tu Arduino

Control de voz tu Arduino

Recientemente he desarrollado una aplicación android para controlar mi robot arduino. Funcionaba bien y ahora soy un gran fan de voz control de arduino. Luego busqué algunos instructables con voz controlada por arduino y resulta que por ahí fueron só
Como las luces de Control de voz! La manera fácil!

Como las luces de Control de voz! La manera fácil!

Gracias por ver!Para hacerlo utilicé un controlador de servo micro chip, 2 servos, reconocimiento de voz de windows y algunas cintas.Primero esté conectado el regulador servo luego he descargado el software de control del servo se utilicé habla de wi