Paso 3: El Software
Ahora necesitarás unos paquetes de software instalados antes de que podemos ejecutar nuestro código. Copie y pegue el siguiente comando en tu terminal para ello:
sudo apt-get update && sudo apt-get install git python-gst0.10 gstreamer0.10-pocketsphinx
También necesita algún código repetitivo a todo correr - nosotros hemos proporcionado aquí. después de navegar hasta donde desea los archivos, instale con este comando:
git clone <a href="https://github.com/smartin015/MultiRoomSTT.git" rel="nofollow"> https://github.com/smartin015/MultiRoomSTT.git</a>
Por último, cambie el directorio a MultiRoomSTT y ejecute el archivo principal:
python main.py
La secuencia de comandos listará todos los dispositivos de entrada de audio que puede encontrar. Pulse enter, y un montón de texto de configuración se ejecutará por. Hablando en el microfono que ha configurado mostrará un montón de líneas del siguiente formato:
(<translation id>) <audio id>: <transcription>
Estos son los resultados parciales de la transcripción - la identificación de la traducción sigue siendo la misma hasta que termine la transcripción, en ese momento verás una línea comenzando con "###" para indicar una transcripción completa. El ID de audio indica que dispositivo de audio está siendo transcrito, y la transcripción indica lo que pensaba de la esfinge oyó a través del micrófono.
Si has hecho esta lejos, Felicidades! Ya tienes una configuración de trabajo multi-micrófono voz a texto. Pero estamos seguros de que te gustaría mejor exactitud de transcripción y tal vez un vistazo bajo el capó el script de python.
Siga leyendo para saber más acerca de ambos!