Paso 6: Instalar el motor de reconocimiento óptico de caracteres (OCR)
El motor de OCR convierte el archivo de imagen que tenemos del libro en texto. Estamos utilizando el Motor de OCR Tesseract. Funciona bien en la Raspberry Pi, que no requiere una conexión en línea y confiablemente convierte imágenes a texto.
En primer lugar, instalar tesseract:
sudo apt-get install tesseract-ocr
A continuación, probar el motor de OCR.
Tomar una buena imagen de un fragmento de texto, en un libro o un ebook y ejecutar tesseract:
tesseract image.jpg o
donde image.jpg es la imagen que fue tomada por la cámara de frambuesa pi y o es el archivo donde se guardará el texto (tesseract hará o.txt por lo que no es necesario añadir la extensión).
Ahora, esperar unos minutos, la OCR requiere mucha potencia de procesamiento.
Cuando su proceso hecho, o.txt abierto. En nuestra experiencia, el reconocimiento fue > 90% y funciona mejor con tamaño de letra más grande. Si el OCR no detectó nada en absoluto, intente girar la imagen y ejecutar de nuevo el tesseract.