Tesseract.js extrae textos de imágenes con este OCR javascript

tesseract.jpg
Solucionex
06
Nov 16

No es algo que se necesite todos los días, pero si en alguna ocasión os encontráis con la necesidad de tener que reconocer textos en imágenes "al vuelo", esta librería Tesseract.js os puede resultar de gran ayuda.

Se trata de una librería que hace OCR de la imagen que se le pase y genera un texto que puedes manipular fácilmente. La librería reconoce más de 60 lenguajes distintos y puede utilizarse tanto en el navegador como en el backend haciendo uso de Node.js. En realidad lo que han hecho ha sido portar a Javascript el motor de OCR Tesseract.

Puedes ver varias demos sencillas en su web en la que extraen textos de imágenes en ruso, inglés y chino.

Los casos en los que se puede necesitar extraer el texto de una imagen son múltiples así que solo es cuestión de que apliques esta librería a tu caso concreto.

Espero que os resulte útil :)