Un software o aplicación OCR (Optical Character Recognition – Reconocimiento Óptico de Caracteres) tiene como función el reconocer las palabras escritas en una imagen digitalizada, para que estas puedan ser editadas y manipuladas desde el computador. Esta tecnología resulta muy útil para crear documentos digitales a partir de textos escritos en papel.
La digitalización de la información (textos, imágenes, sonidos, etc) ha tenido un gran punto de interés para la sociedad. En el caso concreto de los textos existen y se generan continuamente grandes cantidades de información escrita (libros, manuscritos, proyectos, etc). En estos casos, poder automatizar el proceso de la introducción de caracteres evitando la escritura por teclado, implica un importante ahorro de recursos humanos y un aumento de la productividad, mejorando, la calidad de muchos servicios de información organizada.
Para aprovechar las ventajas del OCR existen una gran variedad de herramientas entre software y aplicaciones web, que puede servirnos para realizar este proceso, por eso aquí vamos a hacer un repaso por algunas de las mejores.
OCR Online (Gratuito)
No hay nada mas útil para nosotros que una aplicación web rápida, eficiente y de uso gratuito. Con Ocronline, podemos convertir en segundos un documento escaneado, en texto editable, en formato rtf, doc, txt o incluso convertirlo a un pdf.
Utilizarlo es muy fácil. Solo debemos cargar la imagen escaneada, seleccionar el idioma del texto y el formato que queremos que tenga, en este caso podemos escoger entre doc, rtf, txt y pdf, y listo en pocos segundos podremos editar la imagen escaneada, ahora convertida a texto.
Free OCR (Gratuito)
Es una aplicación web que nos permite obtener el texto de cualquier imagen en formato JPG, GIF, TIFF, BMP o PNG o documento PDF, reconociendo muchos idiomas, entre ellos el español. Los requisitos a tener en cuenta son que las imágenes no pueden ser mayores a 2MB y tampoco puedes procesar más de 10 páginas por hora. Para realizar este proceso de reconocimiento de caracteres no es necesario el registro, tan solo te piden una dirección de email.
TopOCR (De pago)
Es una potente herramienta de OCR, especializado en importar texto de imágenes en formato digital. Así, sin necesidad de escáner, y usando una simple cámara digital, siendo bastante util para las personas que no cuentan con un escáner o impresora multifunción. TopOCR obtiene el contenido de una página de libro o de un documento cualquiera. A partir de ahí, esta utilidad te ofrece funciones de edición de texto para encontrar un fragmento concreto, cambiar el formato, tamaño de la letra y guardar el documento en los siguientes formatos TXT, RTF, HTM o PDF. TopOCR puede ofrecerte resultados excelentes, siempre y cuando la imagen sea de buena calidad, el fondo sea blanco y el texto de un tono oscuro (preferiblemente negro).
Readiris (De pago)
Es una utilidad de gran beneficio para escanear todo tipo de documentos, de una o de múltiples páginas, interpretando caracteres y convirtiéndolos a un documento editable, permitiéndote ahorrar mucho tiempo evitando en escribir documentos o libros. Una vez escaneado el texto y reconocido, puede crear y abrir un documento Word con el texto ya insertado en él. También puede guardarlo como una imagen o copiar el texto al portapapeles. En el caso de no disponer de escáner pero sí de cámara digital puedes «capturar» los documentos con ella, ya que Readiris puede importar y analizar imágenes también de un archivo.
Espero esta información les sea de mucha utilidad y se animen a probar algunas de esta aplicaciones, nos comenten sus experiencias y lo compartan con sus amigos.
Muy buen artículo. Debería incluirse el abby finereader es una app muy buena para Ocr
muchas gracias y posteado
Con OneNote de Microsoft Office tambien se puede realizar la extraccion de texto