Avanzado sistema OCR ABBYY FineReader 10

La última versión del software deOCR, o herramienta de reconocimiento óptico de caracteres, de Abbyy casi se podría considerar como una completa herramienta ofimática debido a la cantidad de posibilidades y prestaciones que encierra

Fernando Reinlein

5 julio 2010

Por ejemplo, es capaz de generar un PDF desde casi cualquier formato de origen. Su sencilla interfaz resulta muy accesible para el usuario, pues se distribuye en tres áreas: una superior, donde se ubica el menú principal, y otras dos para representar las páginas escaneadas (panel izquierdo) y el resultado de la exploración (panel derecho).

Entre las mejoras que presenta respecto a versiones anteriores, hay que destacar la integración de funciones de forma directa, es decir, podemos realizar acciones concretas y completas con un solo clic de ratón a través del menú que se nos ofrece en el margen izquierdo. Tanto es así que es factible convertir un documento PDF directamente a Excel o escanear una carta escrita en papel y obtener un fichero de Word. Pero, sin duda, las dos mejores opciones de acción directa incluidas son la de digitalizar desde el escáner un documento logrando directamente un archivo HTML y la de explorar un PDF para convertirlo a Microsoft Word conservando las fuentes y el diseño de la maquetación. A estas capacidades se accedía en versiones anteriores a través de un largo y laborioso proceso que ahora ha sido simplificado al máximo.

Otra novedad es el reconocimiento de caracteres en las imágenes capturadas desde teléfonos móviles y cámaras digitales, así como las opciones de corrección de las mismas (tanto de las tomadas con estos dispositivos como las procedentes de otras fuentes), que abarcan desde la reducción del ruido a la mejora de imágenes borrosas o la corrección de deformaciones.

Abby5

Rendimiento sin errores

En nuestras pruebas, hemos procedido a explorar un PDF de 48 páginas en color con textos en distintas fuentes, imágenes y algunas tablas. En concreto, optamos por la opción Archivo PDF a Word y elegimos el idioma español. El resultado lo podemos calificar de impecable. Todas las palabras, sin excepción, que están en castellano las reconoce, así como las distintas áreas con distintos elementos de información, imágenes, tablas, etc.; y la maquetación original del documento se respeta, tanto en lo que se refiere a su estructura como a la fuente original.

Además, en las pruebas realizadas, comprobamos que aquellas palabras que no reconoce, los errores, los marca en el margen derecho y, gracias a los botones de la parte superior, Revisar ortografía, Error siguiente y Error anterior, podemos ir desplazándonos a través de ellos y proceder a corregirlos.

A la hora de exportar el resultado del reconocimiento a un fichero, nos da la opción de convertirlo en un PDF, DOC, una hoja de Excel (XLS) o un documento HTML. Igualmente, sirve de conversor entre estos formatos, con lo que, por ejemplo, de un HTML podríamos obtener un Word o un Excel.

Temas Relacionados