19

Aplicación de escritorio para extraer información de tablas en archivos pdf.

Funciones principales
  • Extraer datos que se encuentren dentro de tablas en documentos con extensión PDF.
  • Volver  manipulables los archivos que contienen la información extraida de las tablas con extensión PDF.
Descripción

Tabula es una aplicación de escritorio basada en java que permite extraer información de tablas en archivos pdf y convertirlas en un formato más amigable como .csv u hojas de cálculo. 

 

Si alguna vez trataste de usar datos en tablas dentro de un PDF, te habrás dado cuenta de que no hay forma fácil de copiar y pegar las filas desde ese formato a una hoja de cálculo, Tabula facilita esa tarea.

 

Puede ser utilizada como una herramienta con interfaz propia o puedes reutilizar Tabula-java para incorporarlo a tu proyecto.

reconocimiento-de-columnas

 

Tabula está siendo usada para empoderar reportes de investigación en organizaciones de diversas áreas y tamaños, entre ellas: ProPublica, The Times of London, Foreign Policy, La Nación (Argentina), The New York Times y  St. Paul (MN) Pioneer Press. 

 

Lenguaje de programación
Java
HTML
CSS
Javascript
1