Aplicación de escritorio para extraer información de tablas en archivos pdf.
- Extraer datos que se encuentren dentro de tablas en documentos con extensión PDF.
- Volver manipulables los archivos que contienen la información extraida de las tablas con extensión PDF.
Tabula es una aplicación de escritorio basada en java que permite extraer información de tablas en archivos pdf y convertirlas en un formato más amigable como .csv u hojas de cálculo.
Si alguna vez trataste de usar datos en tablas dentro de un PDF, te habrás dado cuenta de que no hay forma fácil de copiar y pegar las filas desde ese formato a una hoja de cálculo, Tabula facilita esa tarea.
Puede ser utilizada como una herramienta con interfaz propia o puedes reutilizar Tabula-java para incorporarlo a tu proyecto.

Tabula está siendo usada para empoderar reportes de investigación en organizaciones de diversas áreas y tamaños, entre ellas: ProPublica, The Times of London, Foreign Policy, La Nación (Argentina), The New York Times y St. Paul (MN) Pioneer Press.
Puedes ver el código fuente de la herramienta aquí: