Herramientas/Tool Index
Tabula
Tabula es una aplicación de escritorio basada en java que permite extraer información de tablas en archivos pdf y convertirlas en un formato más amigable como .csv u hojas de cálculo.
Si alguna vez trataste de usar datos en tablas dentro de un PDF, te habrás dado cuenta de que no hay forma fácil de copiar y pegar las filas desde ese formato a una hoja de cálculo, Tabula facilita esa tarea.
Tabula está siendo usada para empoderar reportes de investigación en organizaciones de diversas áreas y tamaños, entre ellas: ProPublica, The Times of London, Foreign Policy, La Nación (Argentina), The New York Times y St. Paul (MN) Pioneer Press.
Puede ser utilizada como una herramienta con interfaz propia o puedes reutilizar Tabula-java para incorporarlo a tu proyecto: https://github.com/tabulapdf/tabula-java