Herramientas/Tool Index
Tabula
Tabula é um aplicativo de desktop baseado em java que permite extrair informações de tabelas em arquivos PDF e convertê-los em um formato mais amigável, como .csv ou planilhas.
Se você já tentou usar dados de tabela em um PDF, deve ter percebido que não há uma maneira fácil de copiar e colar linhas desse formato em uma planilha, mas o Tabula torna isso mais fácil.
Tabula está sendo usado para capacitar a reportagem investigativa em organizações de vários setores e tamanhos, incluindo: ProPublica, The Times of London, Foreign Policy, La Nación (Argentina), The New York Times e St. Paul (MN) Pioneer Press.
Ele pode ser usado como uma ferramenta com interface própria ou você pode reutilizar Tabula-java para incorporá-lo ao seu projeto: https://github.com/tabulapdf/tabula-java