[Okfn-se] Data ur skannade pdf-filer

Mattias mattias at okfn.se
Fri Apr 11 08:51:18 UTC 2014


On 10/04/14 20:00, Erik Hjärtberg wrote:
> Tabula är inte ett användbart program i det här sammanhanget .
>
> "Note: Tabula only works on text-based PDFs at this time, not scanned
> documents."
>
> Källa: http://tabula.nerdpower.org/
Ah, super. Bra att du hittade det, jag missade det!
>
> Vidare finns det ett flertal program som kan konvertera pdf-filer,
> även skannade sådana, till txt-filer. Så kallade OCR-program. Ett
> sådant är YAGF:
>
> http://www.symmetrica.net/cuneiform-linux/yagf-en.html
Ser intressant ut. OCR-program med Tesseract är väldigt intressanta,
finns mycket potential där.
>
> Fast hur får jag sedan txt-filen till ett snyggt kalkyldokument? Det
> har jag inte lyckats med hittills.
Gjorde en snabb sökning "txt to excel / spreadsheet". Detta var vad jag
hittade:
https://stackoverflow.com/questions/14618326/how-to-import-a-text-log-file-into-a-excel-columns
https://stackoverflow.com/questions/18293175/how-to-convert-pdf-files-to-spreadsheets-with-ubuntu

//Mattias
>
>
> Erik Hjärtberg
>
>




More information about the okfn-se mailing list