Texterkennung OCR für PDFs auf dem Raspberry

Heute ist Stammtischzeit:
Jeden Donnerstag 20:30 Uhr hier im Chat.
Wer Lust hat, kann sich gerne beteiligen. ;)
  • Ich versuche PDFs oder auch andere Dateien per Texterkennung für Recoll aufzubereiten. Leider ist mir das bisher nicht gelungen. Ich versuche mit OCRmyPDF die Dateien zu bearbeiten. Das funktioniert mit Version v1.1-stable nicht oder nicht mehr, da alle PDFs angeblich eine falsche Auflösung haben: “Resolutions difference (290.42016/277.05463) higher than expected (.81716). Exiting…”
    Versionen > 1.1 funktionieren auf dem Raspberry jedoch nicht, da die abhängigen Pakete wie tesseract-ocr oder GNU für Wheezy nicht verfübar sind.
    Hat jemand eine Idee wie man Dateien (PDF, TIF oder jpeg) auf dem Raspi aufbereiten kann, damit Sie durchsucht werden können? Inspiriert wurde ich von Foxdox, nur möchte ich meine Daten selber aufbereiten und auch hosten...

Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!