ocr anleitung
ich möchte eine Text der als pdf vorliegt in ein Word-Dokument überspielen und dort bearbeiten.
1. welchen einfluss haben
die OCR-Einstellungen: downsampling und pdf Ausgabestiel
2. der Text in der pdf Datei war von einer etwas dunkleren Kopie, so dass OCR den Text teilweise nicht als solchen erkannt hat, wie kann ich den gesammten Text bearbeitbar in ein word-Dokument bekommen
Antwort schreiben
Antwort 1 von Lutz1965 vom 13.12.2019, 09:01 Options
???
Warum den Umweg über OCR ? Warum wandels Du die PDF Datei nicht ins Word Format um ?
Antwort 2 von Holger99 vom 13.12.2019, 09:25 Options
die Idee ist gut, aber wie mache ich das?
In TEXT kann man die meisten pdfs z.B. mit dem Foxit Reader umwandeln (Googeln; ca. 40 Euro, ich glaube auch Testversion möglich).
Das geht natürlich NICHT, wenn schon das pdf aus einem BILD (einem Scan) erzeugt wurde. Und es ist wohl sogar möglich, aus Texten "bildförmige" pdfs zu erzeugen.
Der Unterschied müsste eigentlich daran zu erkennen sein, ob der pdf durchsuchbar ist oder nicht (ob also ein SICHTBARES Wort auch mit der Suchfunktion gefunden wird. Denn das Suchen kann nur funktionieren, wenn "unter" dem Agezeigten tatsächlich Text vorhanden ist.