Anwendungs-Software und Apps 14.489 Themen, 73.614 Beiträge

Kopierter Inhalt aus PDF-Datei nach Einfügen in Word unlesbar

mawe2 / 5 Antworten / Baumansicht Nickles

Hallo,

ich habe eine PDF-Datei, in der das Kopieren von Inhalten erlaubt ist und die auch nicht verschlüsselt ist.

Trotzdem erhalte ich beim Kopieren von Textpassagen völlig kryptische Zeichen, wenn ich den Inhalt in Word (oder anderswo) einfüge.

("#$!%&'#($!$#)$*!%$)*+,$)!*#)-!)./!*+,0$/!$/1$))23/4!)

Das Problem tritt sowohl im Adobe Reader als auch im Foxit Reader auf.

Woran kann es liegen? Gibt es Abhilfe?

Gruß, mawe2

bei Antwort benachrichtigen
Maybe mawe2 „Kopierter Inhalt aus PDF-Datei nach Einfügen in Word unlesbar“
Optionen

Moin,

hört sich jetzt banal an, aber hast Du mal versucht, die Schriftart in Word zu ändern. Für mich sieht das nach Sonderzeichen aus!?

Einfach mal den kopierten und eingefügten Text in Word makieren und einen andere Schrift auswählen.

Gruß
Maybe

"Es gibt nur eine falsche Sicht der Dinge: der Glaube, meine Sicht sei die einzig Richtige!" (Nagarjuna, buddhistischer Philosoph)
bei Antwort benachrichtigen
Fieser Friese Maybe „Moin, hört sich jetzt banal an, aber hast Du mal versucht, die Schriftart in...“
Optionen

Moin,

vermutlich ist in dem PDF-Dokument eine eigene Schriftart eingebunden.

bei Antwort benachrichtigen
mawe2 Nachtrag zu: „Kopierter Inhalt aus PDF-Datei nach Einfügen in Word unlesbar“
Optionen

Danke erstmal.

An der Schriftart liegt es (leider) nicht. Die Zeichen sind ja keine Zeichen einer Symbolschriftart sondern Bestandteile jeder gewöhnlichen Text-Schriftart.

Außerdem tritt das Problem auch auf, wenn man den Text z.B. in ein Notepad-Fenster kopiert, wo ja Schriftarten sowieso ignoriert werden.

Es scheint mir eher so, dass es eine spezielle Verschlüsselung ist, die aber in den Eigenschaften der PDF-Datei nicht erwähnt wird. Gibt es sowas?

Kann man ein PDF-Dokument so schützen, dass der Schutz in den Dateieigenschaften nicht angezeigt wird, die Inhalte aber dann trotzdem nicht (sinnvoll) kopierbar sind?

Gruß, mawe2

bei Antwort benachrichtigen
Maybe mawe2 „Danke erstmal. An der Schriftart liegt es leider nicht. Die Zeichen sind ja...“
Optionen
Kann man ein PDF-Dokument so schützen, dass der Schutz in den Dateieigenschaften nicht angezeigt wird, die Inhalte aber dann trotzdem nicht (sinnvoll) kopierbar sind?

Moin,

scheint tatsächlich etwas dran zu sein:
http://www.wer-weiss-was.de/theme19/article2550373.html

Vor allem der "Versatz" der Schriftzeichen könnte auch in Deinem Falle zutreffend sein!

Gruß
Maybe
"Es gibt nur eine falsche Sicht der Dinge: der Glaube, meine Sicht sei die einzig Richtige!" (Nagarjuna, buddhistischer Philosoph)
bei Antwort benachrichtigen
mawe2 Maybe „ Moin, scheint tatsächlich etwas dran zu sein:...“
Optionen

Hallo Maybe,

der Link geht tatsächlich in die richtige Richtung. Leider gibt es auch dort (außer OCR) keine wirkliche Lösung des Problems.

Ich habe mit verschiedenen Experimenten (in Excel!) herausbekommen, dass hier offensichtlich die Zeichen nicht standardkonform kodiert wurden.

Leider ist es vergebliche Mühe, die vertauschte Zuordnung zu entwirren, da es innerhalb des Textes verschiedene Vertauschungen gibt. Ein und dasselbe Zeichen wird in verschiedenen Teilen des Textes unterschiedlich kodiert.

Man kann also schon sagen, dass das offensichtlich eine recht clevere Methode ist, solche Texte vor unerwünschtem Kopieren zu schützen.

Natürlich klappt immer noch die OCR-Methode, die ich dem Kunden in diesem Falle auch empfehlen werde. Das ist allemal schneller, als jetzt mühsam etwas zu programmieren, das dann sowieso beim nächsten Dokument nicht mehr zu gebrauchen ist, weil dort wieder anders verschlüsselt wurde (nehme ich an...)

Danke für die Hilfe!

Gruß mawe2

bei Antwort benachrichtigen