Hallo,
ich habe eine PDF-Datei, in der das Kopieren von Inhalten erlaubt ist und die auch nicht verschlüsselt ist.
Trotzdem erhalte ich beim Kopieren von Textpassagen völlig kryptische Zeichen, wenn ich den Inhalt in Word (oder anderswo) einfüge.
("#$!%&'#($!$#)$*!%$)*+,$)!*#)-!)./!*+,0$/!$/1$))23/4!)
Das Problem tritt sowohl im Adobe Reader als auch im Foxit Reader auf.
Woran kann es liegen? Gibt es Abhilfe?
Gruß, mawe2
Anwendungs-Software und Apps 14.489 Themen, 73.614 Beiträge
Moin,
hört sich jetzt banal an, aber hast Du mal versucht, die Schriftart in Word zu ändern. Für mich sieht das nach Sonderzeichen aus!?
Einfach mal den kopierten und eingefügten Text in Word makieren und einen andere Schrift auswählen.
Gruß
Maybe
Moin,
vermutlich ist in dem PDF-Dokument eine eigene Schriftart eingebunden.
Danke erstmal.
An der Schriftart liegt es (leider) nicht. Die Zeichen sind ja keine Zeichen einer Symbolschriftart sondern Bestandteile jeder gewöhnlichen Text-Schriftart.
Außerdem tritt das Problem auch auf, wenn man den Text z.B. in ein Notepad-Fenster kopiert, wo ja Schriftarten sowieso ignoriert werden.
Es scheint mir eher so, dass es eine spezielle Verschlüsselung ist, die aber in den Eigenschaften der PDF-Datei nicht erwähnt wird. Gibt es sowas?
Kann man ein PDF-Dokument so schützen, dass der Schutz in den Dateieigenschaften nicht angezeigt wird, die Inhalte aber dann trotzdem nicht (sinnvoll) kopierbar sind?
Gruß, mawe2
Moin,
scheint tatsächlich etwas dran zu sein:
http://www.wer-weiss-was.de/theme19/article2550373.html
Vor allem der "Versatz" der Schriftzeichen könnte auch in Deinem Falle zutreffend sein!
Gruß
Maybe
Hallo Maybe,
der Link geht tatsächlich in die richtige Richtung. Leider gibt es auch dort (außer OCR) keine wirkliche Lösung des Problems.
Ich habe mit verschiedenen Experimenten (in Excel!) herausbekommen, dass hier offensichtlich die Zeichen nicht standardkonform kodiert wurden.
Leider ist es vergebliche Mühe, die vertauschte Zuordnung zu entwirren, da es innerhalb des Textes verschiedene Vertauschungen gibt. Ein und dasselbe Zeichen wird in verschiedenen Teilen des Textes unterschiedlich kodiert.
Man kann also schon sagen, dass das offensichtlich eine recht clevere Methode ist, solche Texte vor unerwünschtem Kopieren zu schützen.
Natürlich klappt immer noch die OCR-Methode, die ich dem Kunden in diesem Falle auch empfehlen werde. Das ist allemal schneller, als jetzt mühsam etwas zu programmieren, das dann sowieso beim nächsten Dokument nicht mehr zu gebrauchen ist, weil dort wieder anders verschlüsselt wurde (nehme ich an...)
Danke für die Hilfe!
Gruß mawe2