Office - Word, Excel und Co. 9.752 Themen, 41.587 Beiträge

PDF Datei in Excel bearbeiten

jh88 / 12 Antworten / Baumansicht Nickles

Hallo,

ich habe eine Tabelle im PDF Format eingescannt. Wie kann ich diese nun in Excel öffnen und bearbeiten? Wie kann man dann in der Excel Tabelle nach Schriftfarbe filtern?

gruß

bei Antwort benachrichtigen
Hyperboreal jh88 „PDF Datei in Excel bearbeiten“
Optionen

Hallo,

entweder als Text einscannen, die Fehler per Hand korrigieren und
dann als .txt-Datein in Excel importieren (Trennzeichen!), oder Online versuchen.
http://www.onlineocr.net/ habe ich schon erfolgreich benutzt.

PDF->Excel ist wohl nicht so einfach.

Gruss

Hy

bei Antwort benachrichtigen
Hyperboreal Nachtrag zu: „Hallo, entweder als Text einscannen, die Fehler per Hand ...“
Optionen

> als Text einscannen.

Sorry, das geht ja gar nicht so einfach.
Das war natürlich Quatsch von mir. Bin von meinem Scanner ausgegangen.

Aber viele Scanner haben doch OCR (Grafik -> Text) mit "on Board".
Als mitgelieferte Software.

Gruss

Hy

bei Antwort benachrichtigen
Maybe jh88 „PDF Datei in Excel bearbeiten“
Optionen

Moin,

Du könntest es hiermit mal versuchen:
http://www.pdftoexcelonline.com/de/

Was dabei rauskommt, würde mich interessieren, denn ich rechne eigentlich nicht mit einer sauberen Formatierung und Übergabe der Werte.

Gruß
Maybe

"Es gibt nur eine falsche Sicht der Dinge: der Glaube, meine Sicht sei die einzig Richtige!" (Nagarjuna, buddhistischer Philosoph)
bei Antwort benachrichtigen
mawe2 Maybe „Moin, Du könntest es hiermit mal ...“
Optionen

Ich habe das mal interessehalber probiert.

Um den Algorithmus nicht zu sehr zu strapazieren, habe ich keine gescannte PDF benutzt sondern eine PDF direkt aus Excel heraus erstellt und diese dann wieder zu Excel konvertieren lassen.

Offensichtlich kommt es darauf an, dass wirklich jede Zelle mit (sichtbaren) Rahmen versehen ist. Bei meiner Beispieldatei waren die Zeillen teilweise mit Rahmen versehen, dann wurden sie korrekt erkannt. Zellen, die im Original ohne trennende Rahmen neben- und übereinander standen, wurden als eine einzige Zelle erkannt und dort dann ggf. mehrere Zeilen hineingeschrieben.

Fazit: Kann durchaus sehr hilfreich sein. Wenn keine Rahmenlinien zur genauen Erkennung der Zellen vorhanden sind, sollte man diese evtl. vor dem Erkennungsprozess noch in die Datei einfügen. Das müsste dann evtl. über ein Grafikprogramm erledigt werden, das dann wiederum eine PDF erzeugt.

Wie sich das Programm bei mangelhafter Scanqualität verhält, habe ich nicht geprüft.

Gruß, mawe2

bei Antwort benachrichtigen
mawe2 Nachtrag zu: „Ich habe das mal interessehalber probiert. Um den ...“
Optionen

Nachtrag: Ich habe es jetzt nochmal mit einem gescannten Dokument probiert, das als PDF vorlag. Dieses konnte nicht in eine Excel-Datei umgewandelt werden.

Gruß, mawe2

bei Antwort benachrichtigen
Maybe mawe2 „Nachtrag: Ich habe es jetzt nochmal mit einem gescannten ...“
Optionen

Moin,

danke für Deine Mühe. Habe ich mir fast gedacht, dass es nicht sauber funktioniert. Gut, Rahmen hinzuzufügen sollte machbar sein, wenn auch enorm viel Arbeit in komplexen Tabellen.

Konvertierung zwischen Dateiformaten war schon immer so eine Sache und grade pdf setzt da noch einen drauf, da es eben nicht mehr komplett bearbeitbar ist.

Gruß
Maybe

"Es gibt nur eine falsche Sicht der Dinge: der Glaube, meine Sicht sei die einzig Richtige!" (Nagarjuna, buddhistischer Philosoph)
bei Antwort benachrichtigen
jh88 Maybe „Moin, Du könntest es hiermit mal ...“
Optionen

Hallo, bei mir hat es nicht funktioniert. Es kam die Meldung per Mail, das im PDF keine Tabelle enthalten war, obwohl eine drin ist. gruß

bei Antwort benachrichtigen
Hyperboreal jh88 „PDF Datei in Excel bearbeiten“
Optionen

Hallo,

OCR als Freeware: http://www.chip.de/downloads/FreeOCR-PDF-Scan-und-Texterkennung_46572905.html

Habe ich aber noch nie getestet.

Eine 99 € Lösung gibt es auch, falls viel zu scannen ist:
http://www.heise.de/newsticker/meldung/Nuance-hat-OCR-Software-OmniPage-ueberarbeitet-1855237.html

Gruss

Hy

bei Antwort benachrichtigen
jh88 Hyperboreal „Hallo, OCR als Freeware: ...“
Optionen

Hallo, geht es vielleicht einfacher, wenn man die Tabelle als TIF oder XPS einscannt? Wie kann man nun in Excel nach der Schriftfarbe filtern? gruß

bei Antwort benachrichtigen
Hyperboreal jh88 „Hallo, geht es vielleicht einfacher, wenn man die Tabelle ...“
Optionen
geht es vielleicht einfacher, wenn man die Tabelle als TIF oder XPS einscannt?

Ganz "einfach" geht das alles nicht.
Excel kann mit Bilddaten (jpg, Tiff) nichts anfangen, wohl aber mit
Zahlen (Textkette "1234") oder Spaltennamen.
Manche PDFs enthalten ja die Zahlen als Texte, andere wiederum auch nur
in Bildform. Das muss man vorher wissen.

Wie kann man nun in Excel nach der Schriftfarbe filtern?

Das wäre ja schon die nächste Frage. Eigentlich sollen alle Werte doch erst
mal in die Tabellenkalkulation rein. Oder? Flitern kann man dann immer noch.
Oder verstehe ich etwas falsch?

Hast du mal die Online-Lösungen probiert?

Gruss

Hy

bei Antwort benachrichtigen
mawe2 jh88 „Hallo, geht es vielleicht einfacher, wenn man die Tabelle ...“
Optionen
Wie kann man nun in Excel nach der Schriftfarbe filtern?

Das kommt auf die Excel-Version an!

In Excel 2010 ist das sehr einfach:
Du markierst die Kopfzeile des zu sortierenden Bereichs, schaltest über die Multifunktions-Leiste "Daten" die Filter ein und kannst dann bei der betreffenden Spalte den kleinen Pfeil anklicken. Dort gibt es dann die Option "Nach Farbe filtern".

Bei Excel 2000 gibt es diese Option nicht. In welcher Excel-Version die Filterung nach Farben neu hinzugekommen ist, kann ich im Moment nicht sagen. Probier es einfach aus!

Gruß, mawe2
bei Antwort benachrichtigen
aldebuedel jh88 „PDF Datei in Excel bearbeiten“
Optionen
Ein PDF als Excel-Datei abzuspeichern funktioniert nur bedingt, und dann auch nur mit dem Acrobat, nicht mit dem Reader. Einscannen, den Text erkennen, rechte Maustaste "als Exceltabelle speichern". Aber auch dann erfordert das Ergebnis eine Nachbearbeitung.
bei Antwort benachrichtigen