Allgemeines 21.978 Themen, 148.516 Beiträge

OCR_SOFTWARE

Dr. (Anonym) / 2 Antworten / Flachansicht Nickles

Hallo,
ich suche für meinen UMAX Scanner eine "gescheite" OCR Software, mit der ich Tabellen richtig übernehmen kann.
Am besten wäre es, wenn ich die eingescannten Tabellen/Texte ins
MS Office Packet übernehmen könnte, um sie dort weiter zu bearbeiten.

Freue mich über JEDEN Tip,

meci´s schonmal im Vorraus...


bei Antwort benachrichtigen
Herman Munster Dr. (Anonym) „OCR_SOFTWARE“
Optionen

Da muß man, meine ich, zwei Punkte berücksichtigen.

Zum OCRren im allgemeinen ist derzeit unter den bezahlbaren FineReader, gefolgt von Omnipage, am erfolgreichsten
einzusetzten. FineReader hat allerdings Probleme, Formate exakt zu übernehmen. Das - wozu ja insbesondere
Tabellen gehören - gelingt am exaktesten mit Recognita, der allerdings im Punkte "allgemeines OCR" nicht so gut abscheidet
wie die o.g. anderen. FineReader kann man so einstellen, daß er von einer reinen Zahlentabelle ausgeht, dann aber sollte
nur sehr wenig Buchstabentext dabei sein. Dann erkennt er das Tabellenformat wesentlich besser (das Format, d.h. die Anordnung,
Breite etc. der Spalten, nicht gemeint ist der Inhalt; die zu erkennen hat FineReader die geringsten Probleme). Bei Omnipage
liegt es ähnlich.

Ein Tip: es gibt von FineReader V4 z.Zt. 4 Versionen, eine "Sprint" oder so ähnlich für 70 DM (VERGESSEN!!!), die Standardversion
für ca. 250 DM (VIEL besser), die Professional für ca. 450 DM (bis auf Kleinigkeiten wie Lernfähigkeit dasselbe die Standard)
und eine über 2000 DM teure, die auch Handschrift erkennen können soll. Es sind auch noch einige preiswerte Kopien von
Version 3 im Umlauf, von denen abzuraten ist, denn die 4er kann alles besser und auch noch mehr als die 3er..

Von Omnipage war vor ein paar Monaten eine Version 9-Vollversion auf einer Zeitschriften-CD dabei, bei der man sich nur online
oder äquivalent bei der Firma registrieren muß.

Die Übernahme ins Office sollte kein Problem darstellen, da alle aktuellen Versionen mit Makros für diverse Textverarbeitungs-
und. Tabellenkalkulationen daherkommen.

Noch ´n Tip: erstaunlich ist immer wieder die deutliche bessere Erkennungsrate einer Problemvorlage, wenn man von ihr
mit einem ganz normalen Fotokopierer eine Kopie zieht und dann die Kopie OCRt. Häufig bringt es auch viel, wenn man die
Vorlage ein ganz klein wenig schief einlegt (Stichwort Druckeraster und Moiré).

OCRen darf man niemals mit aktivierter Interpolation des Scanners! Höchstens mit der maximalen OPTISCHEN Auflösung!

bei Antwort benachrichtigen