Ja.
Und Nein.
Zunächst beginnt es mal mit richtigen Einscannen. Bei OCR ist Kontrast alles. Hebt sich ein Buchstaben nicht stark genug von seiner Umgebung ab = Pech gehabt. Also nur Schwarz/weiß -oder Graustufenscans, keine farbigen. Nicht unter 300, nicht über 600dpi scannen und dies IMMER mit der OPTISCHEN Auflösung des Scanners, NICHT die interpolierten Auflösungen!! Wer interpoliert, kommt um 100% abtippen nicht herum. Wer sein OCR mit optischen 2400dpi malträtiert, braucht sich auch nicht über ein schelchtes Ergebnis zu wundern: da sieht das OCR-Programm das Zeichen vor lauter Pixeln nicht. Helligkeit/Kontrast so einstellen, daß es auf dem Bildschirm eine Spur zu "fett" aussieht. Glänzendes Papier und die starke Kümmung im Innenbereich von dickern Büchern ist ein Problem. Sehr häufig hilft es, von der Seite erstmal ne gute Fotokopie zu machen und die dann abzuscannen. Auch eine absichtliche Schräglage der Vorlage um 2-4° kann die Texterkennung enorm verbessern (oder auch nicht...). Hat man ein transparentes bzw. sehr dünnes Blatt als Vorlage, hilft es häufig, den Deckel vom Scanner hochgeklappt zu lassen oder ein pechschwarzes Blatt darüber zu legen. Auch darf kein helles Licht (direkte Sonne!) auf den Scanner fallen, notfalls Vorhang zuziehen.
Wird der Scanner vom OCR-Programm nicht direkt erkannt und unterstützt, dann sollte man zum Einscannen in eine Grafikdatei nur nicht-komprimierte Dateiformate benutzen wie BMP oder unkomprimiertes TIFF.
Die Schriftqualität der Vorlage ist maßgeblichst. Je besser, umso besser, je schwächer, umso mieser das Ergebnis. Auch muß man Text und Nicht-Text anhand zu erkennender Rahmen sauber trennen, das OCR-Programm jedenfalls erkennt immer fröhlich drauflos. Auch da, wo´s nichts zu erkennen gibt.
Der Font sollte ein "normaler" sein, je "flippiger", umso schwerer wird´s. Womit wir schon wieder bei der Handschrift wären.
Zwar hat sich bei OCR-Proggis in den letzten Jahren sehr viel getan (wie man exemplarisch an Finereader sehen kann), aber an den grundlegenden Voraussetzungen fürs Einscannen hat sich nichts geändert. Wer schlecht einscannt, bekommt ein mieses Ergebnis. Je besser man einscannt, je mehr Mühe man sich gibt, desto besser kann das Ergebnis werden.