Hey, ich brauch mal eure Hilfe,
ich muss einige Dateien bearbeiten, darunter sind etliche Bilder. In diesen Bilder ist wiederum einiges an Text. Nun möchte ich diesen Text herausfiltern, also irgendwie Indexieren. Kenne kein Tool das das kann.
Wenn man mit einem anderen Tool (oder dem Gleichen) auch noch bestimmte Textpassagen im Bild finden könnte, dann wäre ich auch schon erleichtert.
Bitte um Hilfe, kennt Ihr ein Tool, das mir hier helfen könnte und wenn ja, so postet es bitte hier.
Danke
Anwendungs-Software und Apps 14.497 Themen, 73.679 Beiträge
Ich gehe mal davon aus, daß die Sache so aussieht, daß der (für uns sofort erkennbare Text) in die Grafik als Punktmuster eingebettet ist, nicht als ASCII-Text in einem Layer z.B. Bei sowas hast Du grundsätzlich Pech mit textbasierter Indizierung: es IST ja kein Text vorhanden, sondern nur Pixelgruppen, die für unser Auge wie Buchstaben aussehen, in dem Bild aber als Pixel auftauchen, nicht als isoliertes ASCII-Zeichen.
Im Prinzip könnte man mit einem OCR-Programm die Pixelgruppen wieder zu Buchstaben zusammenfassen, es hängt aber alles davon ab, wie die Zeichen in der Grafik auftauchen. Also z.B. als ein Foto mit "eingeblendetem" getipptem Text wie die Untertitel oder Bildunterschriften im Fernsehen.
Und auch, wenn der Text in ganz normalen Maschinenbuchstaben-Zeichensätzen vorhanden ist, kommt dann noch dazu, daß sich diese Buchstabenpixelgruppen und der jeweilige Hintergrund Helligkeits- und Kontrastmäßig soweit voneinander abheben müssen, daß OCR-Progs was halbwegs sinniges herauslesen können.
Sieht also eher mau aus.
Vielen Dank für deine Antwort.
Mittlerweile habe ich ein Lösung gefunden, die mir aber nur unzureichend gefällt. Demnach müsste man alle Dateien in das PDF-Format umwandeln, danach kann man selbst den Text in Bildern finden. Nur mag ich das PDF-Format nicht besonders, ist aber wohl ein Kompromiss zwischen einer Lösung haben und keiner Lösung.
Deinem Tipp mit dem OCR-Programmen werde ich nachgehen.