Multimedia 2.611 Themen, 14.827 Beiträge

Bildsuche im Archiv

RogerWorkman / 12 Antworten / Baumansicht Nickles

Benötige ein Programm, welches ein Referenzbild inhaltssensitiv mit jedem im Archiv gespeicherten Bild vergleicht und den Dateipfad anzeigt.

Problem: Viele Bilder von mir schwirren im WWW ummher. Ich werde angeschriben, ob ich eine Originaldatei (Nutzungsrechte) verkaufen könnte. Leider wurden Dateinamen, Suffix von den gesuchten Bild verändert oder ersetzt. Ich finde die Originaldatei einfach nicht.

Bei einem Bildarchiv von ca. 40TB ist es müßig, händisch ein Bild ohne Dateinamen nur auf Sicht zu finden. Google hat eine Bildvergleichssuche fürs Netz. Ich brauche sowas nur für mein Bildarchiv. 

Habe es mit dem Programm AntiTwin versucht, null Treffer und die Suche dauert wochenlang.

Wie findet man so ein Bild? dabei sind viele Dateiparameter nicht gleich, Dateigröße, Dateinamen, Abmaße, Auflösung, Farbe/Kontrast, Helligkeit usw. Manchmal sind im Netz im Bilder ein Text eingefügt. Somit müsste, um die Trefferquote zu erhöhen, z.B. 50% Bildähnlichkeit angezeigt werden. 

Für mich ein sehr schwieriger Fall, bei recherchen bin ich auf Programme gestoßen, die aber nur für kleinste Dateigrößen und Dateimengen funktionieren.

Danke für Hilfe.  Gruß Roger

bei Antwort benachrichtigen
mawe2 RogerWorkman „Bildsuche im Archiv“
Optionen

Hast Du es schonmal mit ThumbsPlus versucht?

http://www.cerious.com/

Ob (und wie gut) TP mit 40 TB zurechtkommt, kann ich nicht sagen.

Das musst Du einfach mal ausprobieren.

bei Antwort benachrichtigen
RogerWorkman mawe2 „Hast Du es schonmal mit ThumbsPlus versucht? http://www.cerious.com/ Ob und wie gut TP mit 40 TB zurechtkommt, kann ich ...“
Optionen

Danke mawe,

Die Testversion kommt nichtmal mit 1TB Bilddaten zurecht. Problem, TumbsPlus muss erstmal von allen ein Vorschaubild generieren, das dauert und braucht nochmals mächtig Speicherplatz.

Momentan weis ich nicht weiter. Nur weil irgendein www-Depp den Bilddateinamen versemmelt, verändert, ersetzt, dann finde ich das Bild nie wieder. ... und knapp 40TB eigene und auch fremde Bilddaten kann ich mir nicht merken.

Selbst wenn ich nur Teile des Dateinamens hätte, könnte ich mit dem Tool Everything extrem schnell die Dateien finden  https://de.wikipedia.org/wiki/Everything

Aber das funktioniert eben nicht mit Bildinhalten.

bei Antwort benachrichtigen
mawe2 RogerWorkman „Danke mawe, Die Testversion kommt nichtmal mit 1TB Bilddaten zurecht. Problem, TumbsPlus muss erstmal von allen ein ...“
Optionen
TumbsPlus muss erstmal von allen ein Vorschaubild generieren, das dauert und braucht nochmals mächtig Speicherplatz.

Einen Tod wird man wohl wenigstens sterben müssen, damit sowas funktioniert...

Ansonsten musst Du natürlich abwägen, wieviel Dir so ein Verfahren wert ist und wieviel zusätzliche Einnahmen man damit u.U. generieren könnte.

Gibt's in den Bilddateien nicht wenigstens irgendwelche Metadaten, auf die man im Zweifelsfall mal zurückgreifen könnte?

bei Antwort benachrichtigen
RogerWorkman mawe2 „Einen Tod wird man wohl wenigstens sterben müssen, damit sowas funktioniert... Ansonsten musst Du natürlich abwägen, ...“
Optionen

Ja, es gibt Metadaten in den Originaldateien in meinem Archiv. Die helfen aber nicht weiter. Außer man weis, an welchen Tag/Woche genau fotografiert wurde. Das ist dann eine eingeschränkte Datumsuche für Originaldateien. Könnte man machen.

Aber die vorgelegten Bilder aus dem Netz enthalten keine Metadaten und auch kein Herstelldatum, sondern maximal ein Bearbeitungsdatum, und das könnte Jahre später sein.

Thumbs Plus ist bei Schlagwortsuche sehr gut, aber wer gibt Mio Bildern ein Schlagwort? Es ist und beibt ein Verwaltungsprogramm für überschaubaren Datenstamm. 40TB ist wohl ausgeschlossen.

Am meisten finde ich Daten über Everything, aber ich muss mindest einen Teil des originalen Dateinamen haben.

Bin ratlos.

bei Antwort benachrichtigen
mawe2 RogerWorkman „Ja, es gibt Metadaten in den Originaldateien in meinem Archiv. Die helfen aber nicht weiter. Außer man weis, an welchen ...“
Optionen
Aber die vorgelegten Bilder aus dem Netz enthalten keine Metadaten und auch kein Herstelldatum, sondern maximal ein Bearbeitungsdatum, und das könnte Jahre später sein.

Das heißt also konkret: Da entfernt jemand alle Merkmale, an denen Du die Datei identifizieren könntest und wünscht anschließend, dass Du die Datei identifizierst (um ihm das Original zu geben)?

Woher wissen diejenigen dann eigentlich, dass das überhaupt Dateien von Dir sind?

bei Antwort benachrichtigen
hatterchen1 mawe2 „Das heißt also konkret: Da entfernt jemand alle Merkmale, an denen Du die Datei identifizieren könntest und wünscht ...“
Optionen
Da entfernt jemand alle Merkmale, an denen Du die Datei identifizieren könntest und wünscht anschließend, dass Du die Datei identifizierst (um ihm das Original zu geben)? Woher wissen diejenigen dann eigentlich, dass das überhaupt Dateien von Dir sind?

Diese (mawe2) Frage muss man sich langsam, auf der Zunge zergehen lassen...Lachend

Gestottertes Wissen ist besser als eloquente Dummheit. Marcus Tullius Cicero (106 - 43 v.Chr.Rom) Staatsmann und Philosoph
bei Antwort benachrichtigen
RogerWorkman mawe2 „Das heißt also konkret: Da entfernt jemand alle Merkmale, an denen Du die Datei identifizieren könntest und wünscht ...“
Optionen
Das heißt also konkret: Da entfernt jemand alle Merkmale, an denen Du die Datei identifizieren könntest und wünscht anschließend, dass Du die Datei identifizierst (um ihm das Original zu geben)? Woher wissen diejenigen dann eigentlich, dass das überhaupt Dateien von Dir sind?

Nein, es sind wildfremde Interessenten an Bildern, die ich nicht kenne, klar sie finden irgendein nutzbares Bild im Netz, sehen meinen Namen im Impressum (Copyright), suchen nach mir... google ist schnell und schon kommt ein email an mich - mit einer Bildanfrage, welches aus dem Netz ins email kopiert wurde.

Mit den Bildern im Netz kann kein Interessent kopiert was anfangen, weil die die Datei in Druckauflösung benötigt werden.

Z.B. ein Reiseveranstalter für Reisen in die Fränkische Schweiz, oder Ostsee... Dresden, oder sonstwo, will mein Bild nutzen. Neu machen ist zu teuer.  An den Orten hab ich mal Bilder gemacht, manche sind mit Nutzungrechten an z.B. eine Stadt verkauft und im Netz zu sehen. 

Dem interessenten biete ich gern das gewünschte, oder auch aus der Region weitere Bilder an.  Aber ich muss sie finden !  

Hab früher auf Film bis 8x10 inch Fotos für Landesbildstellen gefertigt. Ab ca. 1995 ging es mit einer superteueren KodaK DCS digital los. Solche Aufnahmen existieren noch.

Heute ist es eine Flut von Aufnahmen möglich, einige werden verkauft, hab bis heute immer noch neue Interessenten.  Heute wird nach Orten und Datum sortiert, aber dennoch, wenn der Dateiname beim Interessenten nicht bekannt ist, sondern nur das Bild in kleinster Auflösung, das ist für mich ein Lotteriespiel so eine, auch z.T. uralte, historische Aufnahme zu finden.

Innerhalb von 10 jahren könnte ich das anhand der Rechnung herausfinden, Buchhaltung 10 Jahresaubewahrungsfrist, aber auch die Rechnungen zu durchforsten ist weder digital, noch händisch möglich, eben weil der Dateiname unbekannt ist

Es sind ja nicht nur die 40TB , sondern viele doppelt archivierte Fotos auf alten exteren Festplatten.

Deshalb suche ich ein Realbildvergleichsprogramm.

bei Antwort benachrichtigen
mawe2 RogerWorkman „Nein, es sind wildfremde Interessenten an Bildern, die ich nicht kenne, klar sie finden irgendein nutzbares Bild im Netz, ...“
Optionen

OK, danke für Deine Erläuterungen!

bei Antwort benachrichtigen
Borlander RogerWorkman „Danke mawe, Die Testversion kommt nichtmal mit 1TB Bilddaten zurecht. Problem, TumbsPlus muss erstmal von allen ein ...“
Optionen
TumbsPlus muss erstmal von allen ein Vorschaubild generieren, das dauert und braucht nochmals mächtig Speicherplatz.

Was hast Du erwartet?

Google hat eine Bildvergleichssuche fürs Netz. Ich brauche sowas nur für mein Bildarchiv. 

Und was glaubst Du was die machen? Die nutzen massiv Speicherplatz und vorab investierte Rechenzeit um die Suchanfragen  schnell beantworten zu können.

Du hast schon selbst festgestellt, dass keine exakte Übereinstimmung gesucht wurde (das ist noch relativ einfach). Die Daten müssen also vorher in eine Form transformiert werden, die eine Ähnlichkeitssuche erlaubt. Und auch da muss man schon abwägen zwischen Ressourcenbedarf und Genauigkeit. Wenn Du nur nach Durchschnittsfarbe suchen willst, dann kommst Du mit wenig Ressourcen aus, aber das Ergebnis wird nix taugen…

bei Antwort benachrichtigen
RogerWorkman Borlander „Was hast Du erwartet? Und was glaubst Du was die machen? Die nutzen massiv Speicherplatz und vorab investierte Rechenzeit ...“
Optionen
Die Daten müssen also vorher in eine Form transformiert werden, die eine Ähnlichkeitssuche erlaubt.

Genau, ich stell mir das so vor, ein Bild wird in z.B. 24 Klötze zerlegt (wenige bits und bytes) und nun geht die Suchmachine auf die Vergleichssuche, wo ein weiteres Bild mit 24 gleichen Klötzen liegt.  Ein Bildbearbetungsprogramm könnte sowas bereits bei Abspeichen in den Metadateien hinterlegen. > Metadateisuche geht sehr schnell

nehme es in kauf, das bei so einer Suche Mehrfachtreffer zustande kommen (z.B. immer gleicher Himmel mit Wolken) Rest könnte ich visuell vornehmen. Selbst bei Mio von verschiedenen Bildern gibt nur wenige, wobei 24 Klötze identisch wären.

Wie es gehen könnte, ich hab da keine Ahnung von, bin eigentlich nur auf der Suche nach einen Programm, was eine Bildevegleichsuche ermöglicht.

bei Antwort benachrichtigen
Borlander RogerWorkman „Genau, ich stell mir das so vor, ein Bild wird in z.B. 24 Klötze zerlegt wenige bits und bytes und nun geht die ...“
Optionen
ich stell mir das so vor, ein Bild wird in z.B. 24 Klötze zerlegt (wenige bits und bytes) und nun geht die Suchmachine auf die Vergleichssuche, wo ein weiteres Bild mit 24 gleichen Klötzen liegt.

Das scheitert allerdings schon, sobald das Bild zugeschnitten wurde.

nehme es in kauf, das bei so einer Suche Mehrfachtreffer zustande kommen (z.B. immer gleicher Himmel mit Wolken) Rest könnte ich visuell vornehmen. Selbst bei Mio von verschiedenen Bildern gibt nur wenige, wobei 24 Klötze identisch wären.

Bei Änderungen von Farbe/Kontrast/Helligkeit kann es dann allerdings schon schnell passieren, dass die Distanz zwischen gesuchtem Bild und dem tatsächlichen Original viel größer ist als zu anderen Bildern. Und eine feste Unterteilung in 24 Bereiche ist auch nicht besonders stabil gegenüber Verschiebung.

bei Antwort benachrichtigen
RogerWorkman Borlander „Das scheitert allerdings schon, sobald das Bild zugeschnitten wurde. Bei Änderungen von Farbe/Kontrast/Helligkeit kann es ...“
Optionen

Ja Borlander, wie es wirklich gehen könnte, hab ich keine Ahnung, ohne teilweise GB große Bilder zu vergleichen. Nicht nur Farbe, Helligkeit ist ein Problen, sondern wenn einer mal netterweise ein "Verkehrsschild" wegretuschiert hat, oder eine Text im Foto eingefügt hat. 

Vielelicht muss ich einfach anders denken, so z.B. wie Bildarchive, die Ihre Fotos anbieten, z.B. https://www.fotoware.com/

Dieser Weg ist allerdings extrem arbeitsintensiv und sehr teuer.

bei Antwort benachrichtigen