Datenträger - Festplatten, SSDs, Speichersticks und -Karten, CD/ 19.578 Themen, 110.118 Beiträge

Prüfung alter Datenbestände auf Fehlerfreiheit

mawe2 / 23 Antworten / Flachansicht Nickles

Auf einer älteren Festplatte (HDD) liegt eine größere Datenmenge (100.000 Dateien unterschiedlichster Größen) vor.

Die Platte wurde schon viele Jahre nicht genutzt.

Möglicherweise sind durch die längere Lagerung (ohne regelmäßige Inbetriebnahme!) Fehler entstanden, so dass einzelne (oder auch viele) Dateien nicht mehr nutzbar sind.

Eine AdHoc-Prüfung ist für mich nur stichprobenartig möglich. Wenn ich 20 Dateien geöffnet und kontrolliert habe, lässt das aber noch keine Rückschlüsse auf die Unversehrtheit der restlichen 99.980 Dateien zu.

Wie lässt sich dieser Datenbestand auf einfachem Wege überprüfen?

Wie finde ich heraus, welche der 100.000 Dateien fehlerfrei sind und bei welchen Dateien Fehler vorliegen?

Die Prüfung sollte auf einem Windows-System erfolgen.
(Wenn es dort keine erfolgversprechenden Methoden dafür gibt, wäre aber auch der Einsatz anderer Betriebssysteme für diesen Zweck denkbar.)

Gruß, mawe2

bei Antwort benachrichtigen
gelöscht_189916 Borlander „CRC ist doch bereist eine Prüfsumme?! Jein. Eine vergleichsweise kurze Prüfsumme bietet keine absolute Sicherheit über ...“
Optionen
CRC ist doch bereist eine Prüfsumme?!


Die arbeitet doch m.E. aber dateiweise?

Für die Integrität der gesamten Platte ist das also nur bedingt aussagefähig. CRC-Fehler wären jedoch ein Indiz für Plattenprobleme und umgekehrt für eine intakte Platte, wenn es keine gibt.

Letzten Endes sind wie die nicht korrigierbaren Sektoren auch solche Dateifehler eine Frage der Wahrscheinlichkeiten. Dabei geht es ja nicht darum, ob sie auftreten, sondern wann und wie oft.

Frage 2 wäre dann, ob diese z.B. aus der Prüfsumme heraus korrigiert werden können oder nicht (mehr) und damit bei jedem weiteren Zugriff weiter beschädigt werden oder eben nach einer Korrektur zwar verändert, aber dann wieder "unbeschädigt" gespeichert sind, weil Datei plus Prüfsumme integer sind und ein neuerliches Abgleichen und ggf. Wiederherstellen zulassen.

Sonst müsste man für absolute Datensicherheit ständig mehrere Datensätze identisch vorhalten und diese permanent prüfen, um im Schadensfall diesen aus einem Double wieder herstellen zu können.

Im Prinzip ist das wie mit einem Bild, welches bei einem fehlenden Pixel noch als solches erkannt wird und man zumindest mit hoher Wahrscheinlichkeit auf die Farbe/den Zustand des fehlenden Pixels rückschließen kann, welches aber bei zu vielen fehlenden Pixeln seinen "Informationsgehalt" verliert. Auch ein Buch/Text kann bei einzelnen fehlenden Buchstaben "logisch" wieder rekapituliert werden, bei fehlenden Seiten oder Worten aber ab einem gewissen Punkt ohne einen identischen zweiten Satz nicht mehr.

Absolute Sicherheit kann es ergo ab einem Datenbestand der Größe X verbunden mit dem Faktor Zeit gar nicht mehr geben oder man hat mindestens 2x gesichert und gliche ständig ab. Und selbst da kann ein Fehler eines Teils die korrekte Datei verfälschen. Letzten Endes weiß man dann selbst bei inkorrekter Prüfsumme wieder nur, dass etwas falsch ist, aber erst einmal nicht wo oder was. Darauf kann dann über CRC z.B. die einzelne Datei ausfindig gemacht werden, wobei eben auch das nur bedingt Sicherheit bringt.

Das CRC-Verfahren ist nur für die Erkennung von zufälligen Fehlern ausgelegt. Es ist nicht geeignet, die Integrität der Daten zu bestätigen. Das heißt, es ist verhältnismäßig leicht, durch beabsichtigte Modifikation einen Datenstrom zu erzeugen, der den gleichen CRC-Wert wie eine gegebene Nachricht hat. Wenn eine solche Sicherheit gefordert ist, müssen kryptografische Hash-Funktionen wie beispielsweise SHA oder Signatur-Funktionen wie beispielsweise RSA zum Einsatz kommen.


Für den heimischen Anwendungsfall würde ich daher CRC mit gegebener Reparaturfunktion und ggf. noch eine Prüfsumme des gesamten Datenträgers als ausreichend ansehen. Die Binse des gelegentlichen Umkopierens von gesicherten Datenbeständen kommt ja nicht von ungefähr.

Es bleibt schwierig.


Auf jeden Fall;-)

bei Antwort benachrichtigen