Linux 15.039 Themen, 107.137 Beiträge

Backups und alte dateien identifizieren.

robinx99 / 12 Antworten / Baumansicht Nickles

Hi,
ich habe ein kleines problem ich versuche alte dateien zu finden (oder zumindest zukünfitg zu finden)
Im internet finde ich eigentlich immer als lösung soetwas wie "find /home/ -atime +100" um dateien zu finden die über 100 tage keinen zugriff hatten.

So nun zu meinem problem ich mache regelmäßig ein Backup auf USB festplatten mit folgendem befehl "rsync /home/ /mnt/usb/homebackup/ -av --delete --progress"

Durch das Backup findet wohl ein zugriff auf die dateien statt und der find befehl findet keine alten dateien. Gibt es da irgendwie eine sinvolle lösung, dass man alte dateien findet auf die keiner mehr zugreift und das man trozdem noch ein backup machen kann.

Bisher fallen mir als mögliche lösungen nur folgende eher unpraktische lösungen ein. Backup ausschließlich von einer LiveCD starten während die festplattenpartition read only gemounted ist oder verwendung von experimentellen dateisystemen (snapshot fähige um so das backup vom snapshot zu machen also z.B.: btrs oder nilfs2)

gruß robinx99

bei Antwort benachrichtigen
KarstenW robinx99 „Backups und alte dateien identifizieren.“
Optionen

Verstehe ich nicht ganz richtig. Du willst ein Backup mit rsync machen ?
rsync kopiert nur Dateien die neu sind oder verändert wurden.
Dieses Konzept spart Bandbreite und Backup Zeit.
Wenn diese alten Dateien kopiert wurden und sie wurden im Backup nicht irgendwie gelöscht, dann werden sie nicht nochmal kopiert (es sei denn sie wurden verändert). Das soll bei rsync auch so sein.

Wenn du die rsync Technik nicht ganz verstanden hast, dann ließ doch mal diese Internetseite durch. Da gibt es auch ein sehr schönes Beispiel wie man mit rsync Backupscripte schreibt:

http://www.heinlein-support.de/web/support/wissen/rsync-backup/

Diesen find Befehl brauchst du nicht wenn du mit rsync Backups machst. rsync ist kein simpler cp Befehl.






Debian GNU/Linux https://www.debian.org/index.de.html
bei Antwort benachrichtigen
robinx99 KarstenW „Verstehe ich nicht ganz richtig. Du willst ein Backup mit rsync machen ? rsync...“
Optionen

Hi,
ok ich versuche es deutlicher zu machen
Ich mache ca. 1 Woche ein backup meines homeverzeichnisses mittels rsync das ist ja soweit noch ok.

Jetzt möchte ich in meinem homeverzeichniss alte dateien suchen
Laut internet suche meinerseits kann man dafür soetwas wie "find /home -atime +100" verwenden (sollte dateien finden die wenigstens 100 tage keinen zugriff haben), doch anscheinend führt mein rsync backup dazu das alle dateien einen lesenden zugriff hatten. ctime statt atime kann man auch nicht wirklich verwenden da dann z.B.: dinge wie der bildschirmhintergrund irgendewann als "unnütz" angezeigt werden, nur weil da keine veränderungen stattgefunden haben.

Ich suche jetzt nach einer möglichkeit das mir rsync nicht accesstime der dateien in meinem homeverzeichniss verändert oder eine andere möglichkeit alte dateien zu finden.

bei Antwort benachrichtigen
Pashka robinx99 „Hi, ok ich versuche es deutlicher zu machen Ich mache ca. 1 Woche ein backup...“
Optionen

Wenn die Partition mit der Option noatime mountet, werden die Zugriffszeiten nicht gespeichert.
Wenn du das Backup ausführst, kannst du ja die Partitionen mit dieser Option mounten.

Gruß
Paul

bei Antwort benachrichtigen
robinx99 Pashka „Wenn die Partition mit der Option noatime mountet, werden die Zugriffszeiten...“
Optionen

also sowas wie
"mount -o remount,noatime /home" bevor man das rsync macht?
werde ich mal testen müßte auch das sein was mir hilft.

danke
robinx99

bei Antwort benachrichtigen
Pashka robinx99 „also sowas wie mount -o remount,noatime /home bevor man das rsync macht? werde...“
Optionen

also sowas wie
"mount -o remount,noatime /home" bevor man das rsync macht?

Ja, genau.

Die Option "nodiratime" schaltelt die Zugriffszeit für Verzeichnisse aus.

Gruß
Paul
bei Antwort benachrichtigen
KarstenW robinx99 „Hi, ok ich versuche es deutlicher zu machen Ich mache ca. 1 Woche ein backup...“
Optionen

Ich wußte gar nicht das rsync die Zugriffszeit verändert. find ändert selbst die Zugriffszeit auf Verzeichnisse.


-atime n True if the file was accessed n days ago. The access time of directories in path is changed by find itself.


In der manpage zu rsync habe ich nur die -t oder --time Option gefunden. Mit -t wird die Modifizierungszeit (modification time) mit kopiert und im Backup gesichert:

-t, --times
This tells rsync to transfer modification times along with the files and update them
on the remote system. Note that if this option is not used, the optimization that
excludes files that have not been modified cannot be effective; in other words, a
missing -t or -a will cause the next transfer to behave as if it used -I, causing all
files to be updated (though rsync's delta-transfer algorithm will make the update
fairly efficient if the files haven't actually changed, you're much better off using
-t).


Vielleicht ist es besser wenn du nach der Modifizierungszeit suchen läßt:

-mtime n True if the file's data was modified n days ago.

http://www.computerhope.com/unix/ufind.htm

Wann man eine Datei zum letzten mal gelesen hat ist doch egal. Viel wichtiger ist wann man sie zuletzt bearbeitet hat.

Debian GNU/Linux https://www.debian.org/index.de.html
bei Antwort benachrichtigen
robinx99 Nachtrag zu: „Backups und alte dateien identifizieren.“
Optionen
Vielleicht ist es besser wenn du nach der Modifizierungszeit suchen läßt:suchen
-mtime n True if the file's data was modified n days ago.modified Wann man eine Datei zum letzten mal gelesen hat ist doch egal. Viel wichtiger ist wann man sie zuletzt bearbeitet hat.


Ich glaube eher weniger das mir das hilft.
Mir geht es darum alte dateien zu finden die keiner mehr nutzt.
Wenn ich jetzt mdate verwenden würde, dann würden mir ja sämtliche musikdateien, fotos, und auch viele programme angezeigt werden. Aber wenn ich die atime nutze, dann kann ich es über das komplette homeverzeichniss laufen lassen und es sollten mir dann auch mp3s angezeigt werden die man nicht mehr hört. Ebenso auch konfigurationsdateien die nur gelesen werden und nicht verändert werden. Außerdem liegen im /home verzeichniss auch so banale dinge wie ein Risiko java clone der wird auch nur ausgeführt da wird nichts verändert

robinx99
bei Antwort benachrichtigen
Borlander robinx99 „ Ich glaube eher weniger das mir das hilft. Mir geht es darum alte dateien zu...“
Optionen
Außerdem liegen im /home verzeichniss auch so banale dinge wie ein Risiko java clone der wird auch nur ausgeführt da wird nichts verändert
Da könnten dann allerdings auch problemlos Dateien auftauchten auf die nur sehr selten zugegriffen wird. Und wenn Du dann nach einem Jahr mal wieder Level4711 spielen willst kracht es weil die Datei zwischenzeitlich nach 100 Tage Nichtzugriff gelöscht wurde. Ich halte eine solche Lösung für extrem riskant!

Btw.: Warum nutzt Du rsync eigentlich nicht mit der Hardlink-Funktion?


Gruß
Borlander
bei Antwort benachrichtigen
robinx99 Borlander „ Da könnten dann allerdings auch problemlos Dateien auftauchten auf die nur...“
Optionen

Naja automatisiert will ich sie nicht löschen, aber ich will erstmal eine möglichkeit haben alte dateien überhaupt zu indentifizieren.
Da hat man viele verzeichnisse mit ".irgendwas" im homeverzeichniss und teilweise sind es konfigurationsdateien von irgendeinem programm was man mal vor einem jahr getestet hat. Oder verschiedene versionen von programmen machen sich eigene konfigurationsdateien (beispiel tvbrowser ich hatte mal gesehen, das ich da .tvbrowser/2.7.0 ; .tvbrowser/2.7.1 ; .tvbrowser/2.7.2 ; .tvbrowser/2.7.3 die alten brauchte man nicht mehr)

Und momentan schaue ich z.B.: auf sowas .mozilla/firefox (108Mb) .mozilla/firefox.3.0-replaced (95Mb) und ich habe nicht die geringste ahnung ob ich da wirklich beide noch brauche, wenn ich eigentlich nur noch einen firefox 3.5 verwende und die anderen garnicht mehr auf dem system sind. Und ich kann ja nicht wirklich bei jeder datei die mir komisch vorkommt im internet googlen. (selbst in /etc/ gibt es firefox-3.0 ; firefox-3.1 und firefox-3.5 )


Bei Rsync mit hardlinks sehe ich jetzt keine wirklichen vorteile ich brauche ja definitiv eine kopie auf einer usb festplatte. Den einzigen vorteil den ich mir vorstellen könnte, währen verschiedene revisionen meines /home/ verzeichnisses zu haben. Aber eigentlich brauche ich nur eine sicherung für den fall eines crashes des rechners.

bei Antwort benachrichtigen
Borlander robinx99 „Naja automatisiert will ich sie nicht löschen, aber ich will erstmal eine...“
Optionen
Den einzigen vorteil den ich mir vorstellen könnte, währen verschiedene revisionen meines /home/ verzeichnisses zu haben.
Das ist aber ein sehr großer Vorteil ;-)

Wenn Du alle Revisionen aufhebst, dann kannst Du auch ohne große Sorgen Config-Verzeichnisse löschen von denen Du die berechtigte Annahme hast sie würden nicht mehr gebraucht. Lassen sich dann bei tatsächlichem Bedarf einfach wiederherstellen :-)
bei Antwort benachrichtigen
robinx99 Borlander „ Das ist aber ein sehr großer Vorteil - Wenn Du alle Revisionen aufhebst, dann...“
Optionen

Aber wenn ich bei einem config verzeichniss den verdacht habe dass ich es nicht mehr brauche dann kann ich es doch einfach komprimieren und das original löschen. So kann ich die komprimierte datei eine gewisse zeit behalten und sehen ob es funktioniert und dann die komprimierte datei nach einiger zeit löschen. (die alten revisionen eines backups würden ja auch irgendwann gelöscht, die kann man ja auch nicht ewig aufbewahren)

bei Antwort benachrichtigen
Borlander robinx99 „Aber wenn ich bei einem config verzeichniss den verdacht habe dass ich es nicht...“
Optionen

Vielleicht noch einfacher: Das Cofig-Verzeichnis umbenennen und das aktuelle Datum anhängen, also z.B. '.nixprogramm' zu '.nixprogramm~2009-10-24'. Dann kannst Du die Verzeichnisse einfach liegenlassen und im nächsten halben Jahr schauen ob Du sie noch brauchst (also Einstellungen fehlten), bzw. ob das Verzeichnis neu angelegt wurde. Wenn nicht könnten sie weg. Könnte man bei häufigerem Bedarf dann sogar automatisieren ;-)

Was die Backup-Revisionen angeht: Bei sind aktuell die Backups (alle 1-3 Tage) von über einem Jahr gespeichert...

Gruß
Borlander

bei Antwort benachrichtigen