Ich habe Unmengen von Dateien die auf Duplikate geprüft und einsortiert werden müssen.
Aktueller Stand alleine der Fotodateien sind 4.9 Mio. Das mache ich nicht von Hand.
Foto Duplikate finden ohne Dateiinformationen
Nach dem letzten Blitzeinschlag habe ich einen iMac mit 3TB interner HD und eine Synology mit 10 Laufwerken verloren.
Geräte zu ersetzen ist kein so großes Problem, aber die Daten wieder im Einklang zu bekommen ist der Wahnsinn.
Vor 15 Jahren ist mir mal eine ELO Office Datenbank um die Ohren geflogen. Diese Daten sind teilweise heute noch unsortiert.
iTunes hat mal meine Datenbank total durcheinander gebracht und das Chaos ist extrem.
Eine Bilddatei von unserem Haustier wurde als "Java09.mp4" betitelt.
Eine Videodatei aus einem Informatik Lehrgang Java09 heißt jetzt "The Living Daylight.mp3"
Daher ist es wichtig alle Informationen über eine Datei aus zu werten. Dabei verlasse ich mich nicht nur auf den Dateinamen, sondern auch auf die Metadaten und sogar der Textinhalt wird analysiert um es eindeutig zu klassifizieren und einsortieren zu können.
Dabei werde ich auf das klassische Dateisystem und einer MySQL Datenbank setzen.
Mittlerweile bin ich zu dem Entschluss gekommen das Erstellungsdatum nicht ändern zu wollen, denn bei einem Kopiervorgang oder bei der Wiederherstellung aus einem Backup ist dieses dann wieder falsch.
Das Erstellungsdatum werde ich auf jeden Fall lesen um Entscheidungen treffen zu können.
Ich überlege mir auch ob der Eintrag in eine Datenbank ausreichend ist oder evtl eine Sidecardatei mit zu erzeugen?!?