Jump to content

Namens- oder Größenähnliche Dateien finden


Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Empfohlene Beiträge

Geschrieben

Moin!

 

Wir haben hier in der Uni eine Art von Datenbank (Rauschdaten), die jeden Datensatz in einer Datei speichert - Diese Dateien sind jeweils einige MB gross, wobei das ja eigentlich nicht weiter von interesse ist.

 

Im Dateinamen werden Keywords angegeben, was der einzelne Datensatz jeweils enthält.

 

Die Daten haben sich jetzt über 6-7 Jahre angesammelt und daher sind viele Fast-Duplikate in der Datenbank, also Dateien welche ungefähr dieselben Daten enthalten und sehr ähnliche Keywords im Dateinamen haben und auch teilweise Größenmässig ähnlich sind. Mit Dateinamenähnlichkeit sind einmal gleiche Wörter / Buchstabenfolgen und auch phonetische Ähnlichkeit gemeint.

 

Gibt es ein Programm mit dem ich zB Solche Dateipaare, -tripel, usw. finden und die Dateidaten anzeigen lassen kann kann und dann auswählen kann welches gelöscht wird? Oder gar einstellen kann dass immer der grösste Datensatz behalten wird?

 

Ich stelle mir das so vor, daß einfach Ein Ordner eingegeben wird, den das programm dann (samt unterordnern) durchsucht und dann die gefundenen duplikate zum bearbeiten übergibt.

 

Danke schonmal,

OPP

Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Erstelle ein Benutzerkonto oder melde dich an, um zu kommentieren

Du musst ein Benutzerkonto haben, um einen Kommentar verfassen zu können

Benutzerkonto erstellen

Neues Benutzerkonto für unsere Community erstellen. Es ist einfach!

Neues Benutzerkonto erstellen

Anmelden

Du hast bereits ein Benutzerkonto? Melde dich hier an.

Jetzt anmelden
×
×
  • Neu erstellen...