Doppelte Mp3s/Oggs finden

Hallo!

Kennt irgendjemand von euch ein Programm, mit dem sich ein Verzeichniss auf doppelte Mp3s durchsuchen lässt?
Das auch Dateien findet wie:

02_BAND XYZ_AlbumABC_Lied01.mp3
Bandxyz/Album ABC/Bandxyz - Lied01.mp3

Mp3 Filter kenne ich bereits, ist mir allerdings eine Spur zu unflexibel.

Gruß
Fabian

Hallo!

Hi,

Kennt irgendjemand von euch ein Programm, mit dem sich ein
Verzeichniss auf doppelte Mp3s durchsuchen lässt?

Kommt es Dir dabei auf doppelte Inhalte an oder auf doppelte (aehnlich klingende) Namen?

Das auch Dateien findet wie:

02_BAND XYZ_AlbumABC_Lied01.mp3
Bandxyz/Album ABC/Bandxyz - Lied01.mp3

Sind die Dateien identisch? Dann koenntest Du die Loesung einer der Programmieraufgaben vom letzten Chemnitzer Linuxtag uebernehmen, da war die Aufgabe[1] aehnlich. Wenn ich mich recht entsinne war die aber deutlich umfangreicher als

 $ find . -type f -iname '\*.mp3' -exec md5sum '{}' \; |sort |uniq --count --check-chars=32

Wahrscheinlich liegt die GPL mit dabei.

Falls es um aehnlich klingende Namen geht duerfte das etwas komplizierter sein.

HTH,
Gruss vom Frank.
===footnotes===
[1] http://www.tu-chemnitz.de/linux/tag/2004/service/pro…

Hi,

kennst Du clonespy?
schau mal unter http://www.heise.de/software nach…
Also da kannst Du wenigstens schauen, ob 2 Dateien gleich sind.

Aber mit Ähnlichem Namen habe ich auch keine Idee…

Gruß

Winni

PS:
Wenn Du was weißt, bitte auch ne Info an mich, danke

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Hallo

Danke mal dafür. Mir geht es eher um ähnlich klingende Namen, da die Dateien nicht zwangsläufig 100% gleich sind.

Trotzdem Danke
Fabian

Hallo Fabian,

wie ich in einen anderen Brett gelesen habe, kannst du programmieren. Programmiere dir doch ein Tool was das Verzeichniss incl. aller Unterverzeichnisse dursucht. Von jedem File die Hashsumme errechnet. Diese speicherst du in einen Array. dann vergleiche das Array. So findest du Files, die indentisch vom Inhalt her sind. Die dateinamen koennen dabei ganz unterschiedlich sein :smile:
Ist eigentlich rel. Simple und schnell zu bewerkstelligen :smile:

VLG Alex

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Danke mal dafür. Mir geht es eher um ähnlich klingende Namen,
da die Dateien nicht zwangsläufig 100% gleich sind.

Programmiere dir doch ein Tool was das Verzeichniss incl. aller
Unterverzeichnisse dursucht. Von jedem File die Hashsumme errechnet.
Diese speicherst du in einen Array. dann vergleiche das Array. So
findest du Files, die indentisch vom Inhalt her sind. Die dateinamen
koennen dabei ganz unterschiedlich sein :smile:

Genau das hab ich doch auch vorgeschlagen. Und es scheitert höchstwahrscheinlich immer noch an dem Teil, den ich Dir jetzt nochmal unterstrichen hab. Es sei denn Du lieferst noch eine hash-Funktion dazu, wo f(x) == f(y) für x ~ y. Wobei noch näher zu definieren wäre, was ( ) ~ ( ) bedeutet.

Ist eigentlich rel. Simple und schnell zu bewerkstelligen :smile:

Ja, eigentlich schon. Eigentlich.

Gruß vom Frank.