Idee zum Abgleichen der Interpreten mit Musicbrainz?

Wenn ich eine Liste aller Interpreten (=%artist% in Mp3tag) aus Musicbrainz zur Verfügung hätte: Wie könnte ich diese dann am einfachsten/effizientesten/schnellsten mit den vorhandenen Interpreten in meinen Songs abgleichen?

Das Ziel wäre, die unterschiedlichsten Schreibweisen zu erkennen und anschliessend zu vereinheitlichen. Ein Beispiel wäre '10cc' (10CC, 10 cc und alle Mischformen), aber natürlich auch die Varianten mit 'The' wie 'Beatles' und 'The Beatles' etc.

Was meint Ihr?

ich habe auch schon "Ten CC" gesehen...

Was macht Du mit Ausdrücken wie
Baker, Chet & Stan Getz
Zappa, Frank
Emerson Lake and Palmer
Emerson, Lake and Palmer
Emerson Lake & Palmer

Ich basiere auf den Vorschlägen von Musicbrainz.
Für Deine erste Zeile scheint Musicbrainz keine Einträge zu finden (weder als Kombination die eine Platte/CD rausgab, noch für einzelne Stücke). Die müsste man in Musicbrainz zuerst richtig erfassen, also Chet Baker & Stan Getz (Sortiername: Baker, Chet & Getz, Stan).

Die übrigen findet Musicbrainz heute schon als
Frank Zappa (Sortiername: Zappa, Frank)
Emerson, Lake & Palmer (Sortiername: Emerson, Lake & Palmer)

Mir ist bewusst, dass auch damit keine 100%ige und automatische Trefferquote hinzukriegen ist. Aber mir geht es auch darum, mal 90% als Treffer auszuschliessen und die übrigen 10% dann entweder manuell oder mit etwas Feintuning zu finden.

Deshalb auch meine ursprüngliche Frage:
Wie könnte ich diese dann am einfachsten/effizientesten/schnellsten mit den vorhandenen Interpreten in meinen Songs abgleichen?

Diese Abweichung ist schon recht heftig.
bei 10000 Titeln muss ich 1000 manuell nachbearbeiten - wo liegt dann da der Vorteil?
(früher machten OCR-Programme damit Reklame, dass sie 99,9% der Buchstaben erkennen würden. Eine vollgeschriebene A4-Seite hat ca. 8000 Zeichen. Damit wären 8 Tippfehler auf der Seite - ein Quote, für die man jede Texterfassungskraft rausgeschmissen hätte).
Andererseits möchte ich auch gerne einheitliche Benennungen, zumindest in meiner Sammlung.
Und da hilft - oh Wunder - WMP11: der listet auch große Sammlungen auf, sortiert treu und brav alphabetisch, filtert auch Listen.
Und wenn man dann eine Schreibweise durch eine andere ersetzt, aktualisiert der WMP (nach einem Weilchen) sogar die Tags in den Dateien.
Man muss allerdings lang genug warten , denn sonst steht nachher gar nichts in den gerade bearbeiteten Tags.
Blöderweise kann man Titel aus WMP nur per Playlist (wenn's viele sind) in Mp3tag importieren.
Ein anderer Weg ist iTunes: das listet auch schön alphabetisch auf und man kann dann die gelisteten Titel per Drag&Drop in MP3tag überführen.
Dass es aber irgendwo eine wirklich eindeutige Schreibweise gäbe - bezweifele ich. Siehe discogs.com für z.B. 10cc:
"10 cc | 10 c c | 10 c. c. | 10 C.C. | 10 cc. | 10.C.C | 10C.C | 10C.C. | 10CC | Ten CC"
Der Bezug auf MusicBrainz ist dann genauso willkürlich wie jede andere Vereinheitlichung in der eigenen Sammlung und damit eine individuelle Entscheidung.

Danke für Deine Antwort und Meinung, ohrenkino!

Das stimmt. Im Gegensatz zum erwähnten Beispiel und discogs wird bei Musicbrainz eine Schreibweise forciert. Ob das die "richtige" ist, kann man diskutieren. Ich möchte in meiner eigenen Sammlung einfach keine Varianten davon.

Vermutlich komme ich um eine eigene DB mit den benötigten Angaben nicht herum. Mp3tag ist aktuell als 32bit-Version memory-mässig zu eingeschränkt für die Bearbeitung einer kompletten (sehr) grossen Sammlung.
Umgekehrt sind die Möglichkeiten der Tagbearbeitung in Mp3tag ungeschlagen.
Wenn ich an die Bearbeitung der Tags z.B. in MediaMonkey denke, höre ich aufgrund der vielen Unzulänglichkeiten beim Bearbeiten schnell wieder auf. Da hilft auch die Datenbank (die bei MM zur Verfügung steht) wenig.

Ich frag mal einfach aus dem Bauch heraus:
Ein Abgleich von Interpreten aus Mp3tag mit einem externen Textfile oder einer Datenbank ist nicht möglich, oder?

Die Bewertung, ob etwas eine richtige Schreibweise ist, wäre ja nur durch einen Vergleich zwischen einem Master und einer Fuzzy Search durch die vorhandenen Datensätze möglich. Fuzzy deshalb, weil man ohne fuzzy entweder recht schnell alle diejenigen finden würde, die 100% mit einem Master übereinstimmen und in einer sinnlos langen Liste all diejenigen, die nicht übereinstimmen.
Dazu: es tun sich alle Rechtschreibprüfer (und sowas wäre ja letztlich der Standardisierer) etwas schwer mit Eigennamen - es sei denn, sie wären weit verbreitete Namen oder an andere Begriffe angelehnt (siehe "Schreiner", "Müller", "Vogt" etc.).
Da Gruppen aber eigentlich auf Eigennamen bestehen, die dann möglichst seltsam geschrieben werden (z.B. Will.I.Am, t.A.T.u. usw.) würden die zumindest beim ersten Suchen als Ausnahmen aufgenommen werden müssen.
Vielleicht nur so als Nebengedanken: es gibt in Access die Möglichkeit, Listen miteinander zu vergleichen, ob es Entsprechungen sowohl in der einen oder anderen Liste gibt. Und auch genau den entgegengesetzten Fall, nämlich welche Einträge noch gar keine Entsprechung haben.
Auf diese Weise könnte man die Exoten/Abweichungen finden, würde allerdings keinen Vorschlag für die Verbesserung finden, also ob es schon was ähnliches gibt oder es ein neuer Eintrag ist, der berechtigter Weise keinen Partner in der Datenbank findet.
Von daher: das wird, weil Namen nun mal Schall und Rauch sind, eine ständige Baustelle sein. Vermutlich gewinnt man allein dadurch schon ordentlich was, wenn man das Drama, ob Gruppen mit oder ohne Artikel und Vor- und Nachnamen immer gleich behandelt werden, in der eigenen Sammlung einheitlich regelt.

Wieviele Tabellen sind in deiner Access-Datenbank in Bezug gebracht: 1-1; N-M usw.
Variante 1: Interpret zu Album zu Titel
Variante 2: Gruppen zu Album zu Titel

oder wie erwischt du die "Exoten"???

Man nehme:
1 master-Tabelle, in der die Namen mit einem eindeutigen Index versehen sind. Dadurch gibt es jeden Namen nur 1x.
Dann: eine temporäre Tabelle, in der die zu überprüfenden Namen aus einem Mp3tag-Export importiert werden.
Schließlich die Verknüpfung in Form einer Abfrage, bei der die Verknüpfung von der Mastertabelle zur Temp-Tabelle 1:N ist.
In der Abfrage sind mindestens die Felder !master:artist und !temp:artist enthalten.
Um dann die zu finden, die wirklich oder scheinbar neu snd, wird als Bedingung für !master:artist
= Null
festgelegt.
Damit werden alle gezeigt, die in der Mastertabelle keine Entsprechung haben.
Und das wird dann jetzt die Sysiphus-Arbeit: jetzt muss man gucken, ob die neu oder falsch sind. Handarbeit.
Das blöde bei diesen Ansatz ist, dass man sich die Abweichungen mehr oder weniger "merken" muss, da eine Änderung in der Acesstabelle natürlich erstmal keine Änderung des tags nach sich zieht.
Anderseits kann man die Abfragen natürlich auch zum Export benutzen .... unbd das dann wieder über Mp3tag importieren.
Das ist aber ein ziemlicher Tanz, meine ich. da ist der (ebenso manuelle) Vergleich mit WMP oder iTunes eigentlich ebenso schnell und Dank drag&drop von iTunes nach Mp3tag einfacher, da Mp3tag nur diese Dateien laden muss und nicht die ganze Bibliothek...
Jeder finde seinen Workflow selbst.

Danke für Eure Ideen, inkl. Fuzzy-Ansatz!

Mich interessierte es aufgrund Deines berechtigten Hinweises konkret, wieviele solcher Exoten es gibt (bzw. wieviele davon in MusicBrainz zu finden sind). Falls es jemanden interessiert: Stand 16.3.2012 gibt es mehr als 150 davon!
Ein paar Müsterchen:
adoptedCHILD
afterEIGHT
anTUNiA
brAssMEN
c0ntaX (Null anstelle O)
digital ENERGY
lug00ber & OptimizE

nicht aufgeführt habe ich hier die ebenfalls aus der Reihe tanzenden Interpreten mit Zahlen in ihren Namen,
wie z.B.
2pointS
2zuAINZ
3xOVER
8traC

etc etc. Da muss ich wohl zuerst noch mehr Hirnschmalz investieren. :stuck_out_tongue: :rolleyes: