Excel-Tabellen zusammenführen - machbar mit den vorliegenden Daten?

Hallo zusammen,

ich weiß, dass es hier Leute gibt, die mehr mit Tabellenkalkulation machen als ich. :slight_smile: Vielleicht würde ich es mit genug Geduld und Spucke selbst hinbekommen, aber wenn jemand sagt „ach, das ist ganz einfach, das geht so und so!“, wäre ich nicht böse darum!
Es geht um diese beiden Dateien:
Deutsche Begriffe
Rumänische Begriffe

Eigentlich benötige ich nur die Spalten B und C, aber Spalte A dient dazu, um festzustellen, ob die Tabellen richtig zusammengeführt werden.

Die Zahlen, die zu Beginn der Spalte C stehen, einschl. nachfolgendem Leerzeichen, dürfen gern entfernt werden.

Erst habe ich gedacht, das ist einfach, ich habe die beiden Tabellen nach Spalte A sortiert, und dann einfach die Spalten B+C aus der einen Tabelle in die andere kopiert, bis ich dann einfach mal irgendwo weiter unten einen Begriff rausgepickt habe und dabei feststellte, dass es vorne und hinten nicht passt.

Danach habe ich die Tabellenstruktur etwas genauer analysiert und festgestellt, dass die Fehler dadurch zustande kamen, weil es zu einem Begriff in der einen Tabelle teilweise 2 oder mehrere Entsprechungen in der anderen Tabelle gibt.

So ist das z. B. bei der ID 102: in der rumänischen Tabelle ist es eine Eintragung, in der deutschen sind’s aber zwei. Bei der ID 1021 gibt es in der rumänischen Tabelle eine Eintragung, in der deutschen aber ganze sechs. :-o

Die Zusammenführung müsste so erfolgen, dass die ID bleibt, dann bräuchte ich eine Spalte mit den rumänischen Begriffen aus der Spalte B und eine mit den deutschen Begriffen aus der Spalte B der anderen Datei. An den Stellen, wo es in einer der beiden Tabellen mehrere Eintragungen zur selben ID gibt, müssten die Begriffe trotzdem in einer Spalte erscheinen, aber durch einen senkrechten Strich getrennt: |. Das Gleiche dann für die Begriffe aus Spalte C in beiden Dateien.

Ist so etwas mit angemessenem Aufwand machbar??

Vielen Dank im Voraus für Ideen oder gar Lösungen. :slight_smile:
Christa

Moin, Christa,

sieht nicht trivial aus, deshalb meine Empfehlung: Umziehen, dort sitzen die Experten.

Gruß
Ralf

Eigentlich wollte ich SVERWEIS ist hier jetzt einwerfen, allerdings ist es ja eine n:m- und keine 1:n-Beziehung …

Ich würde beide Excels in jeweils eine Tabelle in eine MySQL-DB schmeißen und dann mittels SELECT die Daten rausholen … damit wäre ich schneller, als eine EXCEL-Funktionalität rauszufinden :innocent:

Aber mir kam jetzt gerade Power Query für Excel da noch in denn Sinn :thinking:

Kurz probiert: Es funktioniert mit Power-Query:
In einem neuen Excel bei „Daten“ „Neue Abfrage“ wählen, die beiden Excels „bearbeiten“ und dann mittels Daten kombinieren zusammenführen.
Ein bisschen eine Spielerei wird es vielleicht werden, aber mit zwei Beispieltabellen hat das perfekt funktioniert.

Hallo Ralf,

uff, ich wollte mich nicht in noch einem Forum registrieren, für wahrscheinlich eine einmalige Fragestellung.

Viele Grüße
Christa

Dessen bin ich mir nicht sicher, so genau habe ich die Tabellen nicht analysiert. Bisher ist mir nur aufgefallen, dass es zu einzelnen rumänischen Begriffen mehrere deutsche Entsprechungen gibt. Die rumänische Tabelle hat nur 14763 Zeilen, während die deutsche 18342 Zeilen hat.

Schön, dass du zu dieser Erkenntnis gekommen bist, nützt mir nur nichts, weil ich Power-Query gar nicht kenne. Insofern …

Viele Grüße
Christa

Servus Christa,

https://www.file-upload.net/download-14597547/eurovoc.xlsm.html zeigt beide Listen, da habe ich erstmal die Verkettung danebengestellt.

Gruß
Ralf

joa, das ist nicht schwer.
Bei Excel ist das imo Textverketten()

Problem dürfte sein, die doppelten Einträge zu umgehen.
(Edit: isses natürlich nicht. einfach weg denken)

Genereller Ansatz: Alle IDs zusammenfassen und doppelte löschen.
Dann für jede ID jeweils alle Einträge der jeweiligen Spalte einfügen.

Kannst du grob drüber schauen, ob das so gewollt war?
Hab der Übersicht wegen Zeilenumbruch, anstelle von | drin.

grüße
lipi

Hallo Ralf,

danke dir für deine Bemühungen, ich glaube aber, mit der aktuellen Version von lipi würde es schneller weitergehen. :slight_smile:

@littlepinguin: das sieht schon gut aus, aber in deinem Screenshot habe ich schon „Fehler“ gesehen , wofür du allerdings nichts kannst. Preisfestsetzung, Preisfixierung und Preisvorschlag sind unter derselben Nr. in Spalte A zusammengefasst, aber nur Preisfixierung und -festsetzung würde ich als Synonyme sehen, aber nicht Preisvorschlag! Ähnlich auch die Begriffe mit der ID 1026.

Ich brauche aber auch nicht alle Kombinationen, sondern aus deiner Tabelle die Spalten B+D in einer Tabelle und die Spalten C+E in einer anderen Tabelle, diese dafür aber ohne Duplikate. Du hast aber geschrieben

… also schon weggedacht! :smiley:

Kriegst du diese vierstelligen Zahlen zu Beginn der Spalten C und E auch weg?

Ich würde mir in einem Zwischenstand (nach Beseitigung der Dubletten) die Datei(en) anschauen, um zu entscheiden, ob aus einzelnen Zellen nicht doch teilweise getrennte Zeilen gemacht werden müssen (wie bei den oben genannten Beispielen), bevor die synonymen Begriffe wie zuerst von mir erwähnt mit den senkrechten Strichen getrennt werden, falls du noch Lust dazu hast. Wäre dir zu ewigem Dank verpflichtet. :slight_smile:

Viele Grüße
Christa

hi,

so?

Gleich vorauseilend: Trennung mit "|" oder " | "?

grüße
lipi

Guten Morgen!

Ja, oder auf zwei verschiedenen Tabellenblättern, das wäre egal. Ich möchte die beiden Spalten samt Übersetzungen sowieso getrennt erfassen, aber das kriege ich noch hin, zwei Spalten auf ein anderes Tabellenblatt zu kopieren/verschieben. :wink:

Das sieht schon ziemlich pervers aus, was du mir geschickt hast :smiley: (danke!), das hätte ich in diesem Leben wahrscheinlich nicht mehr hinbekommen!

Eigentlich egal, aber der Typ, dessen Vortrag ich mir angehört habe, der mich auf diese Idee überhaupt gebracht hat, meinte, dass die zweite Variante lesbarer wäre, also mit Leerzeichen vor und nach dem Trennstrich.

Viele Grüße
Christa

hi,

https://filehorst.de/d/dEGJxywq

Ich hab es vorher tatsächlich mit Openoffice versucht, und bin kläglichst gescheitert.
Mit Google waren das vermutlich keine 15 Minuten.
Das Werkzeug muss eben zum Problem passen.

grüße
lipi

1 Like

Schon, aber das ist nur dann hilfreich, wenn man mit dem Werkzeug auch umgehen kann!

Du bist mein Held! :grin: Vielen Dank!

1 Like

Dieses Thema wurde automatisch 30 Tage nach der letzten Antwort geschlossen. Es sind keine neuen Nachrichten mehr erlaubt.