Namen und Briefdaten aus versandten Serienmail in

Hallo,

ich möchte aus ca. 3.000 Serienbriefen, die ich in Outlook 2003 per E-Mail mit PDF-Anhang versandt hatte, den Vor- und Zunamen der jeweiligen Personen und die zugehörigen E-Mail-Adressen herauslesen. Aufgrund der Menge kann ich das leider nicht per Hand machen.

In den PDF-Anhängen sind zudem Firma, Vor- und Zuname, Adresse, PLZ und Stadt im Briefkopf angegeben. Absolut großartig und hilfreich wäre es vor allem, wenn ich die Briefdaten aus den PDF-Anhängen herauslesen könnte.

Kann man das mit einem Data-Mining-Tool machen?

Da ich leider die Datenbank nicht mehr habe, muss ich die Daten wieder zusammen bekommen und möchte sie idealerweise z.B. in eine Excel-Datei einfließen lassen, um sie wieder zu verwenden.

Falls hilfreich, findet ihr im Anhang zwei Printscreens, damit ihr ungefähr seht, wie der brief und der anhang aufgebaut war.

Hallo Janphilipp84,
Data Mining bzw Text Mining ist hier nicht das richtige.
Denn unter Data Mining versteht man die systematische Anwendung von Methoden,
die meist statistisch-mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung.

Aber kopiere dir doch den Inhalt dieser 3.000 Daten nach Excel, Acess oder in den Ultra Edit und versuche Dir die Daten
dort automatisch mit manueller Unterstützung :wink: rauszuziehen.

Ich hoffe Dir etwas helfen zu können.
Gruß
Michél

ok danke, aber wie ziehe ich die daten aus outlook-e-mails nach excel? ich will mindestens mail-adresse, anrede und den Namen.

Hi,

da kann ich dir leider wenig helfen - ein Mining-Tool i.e.S. übernimmt doch andere Aufgaben. Evtl. suchst du einen Experten mit dem Stichwort „Outlook“ oder „Serien-Mail“?
Viel Glück und Erfolg!

Hallo!

„Da ich leider die Datenbank nicht mehr habe“ - mir ist nicht klar, was du überhaupt noch hast. Die Kopien der versandten Emails im „Gesendet“-Ordner von Outlook?

VG!

Christof

hallo, ich habe htm-emails mit Anrede, Nachname und natürlich die E-Mail-Adresse.

Jede Mail beginnt so: "

Sehr geehrte/r Herr/Frau XY

Blabla"

Das kann ja nicht so schwer sein, Leute. Es gibt doch sicher Codes, mit denen man das extrahieren kann. Ich weiss bloß nicht wie, weil ich das noch nie gemacht habe.

Lieber Jan

Eine Data Mining Tool wäre sicher nicht das Mittel der Wahl. Mit Data Mining kannst du Trends aus Daten herauslesen oder Daten in Gruppen einteilen.

Was du willst ist mehr eine Stringoperation, da deine Adressen wahrscheinlich in jedem Brief genau an der gleichen Stelle stehen. Dann könntest du die Anzahl Worte zählen die vor deiner Adresse stehen und dann anfangen herauszulesen.

Wie man dabei das PDF analysiert kann ich dir leider nicht sagen.

Also, Data Mining ist mit Sicherheit die falsche Richtung.

Einen schönen Donnerstag Abend wünsche ich dir,
Gruess,

Christoph

Hallo,

ich möchte aus ca. 3.000 Serienbriefen, die ich in Outlook
2003 per E-Mail mit PDF-Anhang versandt hatte, den Vor- und
Zunamen der jeweiligen Personen und die zugehörigen
E-Mail-Adressen herauslesen. Aufgrund der Menge kann ich das
leider nicht per Hand machen.

In den PDF-Anhängen sind zudem Firma, Vor- und Zuname,
Adresse, PLZ und Stadt im Briefkopf angegeben. Absolut
großartig und hilfreich wäre es vor allem, wenn ich die
Briefdaten aus den PDF-Anhängen herauslesen könnte.

Kann man das mit einem Data-Mining-Tool machen?

Da ich leider die Datenbank nicht mehr habe, muss ich die
Daten wieder zusammen bekommen und möchte sie idealerweise
z.B. in eine Excel-Datei einfließen lassen, um sie wieder zu
verwenden.

Falls hilfreich, findet ihr im Anhang zwei Printscreens, damit
ihr ungefähr seht, wie der brief und der anhang aufgebaut war.

frag einen Outlook Experten :wink:

sorry und Gruß

Michél

ok danke, aber wie ziehe ich die daten aus outlook-e-mails
nach excel? ich will mindestens mail-adresse, anrede und den
Namen.

Sehr geehrter Herr Dr. Holtz

das? Die Reihenfolge ist immer die gleiche bei Anrede und Nachname.

Mit welchem Programm mache ich das und welchen genauen Code benötige ich? Wen kann ich sonst damit beauftragen, da ich keine Erfahrung in solchen Dingen habe.

MFG
Jan Riebe

Genau, ich habe die HTML-Mails. Ausserdem die PDF-Anhänge.

Jedes HTML beginnt mit Sehr geehrter Herr … oder Sehr geehrte Frau …

Die Brifköpfe in den PDFs sind auch immer gleich aufgebaut.

Hallo. Leider komme ich mit diesem Tipp überhaupt nicht klar. Kann ich dich oder sonst einen Experten damit beauftragen?

Hallo Jan-Philipp!

Das ist weniger ein Datamining- als ein Programmierproblem, will mir scheinen. Bei mir tauchen jetzt weitere Fragen auf:

1.) Sind die Mails noch innerhalb von Outlook (also im pst-File) gespeichert, oder liegen sie als 1000 einzelne HTML-, bzw. pdf-Files vor?

2.) Haben die pdf’s individuelle Informationen, die sich nicht im HTML-Teil befinden und die auch extrahiert werden müssen?

Also, ein fertiges Tool, um das zu lösen, kenne ich nicht. Aber es lohnt sich sicher, mal dazu auf

http://www.heise.de/software/download/o0g0s3l11k1

danach zu suchen.

Wenn es so etwas nicht gibt, dann brauchst du einen guten Programmierer. Da gibt’s je nach Ausgang von Frage 1.) und 2.) wieder zwei Möglichkeiten:

VBA (Visual Basic for Applications), um automatisiert die Outlook-Mails aufzurufen, auszuwerten und das Extraktionsergebnis in eine Textdatei oder in Excel oder Access zu schreiben.

Oder „von aussen“ mit einem externen Programm, falls die Mails schon einzeln vorliegen.

Kann man alles machen, aber es ist schon ein gewisser Aufwand. Hängt noch stark davon ab, ob im pdf auch nochmal etwas ist, was man extrahieren muss. Falls ja, dann müsste man erstmal einen pdf2txt-Converter vorschalten, da pdf selbst ja nicht so einfach zu lesen ist.

Viele Grüsse!

Christof

vielen dank, ich werde das mit einem techniker besprechen.

Hi Jan

Ich hatte dir doch schon geantwortet. Warum hast du die Frage nochmal geschickt?

Beste Grüße

Christoph

Halllo!

Am besten wandelt man wohl die PDFs zuerst in reinen Text um.
Dazu gibt es fertige Tools (z.B. hier
http://www.pdf-to-html-word.com/pdf-to-text/ ),
die teilweise auch im Batch-Betrieb arbeiten können.

Aus den Textdateien sollte man dann mit Skripten (z.B. bash-Skripte mit regulären Ausdrücken) die Adressen extrahieren können, da sie ja an ziemlich festen Positionen in Text stehe,

Grüße
H.