Einbinden eines mehrseitigen PDF in Word

PHANTOM_4baf88 · 31. Oktober 2009 um 11:50

Hallo an alle!

Ich benutze Word 2008 für Mac, jedoch funktioniert es unter Windows genausowenig.

Ich will gerne ein PDF in Word einbinden (nicht anhängen o.ä. so dass Kopf- und Fußzeile des Word-Dokuments erhalten bleiben).

Nun kann man das ja eigentlich über
„Einfügen -> Objekt -> Von Datei“ machen.

Das Problem ist aber folgendes: Beim erstmaligen Öffnen des PDF kann man die Seite auswählen, die man einbinden will. Aber nur eine Seite!
Macht man dann wieder „Einfügen -> Objekt -> Von Datei“ und wählt das gleiche PDF aus, so wird immer nur diese Seite wieder eingefügt; man kann nicht auswählen welche Seite man nun haben will!

Was mache ich denn falsch? Unter Windows tritt dies ebenfalls auf!

Hat jemand eine Idee?
Gruß PHANTOM

Thomas_Kregeloh · 31. Oktober 2009 um 18:09

Hallo Phantom,

hast Du mal darüber nachgedacht, den Text aus dem PDF zu extrahieren?
Welche der folgenden Optionen sich empfiehlt, hängt vom Umfang des PDF-Dokuments ab.

Die erste: Im PDF-Reader kann man unter Umständen den Text markieren (es gibt wahrscheinlich auch Extrahierungs-Tools) und dann in das Word-Dokument importieren.

Die zweite: Es gibt Tools, die aus einem PDF eine Reihe von Bitmaps erzeugen. Diese könnten dann per OCR gelesen werden, und das Ergebnis ließe sich ebenfalls in das Word-Dokument importieren.

Wäre das für Dich akzeptabel?

Thomas

PHANTOM_4baf88 · 31. Oktober 2009 um 18:42

Nein, leider nicht akzeptabel, sonst hätte ich das schon längst gemacht. Die Formatierung geht hierbei vollkommen verloren.
Auch habe ich keine Lust Screenshots von den Seiten zu machen, da es doch einige sind.

Mir fiel nur die Methode ein, dass ich aus dem PDF jede Seite als PDF speichere, dann kann ich es mit aufnehmen. Aber auch nicht so der beste Weg. Ich stoße leider mal wieder auf die Grenzen von Word

Gruß PHANTOM

Thomas_Kregeloh · 31. Oktober 2009 um 19:32

>>> Die Formatierung geht hierbei vollkommen verloren.

Da ich sehr viel mit OCR-Erkennung arbeite, weiß ich, dass moderne Texterkennungsprogramme Formatierungen erkennen - auch Tabellen.

Ich will Dich zu nichts überreden.

Thomas

PHANTOM_4baf88 · 1. November 2009 um 10:04

Das sind mathematische, kryptografische Inhalte, ich bezweifle sehr, dass das OCR das alles erkennt.
Und ich habe gehofft, es kommt eine Antwort ind er Art: „du musst nur das und das machen, dann haut es hin“, scheint aber nicht der Fall mit Word zu sein.

Gruß PHANTOM

Thomas_Kregeloh · 1. November 2009 um 11:27

Sofern Dein PDF per Drucken generiert wurde und nicht ein verPDFter Scan ist, kannst Du im Acrobat Reader den kompletten Text markieren und per Zwischenablage in das Word-Dokument importieren. Hatte ich in meiner ersten Antwort schon erwähnt.

PHANTOM_4baf88 · 1. November 2009 um 11:43

Ja, wenn das alles so einfach wäre, wenn das nur reiner Text wäre, hätte ich das schon längst rausgezogen. Es ist von allem was dabei: eingebundene Bilder, „normaler Text“, mathematisches Zeug und natürlich auch eingescannte Sachen. Und die Teile kommen auch nicht am Stück in das Word Dokument, sondern verteilt über das Dokument.
Auch habe ich keinen Zugang zu diesem PDF, dass ich mir sozusagen das Original holen könnte.

Ich will/muss das PDF so in mein Word Dokument bringen. Hatte ja keine Ahnung, dass das so problematisch ist.

Gruß PHANTOM

Felix_W_9c131d · 1. November 2009 um 13:50

Hallo,

du könntest mit pdftk http://www.accesspdf.com/pdftk/ dein pdf in einzelne Dateien aufspalten. Das geht mit einem Befehl: pdftk mydoc.pdf burst

Cheers, Felix

PHANTOM_4baf88 · 1. November 2009 um 15:23

Das mache ich grad schon
Nächstes Mal wieder LaTeX statt Word, das steht fest.

Gruß PHANTOM