Ich brauch eine möglichkeit bestimmte stichwörter in einen pdf dokument rauszusuchen und diese + den satz in dem sie sind, zu markieren/ kopieren o.ä
kann mir jemd helfen!!!
Ich brauch eine möglichkeit bestimmte stichwörter in einen pdf dokument rauszusuchen und diese + den satz in dem sie sind, zu markieren/ kopieren o.ä
kann mir jemd helfen!!!
Hi, damit kenne ich mich nicht aus- tut mir leid.
Prinzipiell ist PDF natürlich kein Textverarbeitungsformat. D.h. Texte sind Zeile für Zeile bzw. gar Zeichen für Zeichen im Dokument positioniert. Das Problem tritt insbesondere dann zutage wenn versucht wird den Text z.B. für e-Books umzubrechen. Klappt manchmal oder eben auch nicht.
Für Deinen Zweck ist es vermutlich am Besten das PDF-Dokument als Textdatei zu speichern. So machen es auch (implizit) die Suchfunktionen für z.B. CMS-Systeme wie Typo3.
Der Reader bietet diese Möglichkeit über „Datei -> Speichern unter -> Text“.
Das Konvertieren von mehreren Dateien auf einmal (Batch) klappt z.B. über die Batchfunktion von der Acrobat Vollversion.
Alternativ kann man z.b. das Kommandozeilentool „pdftotext“ vom xpdf-paket verwenden: http://www.foolabs.com/xpdf/download.html
Die resultierenden Textdateien kann man dann recht leicht mit einem selbstgebasteltem Script auswerten. Natürlich gibt es auch Kommandozeilentools die Textdateien auswerten z.B. „grep“ oder „sed“ aus dem Unix-Lager.
Nicht alle PDF-Dateien liefern allerdings verwertbare Texte. (Passwort-)Geschützte PDF-Dateien unterbinden diese Art der Umwandlung meistens da dort keine Entnahme von Daten gewünscht ist. Ebenso enthalten manche PDF-Dateien den Text als Grafik, z.B. wenn es sich um gescannte Inhalte oder Faxe handelt.
Da gibt es dann nur die Möglichkeit entweder zuvor die OCR-Texterkennung der Acrobat Vollversion anzuwenden oder die PDF-Dateien in Grafiken umzuwandeln und damit ein externes OCR-Programm zu füttern. Je nach Vorlagenqualität mit gemischten Ergebnissen
Hallo 2ws3ed,
eigentlich ganz einfach: Wenn Du die PDF-Datei geöffnet hast, kannst Du in „Bearbeiten“ auf „Suchen“ klicken, oder Du drückst die Tasten „Strg“ + „F“ gleichzeitig, dann öffnet sich ein kleines Fester. In das Fenster gibst Du das von Dir gesuchte Wort ein und klickst auf „Enter“ dann sollte der Suchbegriff markiert worden sein. Sollte der Suchbegriff mehrmals in dem Dokument stehen, klicke weiter auf die „Enter-Taste“. Hast Du den Suchbegriff gefunden, gehe mit dem Mauszeiger vor das erste Wort, das Du kopieren möchtest, klicke auf die linke Maustaste und bleibe drauf, nun ziehst Du den Mauszeiger bis hinter das letzte Wort, das Du kopieren möchtest und lässt die Maustaste wieder los (der Satz ist nun markiert). Jetzt klickst Du gleichzeitig auf „Strg“ + „C“, oder Du gehst mit dem Mauszeiger auf die markierte Fläche und klickst mit der rechten Maustaste um ein Untermenü zu öffnen, in dem Du den Befehl „Kopieren“ findest, nun ist der Satz kopiert und Du kannst ihn dann in ein anderes Dokument (Word, Excel, Mail usw.) mit der Tastenkombination „Strg“ + „V“ einfügen (oder Du klickst wieder auf die linke Maustaste und im Untermenü dann auf „Einfügen“.
Gruß
boerni57
Leider nur zum Teil mit einer Idee: Wenn Sie die Möglichkeit finden das PDF in eine Textverarbeitung zu laden, können Sie mit einem Makro ihre gewünschte Funktion realisieren.
weiss ich leider auch nicht.