Jump to content

Seltsam formatiertes PDF-Dokument


Damian
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Empfohlene Beiträge

Hallo

Ich habe hier ein seltsames Problem mit einem PDF-Dokument. Das PDF wird im Viewer korrekt angezeigt, doch wenn ich Text daraus kopiere, wird dieser Text (egal bei welchem Editor) ohne jegliches Leerzeichen zwischen Wörtern, Zahlen oder Satzzeichen übernommen. Aus einem kopierten Absatz mit mehreren Zeilen wird also ein einziger Bandwurmsatz.

Selbst Konvertierungs-Tools (PDF zu RTF/DOC/HTML usw.) übernehmen diese eigenartige Formatierung.

Die Eigenschaften des PDF:

  • PDF-Version 1.3
  • Erstellt in QuarkXPress 8.01
  • Schriftarten sind eingebettet
  • Öffentliches Dokument ohne jegliche Einschränkungen

Ich vermute als Quelle dieses Verhaltens QuarkXPress. Ob Absicht, Fehlkonfiguration oder Bug kann ich nicht einschätzen. Was mich verwundert ist, das diese Formatierung in einem Standardformat wie PDF wirksam ist. Nochmal, die Anzeige im PDF-Viewer ist völlig in Ordnung. Andere Dokumente aus der gleichen Quelle machen keine Probleme.

Ich habe für mich eine Lösung gefunden. Das PDF im Opera-Browser mit dem internen PDF-Viewer anzeigen lassen. Dort kann der Text problemlos und fehlerfrei heraus kopiert werden.

Kennt sich hier jemand mit QuarkXPress aus und kann mir dieses Verhalten etwas näher erklären? Wenn es als reguläre Option im Programm angeboten wird, wofür benötigt man so etwas?

Bin gespannt auf die Antworten.


Damian

Link zu diesem Kommentar

Hallo Damian,

QuarkXPress kenne ich leider nicht. Wir erstellen unsere Dokumente alle mit LateX.

Bei LateX erstellt man einen Asciitext, der verschiedenste Formatierungstags enthält und am Ende ins PDF-Format kompiliert wird. Ähnlich wie bei HTML gibt es in einem Dokument hunderte von verschachtelten, öffnenden und schließenden solcher Tags.

Und auch wie bei HTML kann ein "Programmier"-Fehler zu verschiedensten, unspezifischen Effketen führen: von "das Dokument kann gar nicht kompiliert/ gelesen werden", bis zu solchen Dingen wie du sie beschreibst. Besonders wenn man die Warnungen beim Kompilieren nicht ernst nimmt.

Wenn Quark ein ähnliches Prinzip wei LateX hat, würde ich den Fehler hier vermuten.

 

blub

Link zu diesem Kommentar

Hallo

 

LateX ist ein Textsatz-Programm, um den Druck zum Beispiel von Büchern vorzubereiten. QuarkXPress hingegen ein Layout-Programm, um zum Beispiel Magazine, Broschüren und dergl. zu entwerfen. Die Arbeitsweise ist auch völlig unterschiedlich, von daher nicht vergleichbar.

 

Trotzdem Danke fürs Lesen und für die Antwort. :)

 

 

Damian

Link zu diesem Kommentar

Hi

 

Wäre denkbar, aber es handelt sich um ein standartisiertes PDF, das regelmäßig erscheint. Es ist das Amtsblatt der Stadt Duisburg. Wer selber mal schauen möchte: http://www.duisburg.de/rathaus/rathaus/publikationen/102010100000216500.php

 

Bis einschließlich Ausgabe Nr. 12 gab es keine Probleme. Nr. 13 ist das von mir beschriebene Problem-PDF. Nr. 14 ist sogar noch abgedrehter, da bekommt man beim Kopieren statt Text nur Zeichensalat. Bei Nr. 15 ist wieder alles ok.

 

Ich gehe inzwischen von einem Bedienungs-/Einstellungsfehler in QuarkXPress aus. Darum habe ich anfangs auch gefragt, ob es eine offizielle Option in diesem Programm ist und wofür man sie braucht.

 

Damian

Link zu diesem Kommentar

Habe auf PDF Nr. 13 jetzt mal einen anderen PDF-Viewer angesetzt. Dort erscheint an Stelle der Leerzeichen ein Fragezeichen. Das PDF hat anscheinend eine ganz krude Formatierung bekommen. Etwas, das nur bei der Anzeige in den PDF-Viewern funktioniert. Vielleicht wollte da jemand bei den Einstellungen in QuarkXPress besonders kreativ sein. :rolleyes:

 

Damian

Link zu diesem Kommentar
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Schreibe einen Kommentar

Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor-Fenster leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

×
×
  • Neu erstellen...