Formatierungen aus Texten unter Windows sicher entfernen

Christoph Schweres
rigel-computer.com
Published in
3 min readJul 15, 2024

“Microsoft 365” scheint ja wirklich wie “aus einem Guss” — selbst aus “Teams“ heraus kann man Texte kopieren… und sie landen in Outlook mit der (zumindest annähernd) gleichen Formatierung (sieht man von überflüssigen Leerzeilen ab) wie das Teams-Original.

Grundlegend anders ist das bei Programmen, die NICHT von Microsoft stammen.

Viele Firmen setzen natürlich derart proprietäre Software ein.

SAP ist hier ein Beispiel, das Frontend wirkt heute noch so, als wäre ein besoffener Profi aus Schweden abends auf die Tastatur gefallen — und das bereits vor 20 Jahren. Dies allerdings soll hier jedoch nicht das Thema sein…

Programme, von Anwendern in verschiedensten Firmen weltweit benutzt, die NICHT mit Microsoft in Verbindung stehen, erleben vielfach ungeahnte … Effekte.

So auch ein aktuelles Beispiel

Eine CMS-Software, irgendwo in Italien gehostet, sorgt für “Digital Publishing” (kennt das überhaupt noch jemand?) eines deutschen Verlages.

Vom Redakteur wird ein Text eingegeben — und er verhält sich so (der Text, nicht der Redakteur), als wäre er unter dem Kommando von Captain James T. Kirk. von einer fremden Macht in Besitz genommen worden:

Völlig irreale Formatierungen, weder beabsichtigt noch in irgend einer Form gewollt, zerstören das Layout.

Merkwürdiges Layout? Eigentlich kein Problem… Eigentlich…

Normalerweise sucht man einfach die Tags, die dem Layout das surreale Aussehen verleihen — und manipuliert diese, sodass der Text wieder rein und klar ausgegeben wird. Normalerweise.

In diesem Falle nicht

Der Grund, diesen Post hier überhaupt zu veröffentlichen, ist der, dass mir persönlich das in 30 Jahren noch nicht untergekommen ist:

Ein Absatz wird wie üblich in Blocksatz formatiert — aber die Leerzeichen sind länger als ein Viertel-Geviert.

Klingt simpel. Blocksatz halt. Doch im konkreten Falle arbeitet das proprietäre CMS eigentlich tadellos — es trennt Worte passend, sodass der Blocksatz tadellos ausgegeben wird.

Der Text wirkt in der Ansicht total zerschossen

Was also tun?
Das Löschen eines dieser viel-zu-langen Leerzeichen führt dazu, dass … der nächste Buchstabe gelöscht wird.
Offensichtlich ist es (theoretisch) also doch nur ein einzelnes Leerzeichen, egal, wie breit es dargestellt wird.

Typischer Workarond:

Das Kopieren des betreffenden Textes in den Windows-Editor.
Normalerweise werden hier alle Tags, Formatierungen und Einflüsse durch Programme von Drittanbietern entfernt.
Normalerweise.
Diesmal nicht…

Der Text verhält sich EXAKT wie im Editor, exakt so wie in der Eingabemaske des CMS:
Absätze sind nicht zu sehen, aber auch nicht zu löschen.
Leerzeichen sind zu breit, das Löschen löscht lediglich den nächsten Buchstaben.

Völlig unverständlich

Den Text in dem besagten CMS zu öffnen, einen neuen Absatz zu kreieren und dann den verkorsten Mist abzutippen… das klappt.

Aber das ist so derart dämliche Arbeit, dass man sie niemandem wirklich zumuten kann, will… und sollte.

Die Lösung: Notepad++

Oder PsPad, das dürfte auch funktionieren.

Die meisten großen Firmen rollen derartige Programme in den Software-Installationen für ihre Mitarbeiter mit aus — vielleicht (und hoffentlich) haben sie Problemstellungen wie die beschrieben im Hinterkopf — und die Hoffung, dass mal die LÖSUNG vor dem Computer sitzt — und nicht das Problem — also dass jemand mit Intuition den richtigen Knopf drückt. Nämlich den für

Notepad++

Kopiert man besagten, völlig intrasparenten Code da hinein, werden wirklich alle Formatierungen entfernt. Es arbeitet auf Byte/Bit-Ebene, man kann echte und geschützte Zeilenumbrüche dezidiert ansprechen undsoweiterundsofort.

Aus Notepad++ herauskopiert ist der Text wirklich nackt

… und lässt sich problemlos in das allerletzte, noch so proprietäre Programm wo auch immer hergestellt einfügen…

…ohne, dass Formatierungen mit übernommen werden.

Wahrscheinlich ist den Meisten, die hier lesen, das bekannt.
Die Meisten arbeiten aber nicht da, wo ich arbeite…

Dort hält man man “Prompt” für eine Aufforderung zum schnellen Handeln und KI-generierte Bilder MÜSSEN Katzen enthalten, sonst sind sie uninteressant.

--

--

Christoph Schweres
rigel-computer.com

TYPO3 Certified Integrator - with lots of other interests