HTML-Kuriositäten - Was ist das, woher kommt das?

  • Hi,


    mir sind im Laufe der Zeit zwei Sachen aufgefallen, die mich an HTML maßlos irritieren. Beide Sachen treten auf mehreren Maschinen auf, es könnte etwas mit dem teilweise verwendeteten Editor (MSE7) zu tun haben.


    1. Phantomzeichen am Anfang des Dokumentes.


    Ich erstelle meine Ebay-Beschreibungen offline und kopiere sie dann in das jeweilige Feld. Dabei entstehen oft Zeichen am Anfang des Dokumentes. In der HTML-Ansicht sind es kleine Punkte, etwa so: ° . Dargestellt werden sie dann als Quadrat (keine Ahnung, wie ich das hier rein bekomme: Dieses Zeichen, dass wie die Platzhalter aus der Grundschule aussieht. *g). Immer am Anfang der Datei.


    Das Ding lösche ich dann, wenn ich aber noch mehr verändere kommt es wieder.


    Was ist das?


    2. Geisterzeilenumbrüche


    In meinem Job übersetze ich Dateien (technische Dokumentationen). Dabei gibt es des öfteren mal Stellen, an denen der Inhalt einer Datei wiedergegeben wird.
    Das sieht dann so aus:


    UpdateRate="200"
    QualityCeiling="GOOD"
    UpdateRate="200"
    QualityCeiling="GOOD"
    UpdateRate="200"
    QualityCeiling="GOOD"
    .
    .


    (in Wirklichkeit stehen hier viele verschiedene Einträge und deren 20 - 150).
    Immer mal wieder, wenn ich in diese Dateien dann wieder reinschaue, sind dort in dieser Aufzählung Zeilenumbrüche über viele Zeilen (5-20 Leerzeilen) entstanden. Die korrigiere ich dann, speichere - und manchmal sind sie sofort wieder da.



    Weiß jemand, was das ist und woher es kommt?

    Walking on water and developing software from a specification are easy if both are frozen.
    – Edward V Berard

  • Re 1: Phantomzeichen.


    Das liegt an verschiedenen Zeichen-Encodings. Ganz einfach gesagt, hat jedes Dokument neben den Zeichen die du getippt hast, noch "Meta-Informationen" für welches Encoding es gedacht ist. Beim Copy & Paste geht diese Information verloren, und es bleibt dem Zufall überlassen wie die Zeichen interpretiert werden. Aufgrund bestimmter historischer Gegebenheiten macht es bei den meisten "normalen" Buchstaben keinen Unterschied, es sei denn es macht eben einen Unterschied ( :D ).


    Falls dich die Hintergründe interessieren:
    http://intertwingly.net/stories/2004/04/14/i18n.html
    http://www.joelonsoftware.com/articles/Unicode.html


    und weiterführende Links.

    "That's not a hair question. I'm sorry." - 01/31/07 - Never forget!

  • Sencer, danke, das ist nachvollziehbar.


    Musel: Ich nutze den MSE7, der imo Teil der MS Development Suite ist.


    Zu den Geisterzeilenumbrüchen weiß niemand was? Die letzten Tage hatte ich mit solchen Listen nicht viel zu tun, wenn aber doch mal wieder werde ich an einen Screenshot denken.

    Walking on water and developing software from a specification are easy if both are frozen.
    – Edward V Berard

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!