Die Buchstaben des XML Dokumentes k�nnen in den unterschiedlichen Formaten kodiert werden. Durch R�ckstellung benutzt XML den Unicode (UTF-8 oder UTF-16) Zeichensatz, aber andere kodierungen k�nnen verwendet werden, wenn sie in der XML Erkl�rung am Anfang des Dokumentes erkl�rt werden.

Wegen des kodierenproblems kannst du unterschiedliche St�rungen erhalten, wenn du versuchst, ein XML Dokument in Internet Explorer zu laden:

�Von der gegenw�rtigen kodierung zur spezifizierten nicht gest�tzten kodierung schalten.�

Solche Art St�rung erzeugen wegen der Unbest�ndigkeit zwischen der Buchstabe kodierung, die in der XML Erkl�rung spezifiziert werden und der tats�chlichen Buchstabe kodierung, die serialize das XML Dokument verwendet wird. In XML kommen alle Buchstaben vom Universalzeichensatz (UCS), der immer einen numerischen Kennzahlpunkt mit jedem Buchstaben verbindet. Viele Algorithmen bestehen f�r umwandelnde Kennzahlpunkte in eine Reihenfolge von Bytes. Eine spezifische Buchstabe kodierung mu� serialize verwendet werden ein XML Dokument. Z.B. wenn du ein XML Dokument in Notizblock und au�er ihm schreibst, kannst du von einem von mehreren gest�tzte Buchstabe kodierungen einschlie�lich ISO-8859-1, UTF-8 oder UTF-16 w�hlen.
Entsprechend der XML 1.0 Spezifikation werden alle Prozessoren angefordert, die kodierungen UTF-8 und UTF-16 automatisch zu ermitteln und zu st�tzen. Du ben�tigst nicht eine XML Erkl�rung, wenn du eine dieser zwei kodierungen verwendest, wenn deine Dokumente serializing,

<?xml version="1.0" encoding="UTF-8"?>

Wenn du unterschiedliche kodierung anders als UTF-8/UTF-16 verwendest, dann mu�t du eine XML Erkl�rung verwenden, um die tats�chliche verwendete kodierung zu spezifizieren. Ohne zu wissen was kodierung wirklich verwendet wurde, wie k�nnen, las der Prozessor die kodiereninformationen?
Es ist einfach f�r Prozessoren, zwischen UTF-8/UTF-16 eine XML Erkl�rung mit oder ohne auto-detect, indem man nach einer Byteauftrag Markierung (BOM) erfordert in den Dokumenten UTF-16 sucht. F�r alle weiteren kodierungen wei�t du, da� die ersten f�nf Buchstaben sein m�ssen �<? xml�. Da ein gegebener Prozessor nur einen begrenzten Satz kodierungen st�tzt, kann ein Gewaltalgorithmus verwendet werden, der einfach die ersten Bytes betrachtet, um die Familie der Buchstabe kodierung festzustellen, die verwendet wird (es gibt f�nf m�gliche kodierenfamilien einschlie�lich UTF-16 grosses endian, endian UTF-16 wenig, UCS-4 oder andere kodierung mit 32 Bits, EBCDIC und alles sonst). Sobald der Prozessor die kodierenfamilie ermittelt, kann sie den Rest der XML Erkl�rung (da nur ein eingeschr�nkter Satz Buchstaben in der XML Erkl�rung benutzt werden kann), dann es lesen kann zum Verwenden der spezifizierten Buchstabe kodierung innerhalb der ermittelten Familie schalten. Wenn, an diesem Punkt, die XML Erkl�rung dem Prozessor erkl�rt, zu einer kodierung von einer vollst�ndig anderen Familie zu schalten, da� St�rung auftritt.
So, immer wenn du ein Dokument mit einer spezifischen kodierung speicherst, dann eine andere kodierung in der XML Erkl�rung, du anzeigen erh�lt diese St�rung, weil die kodierungen zustimmen m�ssen.

Ein unzul�ssiger Buchstabe wurde im Textinhalt gefunden.

Diese Fehlermeldung erzeugen, wann ein Buchstabe im XML Dokument nicht das kodierung Attribut zusammenbringt und kein jedes m�gliches kodierung Attribut spezifiziert wurde. Normalerweise erh�ltst du diese Fehlermeldung, wenn dein XML Dokument �fremde� Buchstaben enth�lt und die Akte mit einem Einzelnbyte kodierenherausgeber wie Notizblock gespeichert wurde.

Windows 2000notizblock, ohne zu kodieren

Windows- 2000notizblockakten k�nnen als Unicode Format speichern.

Au�er der XML Akte unten als Unicode (Land, da� das Dokument kein kodierung Attribut) enth�lt:

<?xml version="1.0"?>
<Country>
<from>India</from>
<to>China</to> </Country>

Die Akte oben erzeugt NICHT eine St�rung in IE 5+, Firefox oder Oper, aber sie erzeugt eine St�rung in Netscape 6.2.

Windows 2000notizblock mit der Kodierung

Die Windows 2000notizblockakten, die als Unicode gespeichert werden, verwenden kodierenformat �UTF-16�.

Wenn du ein kodierung Attribut den XML Akten hinzuf�gst, die als Unicode gespeichert werden, erzeugen die Fenster, die Werte kodieren, eine St�rung.

Die folgende kodierung erzeugt nicht Fehlermeldung:

<?xml version="1.0" encoding="windows-1252" ?>

-<Country>
<to>China</to>
<from>India</from>
<heading>remind language</heading>
<body>Norwegian: ��. French: ��</body>
</Country>

Die folgende kodierung erzeugt nicht Fehlermeldung:

<?xml version="1.0" encoding="ISO-8859-1" ?>

-<Country>
<to>China</to>
<from>India</from>
<heading>remind language</heading>
<body>Norwegian: ��. French: ��</body>
</Country>

Die folgende kodierung erzeugt nicht Fehlermeldung:

<?xml version="1.0" encoding="UTF-8" ?>

-<Country>
<to>China</to>
<from>India</from>
<heading>remind language</heading>
<body>Norwegian: ��. French: ��</body>
</Country>

> erzeugt die folgende kodierung NICHT eine St�rung in IE 5+, Firefox oder Oper, aber in Netscape 6.2 erzeugt sie eine St�rung.

<?xml version="1.0" encoding="UTF-16" ?>

-<Country>
<to>China</to>
<from>India</from>
<heading>remind language</heading>
<body>Norwegian: ��. French: ��</body>
</Country>

Keywords: xml document, xml parser, xml schema, xml declaration, xml-encoding, xsl encoding, xml encoding, xml encode, xml unicode encoding, xslt encoding, xml charset, xml base64, xml encoding declaration, xml encoding utf 8, xml encoding iso 8859 1, java xml encoding, xml iso 8859 1, xml character encoding, xml iso 8859, xml encoding iso 8859, xml encoding utf, xml encoding iso, xml encoded, xml version 1.0 encoding utf 8, xml version 1.0 encoding, xml version 1.0 encoding iso 8859 1, javax xml rpc encoding, xml version 1.0 encoding utf 16.

HTML Quizes

XML Quizes