Codage de XML

Les caract�res du document de XML peuvent �tre cod�s dans diff�rents formats. Par d�faut XML emploie le jeu de caract�res d'Unicode (UTF-8 ou UTF-16), mais d'autres codages peuvent �tre employ�s s'ils sont d�clar�s dans la d�claration de XML au d�but du document.

En raison du probl�me de codage vous pouvez obtenir diff�rentes erreurs, quand vous essayez de charger un document de XML dans l'Internet Explorer :

� Commuter du codage courant au codage indiqu� non soutenu. �

Un tel type d'erreur produisent d'en raison de la contradiction entre le codage de caract�re indiqu� dans la d�claration de XML et le codage r�el de caract�re employ� pour arranger le document de XML. Dans XML tous les caract�res viennent du jeu de caract�res universel (UCS), qui associe toujours un point de code num�rique � chaque caract�re. Beaucoup d'algorithmes existent pour les points de code convertissants dans un ordre des bytes. Un codage sp�cifique de caract�re doit �tre employ� pour arranger un document de XML. Par exemple, si vous dactylographiez un document de XML dans le bloc-notes et �conomiser lui, vous pouvez choisir d'un de plusieurs des codages soutenus de caract�re comprenant ISO-8859-1, UTF-8, ou UTF-16.
Selon les sp�cifications de XML 1.0, tous les processeurs sont exig�s automatiquement pour d�tecter et soutenir les codages UTF-8 et UTF-16. Vous n'avez pas besoin d'une d�claration de XML si vous employez un de ces deux codages en arrangeant vos documents,

<?xml version="1.0" encoding="UTF-8"?>

Si vous employez le codage diff�rent autre qu'UTF-8/UTF-16, alors vous devez employer une d�claration de XML pour indiquer le codage r�el utilis�. Sans savoir ce que le codage a �t� employ� r�ellement comment oser le processeur a-t-il lu l'information de codage ?
Il est facile pour des processeurs d'auto-detect entre UTF-8/UTF-16 avec ou sans une d�claration de XML en recherchant une marque d'ordre de byte (BOM) exig�e dans les documents UTF-16. Pour tous autres codages, vous savez que les cinq premiers caract�res doivent �tre � < ? xml �. Puisqu'un processeur donn� soutiendra seulement un ensemble fini de codages, on peut employer un algorithme de force brutale qui regarde simplement les bytes premiers pour d�terminer la famille du codage de caract�re utilis� (il y a cinq familles de codage possibles comprenant UTF-16 grand endian, UTF-16 peu endian, UCS-4 ou tous autres codage, EBCDIC, et tout de 32 bits autrement). Une fois que le processeur d�tecte la famille de codage, elle peut lire le reste de la d�claration de XML (puisque seulement un ensemble restreint de caract�res peut �tre employ� dans la d�claration de XML), alors il peut commuter � employer le codage indiqu� de caract�re chez la famille d�tect�e. Si, en ce moment, la d�claration de XML indique le processeur commuter � un codage d'une famille compl�tement diff�rente, cette erreur se produit.
Ainsi quand vous sauvez un document en utilisant un codage sp�cifique, puis indiquer un codage diff�rent dans la d�claration de XML, vous obtiendra cette erreur parce que les codages doivent convenir.

Un caract�re inadmissible a �t� trouv� dans le contenu des textes.

Ce message d'erreur produisent de quand un caract�re dans le document de XML pas match l'attribut de codage et aucun n'importe quel attribut de codage n'a �t� indiqu�. Normalement vous recevrez ce message d'erreur si votre document de XML contient les caract�res � �trangers � et le dossier �tait sauv� avec un r�dacteur de codage de simple-byte comme le bloc-notes.

Bloc-notes de Windows 2000 sans codage

Les dossiers de bloc-notes de Windows 2000 peuvent sauver comme format d'Unicode.

�conomiser le dossier de XML ci-dessous comme Unicode (pays que le document ne contient aucun attribut de codage) :

<?xml version="1.0"?>
<Country>
<from>India</from>
<to>China</to> </Country>

Le dossier ci-dessus ne produira pas d'une erreur dans IE 5+, Firefox, ou op�ra, mais il produira d'une erreur dans Netscape 6.2.

Bloc-notes de Windows 2000 avec le codage

Les dossiers de bloc-notes de Windows 2000 sauv�s comme Unicode emploient le format � UTF-16 � de codage.

Si vous ajoutez un attribut de codage aux dossiers de XML sauv�s comme Unicode, les fen�tres codant des valeurs produiront d'une erreur.

Le codage suivant ne produit pas du message d'erreur :

<?xml version="1.0" encoding="windows-1252" ?>

-<Country>
<to>China</to>
<from>India</from>
<heading>remind language</heading>
<body>Norwegian: ��. French: ��</body>
</Country>

Le codage suivant ne produit pas du message d'erreur :

<?xml version="1.0" encoding="ISO-8859-1" ?>

-<Country>
<to>China</to>
<from>India</from>
<heading>remind language</heading>
<body>Norwegian: ��. French: ��</body>
</Country>

Le codage suivant ne produit pas du message d'erreur :

<?xml version="1.0" encoding="UTF-8" ?>

-<Country>
<to>China</to>
<from>India</from>
<heading>remind language</heading>
<body>Norwegian: ��. French: ��</body>
</Country>

> le codage suivant ne produira pas d'une erreur dans IE 5+, Firefox, ou op�ra, mais dans Netscape 6.2 il produira d'une erreur.

<?xml version="1.0" encoding="UTF-16" ?>

-<Country>
<to>China</to>
<from>India</from>
<heading>remind language</heading>
<body>Norwegian: ��. French: ��</body>
</Country>

Keywords: xml document, xml parser, xml schema, xml declaration, xml-encoding, xsl encoding, xml encoding, xml encode, xml unicode encoding, xslt encoding, xml charset, xml base64, xml encoding declaration, xml encoding utf 8, xml encoding iso 8859 1, java xml encoding, xml iso 8859 1, xml character encoding, xml iso 8859, xml encoding iso 8859, xml encoding utf, xml encoding iso, xml encoded, xml version 1.0 encoding utf 8, xml version 1.0 encoding, xml version 1.0 encoding iso 8859 1, javax xml rpc encoding, xml version 1.0 encoding utf 16.

HTML Quizes

XML Quizes