Inversion des codages des caractères UTF-8 et ASCII

Cette page encodée en Unicode (charset=UTF-8) a été mal interprétée par le navigateur en charset=ISO-8859-15: Latin 9 (ISO-8859-15).
Unicode Latin+ | Unicode Chinois | GBK | Idéogrammes | ASCII | Table ASCII | ASCII => UTF-8 | UTF-8 => ASCII
Affichage du caractÚre é
Mnémonique
Cause d'Erreur
é
UTF-8 => ASCII
Page stockée en fichier local en format Unicode UTF-8 interprétée par erreur en ASCII
ASCII => UTF-8
Page stockée en fichier local en format ASCII interprétée par erreur en Unicode UTF-8

Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.

Essayez le caractère é Unicode: il est doublé en é

Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.

   
Tous<=>Vivants::!Liste de Produits Filtrés!

Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carré vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.

En rÚgle générale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur à l'affichage, le diamant point d'interrogation ou carré vide � apparaît.

Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carré vide �.

Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.

Il est utile de préciser que tous les caractÚres ASCII du code 0 à 127 gardent toujours les mêmes codes sans changement quelque soit le codage des caractÚres, ASCII, GBK, Unicode...

Tous les caractÚres ASCII étendus du code 0 à 255 (2**8=256, uni-octet, mono-byte) peuvent être stockés soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractÚres multi-octet (multi-byte) avec un code supérieur ou égal à 256, qui ne peuvent être conservés que dans un fichier Unicode comme UTF-8, ou bien dans un format spécifique (code page pays) tel le GBK pour les idéogrammes chinois.

Sur le web, un caractÚre Unicode peut en outre s'exprimer en code entité HTML, ainsi stocké dans un fichier du codage ASCII. Par exemple, l'idéogramme 语 signifiant Langue, peut être stocké en mode ASCII par la chaîne &#35821;, composée uniquement des ampersand &, diÚse #, suivi par des chiffres du numéro décimal de ce caractÚre en Unicode, et terminé par un point-virgule ;.

Citation de Mao pour tester:

䞭囜应对人类䜜出蟃倧的莡献

La Chine doit faire une contribution relativement grande à l'Humanité !

ويتعين على الصين تقديم اسهامات اكؚر للؚ؎رية!

КОтай ЎПлжеМ сЎелать бПльшОй вклаЎ в челПвечествП!

ΚίΜα Ξα πρέπει Μα συΌβάλει περισσότερο στηΜ αΜΞρωπότητα!

䞭囜は人類に倧きな貢献をしおください

בסין יש תךומה גדולה לאנושות!

à€šà¥€à€š à€®à€Ÿà€šà€µ à€œà€Ÿà€€à€¿ à€•à¥‡ à€²à€¿à€ à€à€• à€¬à€¡à€Œà€Ÿ à€¯à¥‹à€—à€Šà€Ÿà€š à€•à€°à€šà€Ÿ à€šà€Ÿà€¹à€¿à€!

àžˆàžµàž™àž„àž§àž£àžˆàž°à¹ƒàž«à¹‰àž¡àžµàžªà¹ˆàž§àž™àž£à¹ˆàž§àž¡àž¡àž²àžàž‚àž¶à¹‰àž™à¹€àžžàž·à¹ˆàž­àž¡àž™àžžàž©àž¢àžŠàž²àž•àžŽ!

چین ؚاید سهم ؚی؎تری ØšÙ‡ انسان را!

China shall make a relatively great contribution to the Man Kind!

Cette page est stockée dans le disque dur en format UTF-8 sans BOM. Mais je vous propose de l'afficher en différents codages. Elle peut devenir illisible si le codage diffÚre trop. Il faut revenir en UTF-8 si vous avez mal à la tête. Testez vous-même sur votre navigateur en cliquant sur les liens suivants:

[Détection Auto] (auto) | Arabe (ISO-8859-6) | Arabe (Windows-1256) | ASCII Europe Occidentale (ISO-8859-1) | ASCII Europe Occidentale (Windows-1252) | Baltique (ISO-8859-4) | Baltique (Windows-1257) | Celtique (ISO-8859-14) | Chinois Simplifié (GB18030) | Chinois Simplifié (GB2312) | Chinois Simplifié (GBK) | Chinois Simplifié (HZ) | Chinois Traditionnel (Big5) | Coréen (EUC-KR) | Cyrillique (ISO-8859-5) | Cyrillique (KOI8-R) | Cyrillique (KOI8-U) | Cyrillique (Windows-1251) | Estonien (ISO-8859-13) | Europe Centrale (ISO-8859-2) | Europe Centrale (Windows-1250) | Europe Sud (ISO-8859-3) | Grec (ISO-8859-7) | Grec (Windows-1253) | Hébreu (Windows-1255) | Hébreu (ISO-8859-8) | Hébreu (ISO-8859-8-l) | Japonais (EUC-JP) | Japonais (ISO-2022-JP) | Japonais (Shift_JIS) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | Thaï (TIS-620) | Turc (ISO-8859-9) | Turc (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamien (Windows-1258).

Unicode Latin+ | Unicode Chinois | GBK | Idéogrammes | ASCII | Table ASCII | ASCII => UTF-8 | UTF-8 => ASCII
jinMonnaies | zhongHorloge | yiTraduction | ciDictionnaires | xieEcrire | zhuanEncoder

Envoyez vos commentaires (1)

1. Visiteur *.*.182.* - 2015-10-19 10:04:52
ويتعين على الصين تقديم اسهامات اكؚر للؚ؎رية!
Email Web

Veuillez recopier la chaîne :
Texte à recopier.

Chaussures Chinoises > Inversion des codages des caractères UTF-8 et ASCII
  
Fenêtre contextuelle    Fermer
Veuillez patienter...