Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.
Essayez le caractère é Unicode: il est doublé en é
Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carrى vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.
En rوgle gىnىrale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur ـ l'affichage, le diamant point d'interrogation ou carrى vide � apparaَt.
Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carrى vide �.
Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Il est utile de prىciser que tous les caractوres ASCII du code 0 ـ 127 gardent toujours les mيmes codes sans changement quelque soit le codage des caractوres, ASCII, GBK, Unicode...
Tous les caractوres ASCII ىtendus du code 0 ـ 255 (2**8=256, uni-octet, mono-byte) peuvent يtre stockىs soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractوres multi-octet (multi-byte) avec un code supىrieur ou ىgal ـ 256, qui ne peuvent يtre conservىs que dans un fichier Unicode comme UTF-8, ou bien dans un format spىcifique (code page pays) tel le GBK pour les idىogrammes chinois.
Sur le web, un caractوre Unicode peut en outre s'exprimer en code entitى HTML, ainsi stockى dans un fichier du codage ASCII. Par exemple, l'idىogramme 语 signifiant Langue, peut يtre stockى en mode ASCII par la chaَne 语, composىe uniquement des ampersand &, diوse #, suivi par des chiffres du numىro dىcimal de ce caractوre en Unicode, et terminى par un point-virgule ;.
中国应对人类作出较大的贡献!
La Chine doit faire une contribution relativement grande l''Humanitى!
ويتعين على الصين تقديم اسهامات اكبر للبشرية!
Китай должен сделать больший вклад в человечество!
Κίνα θα πρέπει να συμβάλει περισσότερο στην ανθρωπότητα!
中国は人類に大きな貢献をしてください!
בסין יש תרומה גדולה לאנושות!
चीन मानव जाति के लिए एक बड़ा योगदान करना चाहिए!
จีนควรจะให้มีส่วนร่วมมากขึ้นเพื่อมนุษยชาติ!
چین باید سهم بیشتری به انسان را!
China shall make a relatively great contribution to the Man Kind!
Cette page est stockىe dans le disque dur en format ANSI/ASCII. Mais je vous propose de l'afficher en diffىrents codages. Elle peut devenir illisible si le codage diffوre trop. Il faut revenir en ASCII si vous avez mal ـ la tيte. Testez vous-mيme sur votre navigateur en cliquant sur les liens suivants:
[Dأ�tection Auto] (auto) | Arabe (ISO-8859-6) | Arabe (Windows-1256) | ASCII Europe Occidentale (ISO-8859-1) | ASCII Europe Occidentale (Windows-1252) | Baltique (ISO-8859-4) | Baltique (Windows-1257) | Celtique (ISO-8859-14) | Chinois Simplifiأ� (GB18030) | Chinois Simplifiأ� (GB2312) | Chinois Simplifiأ� (GBK) | Chinois Simplifiأ� (HZ) | Chinois Traditionnel (Big5) | Corأ�en (EUC-KR) | Cyrillique (ISO-8859-5) | Cyrillique (KOI8-R) | Cyrillique (KOI8-U) | Cyrillique (Windows-1251) | Estonien (ISO-8859-13) | Europe Centrale (ISO-8859-2) | Europe Centrale (Windows-1250) | Europe Sud (ISO-8859-3) | Grec (ISO-8859-7) | Grec (Windows-1253) | Hأ�breu (Windows-1255) | Hأ�breu (ISO-8859-8) | Hأ�breu (ISO-8859-8-l) | Japonais (EUC-JP) | Japonais (ISO-2022-JP) | Japonais (Shift_JIS) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | Thaأ� (TIS-620) | Turc (ISO-8859-9) | Turc (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamien (Windows-1258).