UTF-8 撌 ASCII 憅ćźčçš„ć€’çœźæ•ˆæžœ

Cette page encodée en Unicode (charset=UTF-8) a été mal interprétée par le navigateur en charset=ISO-8859-16: Roumain (ISO-8859-16).
ć›œé™…æ–‡ć­—çŒ–ç  | æ±‰ć­—ć›œé™…çŒ–ç  | äž­æ–‡ć›œæ ‡ GBK | äž­ć›œć­— | ASCII | ASCIIèĄš | ASCII => UTF-8 | UTF-8 => ASCII
Affichage du caractĂšre Ă©
Mnémonique
Cause d'Erreur
é
UTF-8 => ASCII
Page stockée en fichier local en format Unicode UTF-8 interprétée par erreur en ASCII
ASCII => UTF-8
Page stockée en fichier local en format ASCII interprétée par erreur en Unicode UTF-8

Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.

Essayez le caractère é Unicode: il est doublé en é

Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.

   
慹郹<=>掻物::!汀限äșŽéƒšćˆ†äș§ć“é€‰æ‹©!

Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carrĂ© vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.

En rÚgle générale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur à l'affichage, le diamant point d'interrogation ou carré vide � apparaßt.

Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carrĂ© vide �.

Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.

Il est utile de prĂ©ciser que tous les caractĂšres ASCII du code 0 Ă  127 gardent toujours les mĂȘmes codes sans changement quelque soit le codage des caractĂšres, ASCII, GBK, Unicode...

Tous les caractĂšres ASCII Ă©tendus du code 0 Ă  255 (2**8=256, uni-octet, mono-byte) peuvent ĂȘtre stockĂ©s soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractĂšres multi-octet (multi-byte) avec un code supĂ©rieur ou Ă©gal Ă  256, qui ne peuvent ĂȘtre conservĂ©s que dans un fichier Unicode comme UTF-8, ou bien dans un format spĂ©cifique (code page pays) tel le GBK pour les idĂ©ogrammes chinois.

Sur le web, un caractĂšre Unicode peut en outre s'exprimer en code entitĂ© HTML, ainsi stockĂ© dans un fichier du codage ASCII. Par exemple, l'idĂ©ogramme èŻ­ signifiant Langue, peut ĂȘtre stockĂ© en mode ASCII par la chaĂźne &#35821;, composĂ©e uniquement des ampersand &, diĂšse #, suivi par des chiffres du numĂ©ro dĂ©cimal de ce caractĂšre en Unicode, et terminĂ© par un point-virgule ;.

Citation de Mao pour tester:

äž­ć›œćș”ćŻčäșș类䜜ć‡șèŸƒć€§çš„èŽĄçŒźïŒ

La Chine doit faire une contribution relativement grande à l'Humanité !

ويŰȘŰčين Űčلى Ű§Ù„Ű”ÙŠÙ† ŰȘÙ‚ŰŻÙŠÙ… Ű§ŰłÙ‡Ű§Ù…Ű§ŰȘ Ű§ÙƒŰšŰ± Ù„Ù„ŰšŰŽŰ±ÙŠŰ©!

КотаĐč ĐŽĐŸĐ»Đ¶Đ”Đœ ŃĐŽĐ”Đ»Đ°Ń‚ŃŒ Đ±ĐŸĐ»ŃŒŃˆĐžĐč ĐČĐșлаЎ ĐČ Ń‡Đ”Đ»ĐŸĐČДчДстĐČĐŸ!

ÎšÎŻÎœÎ± Ξα πρέπΔÎč Μα συΌÎČΏλΔÎč πΔρÎčÏƒÏƒÏŒÏ„Î”ÏÎż στηΜ αΜΞρωπότητα!

äž­ć›œăŻäșșéĄžă«ć€§ăăȘèČąçŒźă‚’ă—ăŠăă ă•ă„ïŒ

Ś‘ŚĄŚ™ŚŸ Ś™Ś© ŚȘŚšŚ•ŚžŚ” Ś’Ś“Ś•ŚœŚ” ŚœŚŚ Ś•Ś©Ś•ŚȘ!

à€šà„€à€š à€źà€Ÿà€šà€” à€œà€Ÿà€€à€ż à€•à„‡ à€Čà€żà€ à€à€• à€Źà€Ąà€Œà€Ÿ à€Żà„‹à€—à€Šà€Ÿà€š à€•à€°à€šà€Ÿ à€šà€Ÿà€čà€żà€!

àžˆàž”àž™àž„àž§àžŁàžˆàž°àčƒàž«àč‰àžĄàž”àžȘàčˆàž§àž™àžŁàčˆàž§àžĄàžĄàžČàžàž‚àž¶àč‰àž™àč€àžžàž·àčˆàž­àžĄàž™àžžàž©àžąàžŠàžČàž•àžŽ!

چین ŰšŰ§ÛŒŰŻ ŰłÙ‡Ù… ŰšÛŒŰŽŰȘŰ±ÛŒ ŰšÙ‡ Ű§Ù†ŰłŰ§Ù† ۱ۧ!

China shall make a relatively great contribution to the Man Kind!

Cette page est stockĂ©e dans le disque dur en format UTF-8 sans BOM. Mais je vous propose de l'afficher en diffĂ©rents codages. Elle peut devenir illisible si le codage diffĂšre trop. Il faut revenir en UTF-8 si vous avez mal Ă  la tĂȘte. Testez vous-mĂȘme sur votre navigateur en cliquant sur les liens suivants:

[Auto Detection] (auto) | Arabic (ISO-8859-6) | Arabic (Windows-1256) | ASCII Western European (ISO-8859-1) | ASCII Western European (Windows-1252) | Baltic (ISO-8859-4) | Baltic (Windows-1257) | Central European (Windows-1250) | Chinese Simplified (GB18030) | Chinese Simplified (GB2312) | Chinese Simplified (GBK) | Chinese Simplified (HZ) | Chinese Traditional (Big5) | Cyrillic (ISO-8859-5) | Cyrillic (KOI8-R) | Cyrillic (KOI8-U) | Cyrillic (Windows-1251) | Greek (Windows-1253) | Hebrew (Windows-1255) | Hebrew (ISO-8859-8-l) | Celtic (ISO-8859-14) | Central European (ISO-8859-2) | Estonian (ISO-8859-13) | Greek (ISO-8859-7) | Hebrew (ISO-8859-8) | Japanese (EUC-JP) | Japanese (ISO-2022-JP) | Japanese (Shift_JIS) | Korean (EUC-KR) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | South European (ISO-8859-3) | Thai (TIS-620) | Turkish (ISO-8859-9) | Turkish (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamese (Windows-1258).

ć›œé™…æ–‡ć­—çŒ–ç  | æ±‰ć­—ć›œé™…çŒ–ç  | äž­æ–‡ć›œæ ‡ GBK | äž­ć›œć­— | ASCII | ASCIIèĄš | ASCII => UTF-8 | UTF-8 => ASCII
jinèŽ§ćž | zhongé’ŸèĄš | yiçż»èŻ‘ | cièŻć…ž | xieäčŠć†™ | zhuanć­—ç èœŹæą

æäŸ›ćéŠˆæ„è§ (1)

1. æ„èźżè€… *.*.182.* - 2015-10-19 10:04:52
ويŰȘŰčين Űčلى Ű§Ù„Ű”ÙŠÙ† ŰȘÙ‚ŰŻÙŠÙ… Ű§ŰłÙ‡Ű§Ù…Ű§ŰȘ Ű§ÙƒŰšŰ± Ù„Ù„ŰšŰŽŰ±ÙŠŰ©!
甔歐俥矱 çœ‘ç«™ćœ°ć€

èŻ·ćœšç©șæ Œé‡Œæ‰“ć…„ä»„äž‹ćź‰ć…šć­—çŹŠäžČ:
æ‹·èŽć­—çŹŠäžČ。

äž­ć›œéž‹ć­ > UTF-8 撌 ASCII 憅ćźčçš„ć€’çœźæ•ˆæžœ
  
爆蔷çȘ—揣    ć…łé—­
èŻ·è€ćżƒç­‰ćŸ…ć†…ćźčçš„ćˆ°æ„...