แแฃ แแฅแแแ แฎแแ แ แแแแแแแแแ แ แแ แแแฅแแ แแแแแ แแแแก แแ แฉแแแแก แแแแชแแแ, แแแจแแ Unicode แแแแฅแแแก แงแแแแแแแแก แแฅแแแแ แกแฌแแ แ แแแแแกแแแแแ. แแแแแ แแขแฃแแ แฌแแ แแแแแแแแก แแแแแแ แแแแแแแแแแฃแแแ แแแแขแแฅแกแขแแ, แแแแ แแ แงแแแแแแ แฎแจแแ แแ แแฅแแช แแ แแก แฃแแแแแ แกแแแฃแ แ แแแกแฃแฎแ - UTF-8. แแแ แแ แแก แแ แแก, แ แแ แแก แกแแจแฃแแแแแแก แแแซแแแแ แแแแแแงแแแแ แฃแแแแแแแก แงแแแแ แกแแแแแแ แแแฎแแ แฏแแแก แแแ แแจแ แซแแแแแ แแแแ แ แแแแ แ แแแแขแ แฃแแแขแแก แจแแแแฎแแแแแจแ. แแแ แแแแแ, แแแแแแกแแแแก, แ แแแแแแแช แแงแแแแแแ แฃแคแ แ แแแขแก, แแแแ แ แฃแแ แแแแ แแแแแแฃแ แ แแแแแแ, "แแ แช แแกแ แแแแ แ" แแแแแช แแ แ แแแแขแ แแแแ แกแแแแแแแแ. แจแแแแแซแแแ แแฃ แแ แ แฃแแแแแกแ แแแแแแแแแ แแ แแแกแขแแ แแฃแ แแแจแแคแแ แแแจแ แแแแ แฃแแแแแก แแแ แแจแ, แ แแแแแแแช แแแแฆแฃแแแแก แแฎแแแแ 256 แฎแแแแแกแแฌแแแแแ แกแแแแแแแแ?
แฅแแแแแ แแ แแแแแแแแแ แแแแชแแแ แแ แแแแฎแแแแ แแแกแฃแฎแแก แแแชแแแแก แฉแแแก แแชแแแแแแแก แแ แแแแแแฎแแ แชแแแแแ แจแแแแ แแแแ แแแ แขแแแ แแแแแ แแแแ, แ แแแแแแช แกแแจแฃแแแแแแก แแแซแแแแ แจแแแแแฎแแ แฎแแแแแ แแกแแคแแแแก แฃแแแขแแก แแแแแ UTF-8-แจแ แแ แกแแแฃแแ แญแแ แแ แ แแแแแแแแแก แแแแแขแแแแก แแแ แแจแ.
แแแกแฃแฎแแกแแแแแแแแแก แฃแแ แงแแคแ. แแ แแแฃแงแแแแแแแแ แแแแแแแแแ แ แแแแแแแแ แแแแจแแแแแแแแ แแแแฅแแแก: แแฆแฌแแ แแแ แแแแแฌแงแแแขแ แแ แแ แแก แจแแแแแแแแแแแฃแแ UTF-8-แแก แฃแแแแแ แกแแแฃแ แ แจแแแชแแแแแแ, แแก แจแแกแแคแแ แแกแแ แแฎแแแแ แจแแแแฎแแแแแแแก แแแฌแ แ แกแแแจแ (แแแฌแแ แแแแแแ แแแแแ แฅแแแแแ) แแ แแ แแแแแแ แจแแแแฎแแแแแจแ แแ แฃแแแ แแฅแแแก แแแแแงแแแแแฃแแ แแแกแแแ แแฎแแ แแก API-แแแแแ แฃแ แแแแ แแแแแกแแแแก (แ แแแแแแแแช แแ แแ แแชแแแ แแแแก แจแแกแแฎแแ). แงแแแแแแ แฎแจแแ แแ, แแแแแแ แแแแแจแแฃแแแแแก แจแแแฃแแจแแแก แแแแแ แแแแแแ (แแแแแแแแแ, deflate) แจแแกแแคแแ แแกแแ แแแแ แแแชแฃแแแแแก แขแแฅแกแขแฃแ แ แแแแแชแแแแแแก แแแแแแฅแขแฃแ แ แจแแกแแแแฎแแ. แแแ แแ แแแแกแ, แฃแแแ แฉแแแ แแแแแฌแงแแแขแแก แจแแฅแแแแก แแ แแชแแกแจแ แแแแแแ แแ แกแแแฃแแ แกแขแแแแแ แขแ แแแแแ แฃแแแแแแจแ, แ แแแแแแช แแแแแ แแแก แแแแแ แแ แแแแแแแก - แแก แแ แแก แแแ แแแแฃแแฌแแแแ แฃแคแ แ แ แแฃแแ (แแ แฎแจแแ แแ แฃแแ แแกแ), แแแแ แแ แแแแแช แแแฆแแแฃแแ แกแขแแแแแ แขแแ แแ แแ แ แแฎแแแแ แแ แแแ แแฃแฎแแแ. แแแช แแแแแงแแแแแ แแแกแแ.
แฃแแแแแแแกแ แแ UTF-8-แแก แจแแกแแฎแแ
แแแกแแฌแงแแกแแกแแแแก, แ แแแแแแแแ แกแแขแงแแ แแแแก แจแแกแแฎแแ, แแฃ แ แ แแ แแก แแก Unicode ะธ UTF-8.
แแแแแฎแกแแแแแแ, แแแ แ แแแแฃแแแ แฃแแ แแงแ 8-แแแขแแแแ แแแแแ แแแ. แแแแแแ แงแแแแแคแแ แ แแแ แขแแแ แแงแ: 256 แกแแแแแแ แจแแแซแแแแ แแงแแก แแแแแแ แแแ 0-แแแ 255-แแแ, แฎแแแ 0-แแแ 255-แแแ แ แแชแฎแแแแ แแจแแแ แแ แจแแแซแแแแ แแงแแก แฌแแ แแแแแแแแแ แ แแแแ แช แแ แแ แแแแขแ. แแฃ แแแแแแแแแ แแแแฃแแ แฃแแแแแแ, ASCII แแแแแ แแแ แแแแแแแแ แจแแแแแคแแ แแแแแ 7 แแแขแแ, แแแแขแแ แแแกแ แแแแขแแก แฌแแ แแแแแแแแก แงแแแแแแ แแแแจแแแแแแแแแ แแแขแ แแ แแก แแฃแแ แแ 8-แแแขแแแแ แแแแแ แแแแก แฃแแแขแแกแแแ แแแแกแแแแแแ แแแกแแแ (แแกแแแ แแแแกแฎแแแแแแแแแ แแฎแแแแ "แแแแแจแ" แแแฌแแแ, แกแแแแช แงแแแแแแ แแแแจแแแแแแแแแ แแแขแ แแ แแก แแ แแ ).
แ แแ แแแแกแฎแแแแแแแ Unicode แแ แแแแแ แแแแกแแแ แแ แ แแขแแ แแ แแก แแแแแแจแแ แแแฃแแ แแแก แแแแแแ แแแแแ แแขแฃแแ แฌแแ แแแแแแแ - UTF-8, UTF-16 (BE แแ LE), UTF-32? แแแแ แแแแแแแแแ แแแแแแแแแแ แแแแ.
แฃแแแแแแแก แซแแ แแแแแ แกแขแแแแแ แขแ แแฆแฌแแ แก แแฎแแแแ แกแแแแแแแแแก (แแ แแแแแแ แ แจแแแแฎแแแแแจแ, แกแแแแแแแแแแก แชแแแแแฃแ แแแแแแแแแขแแแก) แแ แแแ แ แแชแฎแแแแก แจแแ แแก แจแแกแแแแแแกแแแแก. แแ แแ แกแขแแแแแ แขแจแ แแแแ แ แจแแกแแซแแ แ แแชแฎแแแ - แแแ 0x00
แแแ 0x10FFFF
(1 แชแแแ). แแฃ แแแแแแแแ แชแแแแแจแ แฉแแแกแแแ แ แแชแฎแแ แแกแแ แแแแแแแแแจแ, แแ แช 114 แแ แแ แช 112 แแแแขแ แแ แแฅแแแแแแ แกแแแแแ แแกแ. แแ แ แแแแแ แฉแแแแ แแ แแชแแกแแ แแแ แแ แแ แแก แซแแแแแ แจแแฅแแแแแ แกแแแแแแขแแแแ แ แแชแฎแแแแแ แแฃแจแแแแแกแแแแก, แฉแแแ แแซแฃแแแแฃแแ แแแฅแแแแแ แแแแแแแงแแแแ 1 แแแแขแ แแแแ แกแแแแแแแแ! แแก แแ แแก UTF-2, แแแแ แแ แแก แคแแ แแแขแ แแ แแ แแก แแแแฃแแแ แฃแแ แกแฌแแ แแ แแ "แแคแแแแแแแแแแแก" แแแแ.
แกแแแแแแแแ แแ, แฃแแแแแแจแ แกแแแแแแแแแแก แแแแแแแแแแ แแแ แจแแแแฎแแแแแแ แแ แแ แแก. แแแแ แแแแแ แแแแ แแแ แแแงแแคแแแแ 17 "แแแแแแคแ แแแแแแแ", แ แแแแแแแแแ แแแแแแฃแแ แจแแแชแแแก 65536 (0x10000
) "แแแแแก แฌแแ แขแแแแแ" "แแแแฃแ แ แฌแแ แขแแแแก" แแแแชแแคแชแแ แแฅ แฃแแ แแแแ แแ แแก แกแแแแแแแก แแแแแ แ, แแแแแญแแแฃแแ แแแก Unicode-แแก แแแแ . แแแแ แแ, แ แแแแ แช แแแแแ แแฆแแแแจแแแ, แฃแแแแแแจแ แแแแแ แแแ แแ แ แแฎแแแแ แชแแแแแฃแแ แกแแแแแแแแแ, แแ แแแแ แแแแ แแแแแแแแแขแแแ แแ แกแแ แแแกแแก แแแจแแแแ (แแ แแแแฏแแ แกแแแ แแแ แแ แแคแแ แ แจแแแกแแแแแแแ แ แแชแฎแแก - แจแแกแแซแแแ แแ แแ แแแกแแแแก, แแแแ แแ แฉแแแแแแแก แแก แแ แช แแกแ แแแแจแแแแแแแแแแ), แแกแ แ แแ. แฃแคแ แ แกแฌแแ แแ, แงแแแแแแแแก แแแแแ แแขแฃแแแ แแกแแฃแแ แแ แแแแแ แ แแชแฎแแแแแก แ แแแแแแแแแแ แแ แแ แ แกแแแแแแแแแแ. แแฃแแชแ, แจแแแแแแแจแ, แแแแแแ, แฎแจแแ แแ แแแแแแแงแแแแ แกแแขแงแแแก โแกแแแแแแโ, แ แแช แแฃแแแกแฎแแแแก แขแแ แแแแก โแแแแ แฌแแ แขแแแโ.
แฃแแแแแแแก แแแแแแคแ แแแแแแแ. แ แแแแ แช แฎแแแแแ, แแแกแ แฃแแแขแแกแ แแแฌแแแ (4-แแแ 13-แแแ แแแแแแคแ แแแแแ) แฏแแ แแแแแ แแแแแฃแงแแแแแแแแ.
แงแแแแแแ แกแแงแฃแ แแแฆแแแแ แแก, แ แแ แแแแแ แซแแ แแแแแ โแ แแแแแแโ แแแแก แแฃแแแแแ แกแแแ แขแงแแจแ, แแแก แ.แฌ.แซแแ แแแแแ แแ แแแแแแแแแแแ แแแแแแคแ แแแแแแแฃ แกแขแ แแฅแแแ แจแแแชแแแก แขแแฅแกแขแก แแ แ-แแ แ แแแแแแแแ แแแ แแแแแ (แแแ แจแแ แแก แฉแแแฃแ แแ), แแฅแแแ แแ แฌแแฎแแแแ แแ แกแแแ แขแงแแก แคแแ แแแแแก แแแ แแ. แแแแ แแ แแฅแแแ แแ แจแแแแซแแแแ แแแแแจแแ แแแแแ แฉแแแ Unicode - แแแแแแแแแ, emoji แซแแ แแแแแแ แแแแแแ แแแแก แแแแแจแ. แจแแแแแแ แแแแแแคแ แแแแแ"แแแแแขแแแแแ แแ แแแแแแแแแแแ แแแแแแคแ แแแแแโ (แแแ แแ แชแแแแแแ แกแแแแแ 0x10000
แแแ 0x1FFFF
). แแกแ แ แแ, UTF-16 แแแแแแแก แแแแก: แงแแแแ แกแแแแแแ, แ แแแแแแช แจแแแแก แจแแแแแ แซแแ แแแแแ แแ แแแแแแแแแแแ แแแแแแคแ แแแแแ, แแแจแแคแ แฃแแแ โแ แแแแ แช แแ แแกโ แจแแกแแแแแแกแ แแ แแแแขแแแแ แแแแ แแ. แแฃแแชแ, แแ แแแแแแแแแแก แแแแแแ แแ แ แแชแฎแแ แกแแแ แแแ แแ แแแฃแแแแแแก แแแแแ แแขแฃแ แกแแแแแแแแแแ, แแแแ แแ แแแฃแแแแแแก แแแแแ, แ แแ แแ แฌแงแแแแ แแแแขแแก แจแแแแแ แฃแแแ แแแแแแฎแแแแ แแแแแ แแ แแ - แแ แแแฎแ แแแแขแแก แแแแจแแแแแแแแแแก แแ แแแ แจแแ แฌแงแแแ, แแแแแฆแแแ แ แแชแฎแแก, แ แแแแแแช แแแแชแแแก แแแแแ แแแฅแแแแ Unicode แแแแแแแแแ. แแ แแแแแก แฐแฅแแแ "แกแฃแ แแแแขแ แฌแงแแแแแแ" - แจแแกแแซแแแ แแกแแแแแแ แแแ แจแแกแแฎแแ.
แแกแ แ แแ, UTF-16 แแแแแฎแแแก แแ แแ (แซแแแแแ แแจแแแแ แจแแแแฎแแแแแแจแ) แแแฎ แแแแขแก แแแแ "แแแแ แฌแแ แขแแแ". แแก แฃแแแแแกแแ, แแแแ แ แแฃแแแแแแ แแแแแแงแแแแ แแแฎแ แแแแขแ, แแแแ แแ แแแแแแฃแ แ (แแ แกแฎแแ ASCII แกแแแแแแแแแ) แแ แแแแ แแแแแ แแแแ แแแ แแแแก แกแแแ แชแแก แแแฎแแแแ แก แแฃแแแแแ. UTF-8 แจแแฅแแแแแแ แแแแก แแแแแกแแกแฌแแ แแแแแ: แแแกแจแ ASCII, แ แแแแ แช แแแ แ, แแฎแแแแ แแ แ แแแแขแก แแแแแแแก; แแแแแแแแแ 0x80
แแแ 0x7FF
- แแ แ แแแแขแ; แกแแฌแงแแกแ 0x800
แแแ 0xFFFF
- แกแแแ แแ แแแ 0x10000
แแแ 0x10FFFF
- แแแฎแ. แแ แแแก แแฎแ แแ, แแแแแแฃแ แ แแแแแแ แแแ แแ แแแฎแแ: ASCII-แแแ แแแแกแแแแแแแ แแแแ แฃแแแ แแ แแแแแฌแแแแแ แฃแคแ แ แแแแแแ แแ "แแแแ แชแแแแ" 1-แแแ 4 แแแแขแแแแ. แแแแ แแ แแแแแแฃแ แ แแแ แแ แกแฎแแ แแแแแแแแ, แกแแแฌแฃแฎแแ แแ, แแ แแแแแแ แกแแ แแแแแแก แแ แแแแฅแแก UTF-16-แแแ แจแแแแ แแแแ แแ แแแแ แก แแฎแแ แกแญแแ แแแแ แกแแแ แแแแขแ แแ แแก แแแชแแแแ - แแแแแแแแแ, แ แแแแแแช แแแคแแ แฃแแแ แแ แแแแขแแแแ แฉแแแแฌแแ แแ, 32-แฏแแ แจแแแชแแ แแ. 0xFFFF
แแแ 0x7FF
, แแ แแแกแจแ แแ แช แฉแแแฃแ แ แแ, แแแแแแแแแ, แฅแแ แแฃแแ แแ แจแแแแก. แแแ แแแแชแ แแ แฎแฃแแ แกแฎแแ แแแแแแ - hurray - แแฆแแแแแแ, 2 แแแแขแ แแแแ แกแแแแแแแแ.
แ แแขแแ แฎแแแแ แแก? แแแแฎแแ, แ แแแแ แฌแแ แแแแแแแแก UTF-8 แกแแแแแแแแแแก แแแแแแก:
แแแ แแแแแ แ แแชแฎแแแแแก แฌแแ แแแกแแฉแแแแ, แแฅ แแแแแแงแแแแแ แกแแแแแแแแ แแแแแจแแฃแแ แแแขแแแ x
. แฉแแแก, แ แแ แแ แแแแขแแแ แฉแแแแฌแแ แจแ แแฎแแแแ 11 แแกแแแ แแแขแแ (16-แแแ). แฌแแแงแแแ แแแขแแแก แแฅ แแฎแแแแ แแแแฎแแแ แ แคแฃแแฅแชแแ แแฅแแ. แแแฎแ แแแแขแแแแ แฉแแแแฌแแ แแก แจแแแแฎแแแแแจแ, 21 แแแขแแแแ 32 แแแแแงแแคแแแแ แแแแแก แฌแแ แขแแแแก แแแแ แแกแแแแก - แ แแแแ แช แฉแแแก, แกแแแ แแแแขแ (แ แแแแแแช แฏแแแจแ แแซแแแแ 24 แแแขแก) แกแแแแแ แแกแ แแฅแแแแ, แแแแ แแ แกแแ แแแกแแก แแแ แแแ แแแ แซแแแแแ แแแแ แก แญแแแก.
แแก แชแฃแแแ? แฒแแแแแแแแ แแ . แแ แแแก แแฎแ แแ, แแฃ แฉแแแ แแแแแ แแแ แฃแแแแ แกแแแ แชแแแ, แฉแแแ แแแแฅแแก แจแแแฃแแจแแแก แแแแแ แแแแแแ, แ แแแแแแแช แแแแแแแ แแฆแแแคแฎแแ แแก แงแแแแ แแแแแขแแแแ แแแขแ แแแแแก แแ แแแแแแขแแแแก. แแแแ แแก แแฎแ แแ, แฃแแแแแแแก แแแแแแ แแงแ แแแฅแกแแแแแฃแ แแ แฃแแแแแ แกแแแฃแ แ แแแแแ แแแแก แฃแแ แฃแแแแแงแแคแ. แแแแแแแแแ, แจแแแแแซแแแ UTF-8-แจแ แแแแแ แแแฃแ แฎแแแก แแแแแแแแ แแแแ, แ แแแแแแช แแแ แ แแฎแแแแ ASCII-แแ แแฃแจแแแแแ แแ แแ แแแแจแแแแแแก, แ แแ แแก แแแแแแฎแแแก แกแแแแแแแก ASCII แแแแแแแแแแแแ, แ แแแแแแช แ แแแแฃแ แแ แแ แแ แแก (แแแแแก แแ แแแแแก, UTF-8-แจแ แงแแแแ แแแแขแ, แ แแแแแแช แแฌแงแแแ แแฃแแแแแแ แแแขแแแแ - แแก แแ แแก แแฃแกแขแแ แแก, แ แแช แแ แแก ASCII). แแ แแฃ แแแฃแแแแแแแแ แแแกแฃแ แก แแแแ แกแแแแกแแแ แแแขแแ แ แแฃแแแก แแแแญแ แ แแแแแแแแแ แแแกแ แแแจแแคแแ แแก แแแ แแจแ (แแ แแแคแแ แแแชแแแก แแแฌแแแแก แแฆแแแแแ แแแแแแแแแฃแแ แแแแงแแคแแแแแแก แจแแแแแ), แฉแแแแแแแก แแแแแแแ แแแแแแแ แแคแกแแขแ, แกแแแแช แแแ แกแแแแแ แแฌแงแแแ (แกแแแแแ แแกแแ. แ แแ แแแแแขแแแแ แแแแขแแแ, แ แแแแแแกแแช แแฅแแ แแแขแแก แแ แแคแแฅแกแ 10
).
แแแจแแ แ แแขแแ แแแแแแ แ แแแแ แแฎแแแก?
แแแแแแ แแฃแแแ, แแแแฏแแ แแ แแก แกแแขแฃแแชแแแแ, แ แแแแกแแช แจแแแฃแแจแแแก แแแแแ แแแแแแ, แ แแแแ แแชแแ deflate, แชแฃแแแ แแแแแแงแแแแแ, แแแแ แแ แแกแฃแ แ แแแแฆแฌแแแ แกแขแ แแฅแแแแแแก แแแแแแฅแขแฃแ แจแแแแฎแแแก. แแแ แแแแ แแ แแก แแ แแแแแแ แจแแแฎแแแ แแจแแแแแแแแแแ แคแแฅแ แแกแแก
แชแแแแ, แแแแแ แแฆแแแแจแแ แแแแแ แแ แแ แฃแกแแแแแแแ แแแฃแแแกแ, แ แแแแแแช แฌแแ แแแแฅแแแแแ แแแแแชแแแแ แแกแแ แกแขแ แฃแฅแขแฃแ แแจแ UTF-8 แแแแแงแแแแแแกแแก. แแแแแ แแแงแแแแแแ แกแฃแ แแแ แแแแฉแแแแแแก, แ แแ แ แแแแกแแช แกแแแแแแ แแฌแแ แแแ แ แแแแ แช แแ แ แแแแขแ, แแแก แ แแชแฎแแแแ แแแแแแจแแ แแแฃแแ แแแขแแแ แแ แแแแแก แแแแแแแ, แแ แแแแ แแแแแงแแคแแแแ แฌแงแแแแ แแแขแแ. 10
แจแฃแแจแ: 110xxxxx 10xxxxxx
. แแแแก แแแแ, แ แแแแกแแช แแแแ แ แแแแขแแก แฅแแแแ 6 แแแขแ แแแแแแแแแแแ แกแแแแแแแแแแก แแแแจแ (แแแฃ แฎแแแแ แแแแแกแแแ 10111111
โ 10000000
), แจแแแแแ แแชแแแแแ แแแ แแแแ แแแแขแแช. แแแแแแแก, แ แแ แแกแ "p" แแฆแแแแจแแแแ แแแแขแแแแ 0xD0 0xBF
, แแ แจแแแแแแ "r" แฃแแแ แแ แแก 0xD1 0x80
. แแ แแคแแฅแกแแก แฎแแจแ แแก แแฌแแแแก แแจแแแแแ แแแแแซแแก แแ แแ แแแงแแคแแก - แแ แแ แแ แแคแแฅแกแแกแแแแก. 0xD0
แแ แแแแ แ แแแแกแแแแก 0xD1
(แแฃแแชแ แแแแแ แแแ แแฃแแ แแแแแแแก แแแแแ แแแ แจแแแซแแแแแแ แแฎแแแแ แแแแ แ แแแแขแแ).
แ แ แแแแแฆแ
แแ แแ แแแแแแแก แฌแแแแจแ แแแแแแฌแงแแแขแ แแแแแ แฏแแจแ แแแขแแแแ แแแแแจแจแ แแ แแแแแแ แแฃแแแ แชแแขแ แฃแแแ แแแแแชแแ แฃแแแแแแแก แกแขแ แฃแฅแขแฃแ แแก แแแแแแแแแแจแ. แจแแแแแ แแงแ UTF-C แแแแแ แแแแก แคแแ แแแขแ ("C" for แแแแแแฅแขแฃแ แ), แ แแแแแแช แฎแแ แฏแแแก แแ แแฃแแแขแแก 3 แแแแขแก แแแแ แแแแแก แฌแแ แขแแแจแ แแ แซแแแแแ แฎแจแแ แแ แแแซแแแแ แแฎแแแแ แแแฎแแ แฏแแแก แกแแจแฃแแแแแแก แแ แแ แแแแแขแแแแแ แแแแขแ แแแแแ แแแแแ แแแฃแแ แฎแแแแกแแแแก. แแก แแแแงแแแแ แ แแ แคแแฅแขแก, แ แแ แแแแ แแ แ-ASCII แแแแแแแ แแกแแแ แแแแแ แแแ แแฆแแแฉแแแแแ 30-60% แฃแคแ แ แแแแแแฅแขแฃแ แ แแแแ แ UTF-8.
แคแแ แแแจแ แฌแแ แแแแแแแแแ แแแแแ แแแแกแ แแ แแแแแแแ แแแแก แแแแแ แแแแแแแก แแแแฎแแ แชแแแแแแแก แแแแแแแแแแ
แขแแกแขแแก แจแแแแแแแ แแ แจแแแแ แแแ UTF-8-แแแ
แแแช แแแแแแแแ
แแแแแแขแ แแแขแแแแก แแฆแแแคแฎแแ แ
แ แ แแฅแแ แฃแแแ, แกแแคแฃแซแแแแ แแแแฆแ UTF-8. แแแ แแแแ แแ แงแแแแแแ แแจแแแ แ, แ แแช แแแกแจแ แจแแแซแแแแ แจแแแชแแแแแก แแ แแก แกแแ แแแกแแก แแแขแแแแก แ แแแแแแแแแก แจแแแชแแ แแแ แแแแแแฃแ แแแแขแจแ. แแแแแแแแแ, UTF-8-แจแ แแแ แแแแ แแแแขแ แงแแแแแแแแก แแฌแงแแแ แ แแแแแแแแแ 0
, แแ แแแ 11
- แแ แแคแแฅแกแ 10
แแก แแฎแแแแ แจแแแแแ แแแแขแแแก แแฅแแ. แแแแแ แจแแแชแแแแแ แแ แแคแแฅแกแ 11
on 1
, แแ แจแแแแแแ แแแแขแแกแแแแก แฉแแแ แแแแแแแแ แแแแแแฆแแแ แแ แแคแแฅแกแแแก. แฒ แ แแแฎแแแแ?
0xxxxxxx
- 1 แแแแขแ
10xxxxxx xxxxxxxx
- 2 แแแแขแ
110xxxxx xxxxxxxx xxxxxxxx
- 3 แแแแขแ
แแแแชแแแแ, แกแแ แแ แแก แแแฎแ แแแแขแแแแ แฉแแแแฌแแ แ? แแแแ แแ แแก แแฆแแ แแ แแก แกแแญแแ แ - แกแแ แแแแขแจแ แฌแแ แแกแแก, แแฎแแ แแแแฅแแก 21 แแแขแ แฎแแแแแกแแฌแแแแแ แแ แแก แกแแแแแ แแกแแ แงแแแแ แ แแชแฎแแแกแแแแก. 0x10FFFF
.
แ แแก แแแแฌแแ แแ แแฅ? แงแแแแแแ แแแแจแแแแแแแแแ แแ แแก แกแแแแแแแแแแก แกแแแฆแแ แแแแก แแฆแแแฉแแแ แแฃแคแแ แจแ แแแแแแแแฃแ แ แแแแแแ แแแแแแแ. แฉแแแ แแ แจแแแแแซแแแ แแแแฃแแแแแ แแแแแแแแฃแ แ แแแแขแ แแ แแแแแแแ แแแกแแแ แจแแแแแแ แกแแแแแแแก แแแกแแฌแงแแกแ. แแก แแ แแก แฉแแแแ แคแแ แแแขแแก แจแแแฆแฃแแแ, แแแแ แแ แแ แแฅแขแแแแจแ แแก แแจแแแแแแ แแ แแก แกแแญแแ แ. แฉแแแ แฉแแแฃแแแแ แแ แจแแแแแซแแแ แแแแแแแแแ แแแแฃแจแแแ แแฃแคแแ แจแ (แแแแกแแแฃแแ แแแแ แ แแชแ แกแแฅแแ แแฎแแแ แแแแแ แฎแแแแแก).
2 แแแแขแแ แแแแแแก แแแคแแ แแแก แแแแแ แแแแช แแแฃแแฏแแแแกแแ: แแฎแแ แแ แแแแขแแแแ แคแแ แแแขแ แแซแแแแ 14 แแแขแแก แแแแแแแแแก แแ แแก แแ แแก แแแแแแ. 0x3FFF
. แฉแแแแแแแ แฃแแฆแแแแแแ แแ แแแ (แแแแ แแแ แกแแแแแแแ แซแแ แแแแแแ แแแแกแฎแแแแแแแ 0x4E00
แแแ 0x9FFF
), แแแแ แแ แฅแแ แแแแแแแก แแ แแแแ แกแฎแแ แฎแแแฎแก แฃแคแ แ แแฎแแแ แฃแแแแแ - แแแแ แแแแแแช แฏแแแแ 2 แแแแขแจแ แแแแ แกแแแแแแแแ.
แจแแแงแแแแแ แแแแแ แแแแก แแแแแแแ แแแแ
แแฎแแ แแแแแ แแแคแแฅแ แแ แแแแแ แฎแแแแแแก แแแแกแแแแแแ. แแแฅแกแแแแแ แงแแแแแแ แฎแจแแ แแ แจแแแชแแแก แแแแแ แแแแแแแก แกแแแแแแแแแแ แแแฌแแ แแ แกแแขแงแแแแก แแ แแก แแกแแแ แแฎแแแ แแแแ แกแฎแแ แขแแฅแกแขแก. แแแ แแ แแฅแแแแแแ แแก แแแแแแ แแ แแฎแแ แแแแแแแแแแแ, แจแแแแแ แแ แแฎแแแแ แแแกแจแ แแ แกแแแฃแแ แแกแแก แแแแแ แ. แแแแฎแแ, แแแแแแแแแแแแ แแฃ แแ แ แฃแแแแแแแก แชแฎแ แแแจแ แกแแแแแแแแแแก แแแแแแแแแ.
แ แแแแ แช แแแแแ แแฆแแแแจแแ, Unicode แแงแแคแ แแแแแแคแ แแแแแ แแแแแแฃแแ 65536 แแแแ. แแแแ แแ แแก แแ แแ แแก แซแแแแแ แกแแกแแ แแแแแ แแแงแแคแ (แ แแแแ แช แฃแแแ แแแฅแแ, แงแแแแแแ แฎแจแแ แแ แฉแแแ แแฃแแแแแแ แกแแแ แขแงแแจแ แแแ แ). แฃแคแ แ แกแแแแขแแ แแกแแ แแแงแแคแ แแแแแแแ. แแ แแแแแแแแแแแก แแฆแแ แแฅแแ แคแแฅแกแแ แแแฃแแ แกแแแ แซแ แแ แฃแคแ แ แแแแจแแแแแแแแแ - แ แแแแ แช แฌแแกแ, แแแแแแฃแแ แแแ แแแแแแแก แกแแแแแแแแแก แแ แแ แแ แแแแแ แแแแแแแแแ.
แแแแแ, แ แแแแแแช แจแแแชแแแก แแแแแแแฃแ แ แแแแแแแก แกแแแแแแแแแก. แกแแแฌแฃแฎแแ แแ, แแกแขแแ แแฃแแ แแแแแแแแแก แแแแ, แแก แแ แแก แแ แช แแฃ แแกแ แแแแ แแแ แจแแคแฃแแแแก แแแแแแแแ - 96 แกแแแแแแ แฅแแแขแฃแ แแ แแ แแก แแแแแคแแแขแฃแแ 128 แแแแแแก แแแแแก แฌแแ แขแแแจแ.
แแแแแแแแก แแแกแแฌแงแแกแ แแ แแแแ แแแแแแ แงแแแแแแแแก แแ แแก 16-แแก แฏแแ แแแ - แแก แแแแแแแ แฃแแ แแแแ แแแฎแแ แฎแแแฃแแแแแกแแแแก. แแแ แแ แแแแกแ, แแแแ แ แแแแแ แแฌแงแแแ แแ แแแแแ แแแแ แแแแจแแแแแแแแแแ, แ แแแแแแแช แแ แแก 128 แแ แแฃแแแแช 256-แแก แฏแแ แแแ - แแแแแแแแแ, แซแแ แแแแแ แแแ แแฃแแ แแแแแแ แแแแแแแก 256 แแแแขแก. 0x0400
แแแ 0x04FF
. แแก แกแแแแแแ แแแกแแฎแแ แฎแแแแแแ: แแฃ แแ แแคแแฅแกแก แแ แแฎแแ แจแแแแแแฎแแแ 0x04
, แแแจแแ แแแแแกแแแแ แ แแแ แแฃแแ แกแแแแแแ แจแแแซแแแแ แฉแแแฌแแ แแก แแ แ แแแแขแจแ. แแแ แแแแแ, แแ แแแแ แฉแแแ แแแแแแ แแแแ แจแแกแแซแแแแแแแแก แแแแฃแแ แฃแแแแ ASCII-แก (แแ แแแแแแแ แแแแแกแแแแ แกแฎแแ แแแ แกแแแแแก). แแแแขแแ แฉแแแ แแแแก แแแแแแแแ:
- แแ แ แแแแขแ
10yyyyyy yxxxxxxx
แแ แ แแฎแแแแ แกแแแแแแแก แแฆแแแจแแแ แ แแชแฎแแแyyyyyy yxxxxxxx
, แแ แแแแ แชแแแแแแแแช แแแแแแแแ แ แแแแแแ onyyyyyy y0000000
(แแแฃ แฉแแแ แแแแฎแกแแแก แงแแแแ แแแขแ, แแแ แแ แงแแแแแแ แแแแแแแแ แแแแจแแแแแแแแแ X แกแฃแ แชแแขแ); - แแ แแ แแแแขแ
0xxxxxxx
แแก แแ แแก แแแแแแแแ แ แแแแแแแก แฎแแกแแแแ. แแก แฃแแ แแแแ แฃแแแ แแแแแแขแแก แแคแกแแขแก, แ แแแแแแช แแแแฎแกแแแแ 1-แแ แกแแคแแฎแฃแ แแ. แแแฃแฎแแแแแแ แแแแกแ, แ แแ แแแแแแ แแ แจแแแชแแแแแ, แแคแกแแขแ แแ แแก แแฃแแแแแแ, แแแแขแแ แจแแแแแแ แฉแฃแแแ แแแแกแแแแแแแ ASCII-แแแ.
แแแแแแแแฃแ แแ แแแแแแแกแแแแก, แ แแแแแแแช แกแแญแแ แแแแแ 3 แแแแขแก:
- แกแแแ แแแแขแ
110yyyyy yxxxxxxx xxxxxxxx
แแแฃแแแแแ แกแแแแแแ แ แแชแฎแแแyyyyyy yxxxxxxx xxxxxxxx
, แจแแชแแแ แแแแแแแแ แ แแแแแแ onyyyyyy y0000000 00000000
(แงแแแแแคแแ แ แแฎแกแแแแ แฃแแชแ แแกแแแแก แแแ แแ X แกแฃแ แชแแขแ) แแ แจแแแแแฌแแแ แงแฃแแ, แ แแแแแจแแช แแฎแแ แแแ แ แแ แซแแแ แ แแแแแ (แแแแแแแก แแ แแแแขแแแแแ แแแแแแ แฃแแแแแกแแก, แฉแแแ แแฆแแแแแแแ แแ แแ แแจแแก); - แแ แ แแแแขแ
0xxxxxxx xxxxxxxx
แแ แซแแ แ แแแแแจแ แแก แแ แแก แแแแแแแแ แ แแแแแแแก แกแแแแแแ. แแแแแแแแฃแ แแ, แฉแแแ แแแแแขแแแ แแแก แแคแกแแขแฃแ แแ 1 แแแแแฏแแแแ. แแ แแแแแ แแ แแแแกแฎแแแแแแ แแกแแ, แ แแ แแฎแแ แแแแแฎแฃแแแแ แแ แแแแขแก (แ แแแแแ แฉแแแ แแแแแแแแแ แแ แ แแแแแจแ).
แแแ แแแ แแฆแแ แก: แแฎแแ, แกแแแแ แฉแแแ แแแญแแ แแแแ แกแแแแแแแแแแก แแแจแแคแแ แ แแแแแ 7-แแแขแแแแ แฃแแแแแแแก แแแแแแแแแแแแ, แฉแแแ แแฎแแ แฏแแแ 1 แแแแแขแแแแ แแแแขแก แแแกแแฌแงแแกแจแ แแ แกแฃแ แแ แ แแแแขแก แแแแ แกแแแแแแแแ.
แแฃแจแแแแก แแ แ-แแ แแ แฌแแแ แแแ แกแแแแแ. แแก แฃแแแ แฎแจแแ แแ แกแชแแแก UTF-8-แก, แแแแ แแ แแแฃแแฏแแแแกแแแแก แแแแแแ แฏแแ แแแแแ แแ แกแแแแแก.
แ แ แแ แแก แฃแแ แแกแ? แแแ แแแ แ แแแจแ, แฉแแแ แแแแฅแแก แแแ แแแ, แแแ แซแแ แแแแแแแแ แ แแแแแแแก แแคแกแแขแฃแ แ แแ แฉแแแ แแแแแ แแ แซแแแ แ แแแแแ. แแก แแแแแ แฃแคแ แ แแแแฆแฃแแแแก: แแฎแแ แแ แแ แแ แแแแแ แกแแแแแแแแแ แจแแแซแแแแ แแแแกแฎแแแแแแฃแแแ แแงแแก แแแแแ แแแฃแแ แกแฎแแแแแกแฎแแ แแแแขแแฅแกแขแจแ. แแแแแแแแแ, แฅแแแกแขแ แแฅแแแแแแก แซแแแแ แแแแก แแแแแแแแกแฌแแแแแแ แฃแแแ แแแฎแแแก แแ แแ แ แแฎแแแแ แแแแขแแแแก แจแแแแ แแแแ. แแแแ แแช, แ แแแแ แช แแ แแแแแแ แจแแแชแแแแแ, แแก แชแฃแแแ แแแฎแแ ASCII แกแแแแแแแแแแก แแแแแ แแแแ (แแ แแก แแ แแ แแก แแฎแแแแ แแแแแแฃแ แ แแแแแแ, แแ แแแแ แซแแ แแแแแ แแฃแแฅแขแฃแแชแแ, แแแ แจแแ แแก แกแแแ แชแแแแ) - แแกแแแ แแแแแฎแแแแ แแแแแแแก แจแแชแแแแก แแกแแ 0-แแ, แแแฃ, แแกแแ แแแแแขแแแแแ แแแแขแ (แแ แจแแแแแ แแแแแ แแ แแ, แ แแ แแแแฃแแ แฃแแแแ แฉแแแแก แแแแแแ แแแ แก).
แแ แแ แแแแแแ แแแ แแแ, แแ แ แฃแแแแแกแ
แจแแแแชแแแแ แชแแขแแแ แจแแแชแแแแแ แฉแแแแ แแแขแแก แแ แแคแแฅแกแแแ, แแแแแ แแ แแ แจแแแแฏแแแแ แแแแแ แแฆแฌแแ แแแ แกแแแแก แแแแแ แ:
0xxxxxxx
โ 1 แแแแขแ แแแ แแแแฃแ แ แแแแแจแ, 2 แแ แซแแ แ แแแแแจแ
11xxxxxx
- 1 แแแแขแ
100xxxxx xxxxxxxx
- 2 แแแแขแ
101xxxxx xxxxxxxx xxxxxxxx
- 3 แแแแขแ
แแฎแแ แแ แแแแขแแแ แฉแแแแฌแแ แจแ แแ แแก แแ แแ แแแแแแแแ แฎแแแแแกแแฌแแแแแ แแแขแ - แแแแ แแแฃแแแแแแก แแแ 0x1FFF
แแ แแ แ 0x3FFF
. แแฃแแชแ, แแก แแแแแช แจแแกแแแฉแแแแแ แฃแคแ แ แแแแแ, แแแแ แ แแ แแแแ แแแแขแแแแ UTF-8 แแแแแแจแ, แงแแแแแแ แแแแ แชแแแแแฃแแ แแแแแ แฏแแ แแแแแ แฏแแแแ, แงแแแแแแ แจแแกแแแฉแแแแ แแแแแแแ แแ แแแแชแ.
แ แ แแ แแก แแก แแฎแแแ แแแแ? 11xxxxxx
? แแก แแ แแก 64 แกแแแแแแแกแแแ แจแแแแแแ แ แแแขแแ แ โแกแแแแแกแโ, แแก แแแกแแแก แฉแแแแก แแแแแแ แแแแแแก, แแแแขแแ แแ แแแก แแแแฎแแแ แ แแฃแฌแแแ (แแแแฎแแแ แ) แแแแแแ. แ แแแแกแแช แฉแแแ แแชแแแแ แแแแแแแแ แ แแแแแแก, แซแแแแ แแแแแแแก แแแฌแแแ แฎแแแแ แแแแฎแแแ แ. แแแแแแแแแ, แฉแแแ แแแแแแแแแ ASCII-แแแ แแแ แแแแแแแ - แกแแแแแกแ แแฎแแ แจแแแชแแแก 64 แกแแแแแแแก, แ แแแแแแช แจแแแชแแแก แแแแแแฃแ แ แแแแแแ, แ แแชแฎแแแแ, แกแแแ แชแ แแ แแซแแแ (แงแแแแแแ แฎแจแแ แ แฉแแกแแ แแ แ-ASCII แขแแฅแกแขแแแจแ). แแแฃแแ แฃแแแแ ASCII-แก - แแ แแแ แแฃแแ แแแแแแแก แซแแ แแแแแ แแแฌแแแ แแแฎแแแแ แแแแฎแแแ แ แแแแแแ.
แแ แแแแแแแ แฌแแแแแแก แฌแงแแแแแแ, แฉแแแ แจแแแแแซแแแ แแแแแแฃแจแแแ แขแแฅแกแขแแแแก แแแแ แ แแแแแแแแ แแแแแแแก แแแแแ แแแแก แแแแแแแแฃแ แ แฎแแ แฏแแแแ (แแฃแแฅแขแฃแแชแแแก แแแจแแแแ แงแแแแแแ แฎแจแแ แแ แแฌแแแแก ASCII-แแ แแแแ แฃแแแแแก, แแแแ แแ แแแแก แจแแแแแ แแแแแฆแแแ แแแแ แแ แ-ASCII แกแแแแแแแก แแแแแขแแแแแ แแแแแแแแแ, แแแ แแจแ แฎแแแแฎแแ แแแแแ แแแ).
แแแแฃแกแ: แฅแแแแแแแแแก แแ แแคแแฅแกแ 11xxxxxx
แแ แแแ แฉแแแ แแแก แแแแแแแแ แแแ แแแแแแแกแแ แแแแก 0xC0
, แฉแแแ แแแฆแแแ แแแฌแแแแแ แแ แแแแกแแแแแแแแก CP1252-แแแ. แกแฎแแ แกแแขแงแแแแแ แ แแ แแแฅแแแ, แแแแ แ (แแแแ แแ แแ แ แงแแแแ) แแแกแแแแแ แแแ แแแแก แขแแฅแกแขแ, แ แแแแแแช แแแแแ แแแฃแแแ CP1252-แจแ, แแ แแแแแ แแ แแแแแแงแฃแ แแแ UTF-C-แจแ.
แแฃแแชแ, แแฅ แฉแแแแแ แกแแ แแฃแแ: แ แแแแ แแแแแฆแแ แแแแฎแแแ แ แซแแ แแแแแ แแแแแแแแแ? แแฅแแแ แจแแแแซแแแแ แแแขแแแแ แแแแแ แแคแกแแขแ, แแแแ แแ - แกแแแฌแฃแฎแแ แแ - แแฅ Unicode แกแขแ แฃแฅแขแฃแ แ แฃแแแ แแแแแจแแแก แฉแแแแก แฌแแแแแฆแแแแ. แซแแแแแ แฎแจแแ แแ แแแแแแแก แซแแ แแแแแ แแแฌแแแ แแ แแ แแก แแแแแแก แแแกแแฌแงแแกแจแ (แแแแแแแแแ, แ แฃแกแแแแก แแแแแฅแแแแฅ "A"-แก แแฅแแก แแแแ 0x0410
, แแฃแแชแ แแแ แแฃแแ แแแแแ แแฌแงแแแ 0x0400
). แแแ แแแแ, แแแ แแแแ 64 แกแแแแแแแก แจแแแแฎแแแจแ, แฉแแแ แจแแแซแแแแ แแแแแแ แแแ แฌแแแแแ แแแแแแแก แแฃแแแก แแแฌแแแแ.
แแ แแ แแแแแแแก แแแแแกแแญแ แแแแ, แแ แฎแแแแ แแแแแแ แ แ แแแแแแแแ แแแแแ, แ แแแแแแช แจแแแกแแแแแแแ แกแฎแแแแแกแฎแแ แแแแก แแ แแแแแคแแฅแกแแ แ แแแแฎแแแ แ แแแแแแแก แแคแกแแขแ แแแแแแแก แแแแแแ แจแ. แแแแแแฃแ แ แแแแแแ, แ แแแแ แช แแแแแแแแแแกแ, แแแแแแแ แแแแแแแแแ, แ แแแแ แช แแแแ64.
แกแแแแแแ แจแแฎแแแ
แแแแ แกแแแแแแแ แแแคแแฅแ แแ แแแแแ, แกแแ แจแแแซแแแแ แแแแแ แแแแแฃแแฏแแแแกแแ แ แแแ.
แแแแแแแแแกแฌแแแแ, แ แแ แคแแ แแแขแ 101xxxxx xxxxxxxx xxxxxxxx
แกแแจแฃแแแแแแก แแแซแแแแ แแแจแแคแแ แแ แ แแชแฎแแแแ แแแ 0x1FFFFF
แแ Unicode แแแแแ แแแแ แแแ แ, แแ 0x10FFFF
. แกแฎแแ แกแแขแงแแแแแ แ แแ แแแฅแแแ, แแแแ แแแแแก แฌแแ แขแแแ แฌแแ แแแแแแแแแ แแฅแแแแ แ แแแแ แช 10110000 11111111 11111111
. แแฅแแแแ แแแแแแแแแแ แ, แจแแแแแซแแแ แแแฅแแแ, แ แแ แแฃ แแแ แแแแ แแแแขแ แคแแ แแแกแแ 1011xxxx
(แกแแ xxxx
0-แแ แแแขแ), แแแจแแ แแก แกแฎแแ แ แแแแก แแแจแแแแก. แแแแแแแแแ, แแฅ แจแแแแซแแแแ แแแแแแขแแ แแแแแ 15 แกแแแแแแ, แ แแแแแแแช แแฃแแแแแแ แฎแแแแแกแแฌแแแแแแ แแแแแ แแแแกแแแแก แแ แ แแแแขแจแ, แแแแ แแ แแ แแแแแแฌแงแแแขแ แกแฎแแแแแแ แแ แแแแแแแแแแแแ.
แแแแแ แจแแแฎแแแแ แฃแแแแแแแก แแ แแแแแแแก, แ แแแแแแกแแช แกแแแ แแแแขแ แกแญแแ แแแแแ. แซแแ แแแแแแ, แ แแแแ แช แฃแแแ แแฆแแแแจแแแ, แแก แฉแแแฃแ แ แกแแแแแแแ - แแแแ แแ แซแแแแแ แแแแแแ แ แแแแแก แแแแแแแแ, แแแแแแ 21 แแแแกแแ. แแแแ แแ แฐแแ แแแแแ แแ แแแขแแแแแแช แแฅ แแแคแ แแแแแแ - แแ แแแแแแ แแ แช แแกแ แแแแ แแ, แแ แแกแแ แแแแแแแ. แแ, แ แแแแแ แแแแแแแแแแ แแแแแฎแกแแแแ, แแ แแก แแแแฏแแช (แกแแแแแแแแแแจแ, แแกแแแ แฃแแแแแแจแ แแแแ แแแ แแ แแแ แแแแแคแแแขแฃแแ, แแแแ แแ แซแแ แแแแแ แแแแแแแ แแแแแแแแแจแแ. 0x1F300
- 0x1FBFF
). แแฃ แคแแฅแ แแแ แแแแแ, แ แแ แแฎแแ แแ แแก แแแแชแแแแ, แ แแแแแแแช แแฌแงแแแแแแ แ แแแแแแแแ แแแแแก แฌแแ แขแแแแแแ แแ แแแ แแฃแแแ (แแแแแแแแแ, emoji
แแฅแแแแ แแแแแแแแแแ แ, แฉแแแ แแแ แฉแแแ แ แแแแแแแแ แจแแ แฉแแฃแ แแแแแแแแแก, แ แแแแแแแช แจแแแกแแแแแแแ emoji-แก, hiragana-แก แแ แแแขแแแแแแก, แแแแแแแแแ แแแ แแแ แแ แ แฃแฌแงแแแข แกแแแจแ แแ แแแจแแคแ แแแ แแแ, แ แแแแ แช แแ แ แแแแขแแก แแแชแแแแ แกแแแ:
1011xxxx xxxxxxxx
แจแแกแแแแจแแแแแ: แแแแแแฆแแแจแแฃแแ emoji
แจแแแแชแแแแ แแแแแแแกแฌแแ แแ แแแแแ แแ แแ แแ แแแแแแ. แ แแแแ แช แแแแฎแกแแแก, แซแแ แแแแแ แแแแแแ แแ แกแแแแแแ แแ แแก แแแฆแแแ 6 แแแขแ, แ แแแแแกแแช แแฎแแแแแแแแแจแ แแแขแแแแแ แแ แแแฌแแแแแ แงแแแแแ แแแแแแแแ แแแแแแแ แแแฃแแ แกแแแแแแแก แแแแก. แฉแแแฃแ แ แกแแแแแแแแแแก แจแแแแฎแแแแแจแ, แ แแแแแแแช แแแแแจแแ 0x4E00
- 0x9FFF
แแก แแ แแก แแแขแ 0 แแ 1. แแก แแ แแ แแก แซแแแแแ แแแกแแฎแแ แฎแแแแแ: แฉแแแ แแแแแญแแ แแแแ แแฃแแแแแแ แแแแแ แแแ แแแแแแ แแ แแ แแแแจแแแแแแแแก แจแแ แแก (แแแฃ แกแแแ แแแแขแแก แแแฎแแ แฏแแ). แแแแ แแ แแแแแแแแแกแฌแแแแ, แ แแ แแ แซแแ แ แแแแแจแ, แแแแแ แแแแแแแ แจแแแแแซแแแ แแแแแแแแแแ แกแแแแแแแแแแก แ แแแแแแแแ, แ แแแแแแกแแช แแแแจแแคแแ แแแ แแแแแ แ แแแแแแก แแแแแงแแแแแแ (แแแแแ แแฆแฌแแ แแแ แงแแแแ แฎแ แแแแก แจแแแแแ, แแก แแ แแก 10240) - แจแแแแแ แแแ แแแแแคแแแแก แแแแแแแแแ แแแแแแ 0x2600
- 0x77FF
แแ แแ แจแแแแฎแแแแแจแ, แแแแ แแ แแแแแแแแแจแ, แงแแแแแแ แแแแจแแแแแแแแแ 6 แแแขแ (21-แแแ) แแฅแแแแ 0-แแก แขแแแ. แแแ แแแแ, แแแ แแแแแคแแแแก แแแแแแแแแแ แแแ แแแแแแงแแแแแก แแ แแแแขแก แแแแ แแแ แแแแแคแแ (แ แแช แแแขแแแแแฃแ แแ แแกแแแ แแแแ แแแแแแแแแแกแแแแก), แแแ แแจแ. แแแแแแแก แแแแแ แแแแก แแแแแแฌแแแแ.
แแแขแแ แแแขแแฃแแ แแแแแฌแงแแแขแแแแแแแ: SCSU, BOCU-1
แฃแแแแแแแก แแฅแกแแแ แขแแแ, แแฎแแแฎแแ แฌแแแแแแฎแแก แกแขแแขแแแก แกแแแแฃแ แ, แกแแแแ แแฃแแแ, แกแแกแฌแ แแคแแ แจแแแแฎแกแแแแแ, แ แแ แฃแจแฃแแแแ แฃแแแแแแแก แกแขแแแแแ แขแแแก แจแแ แแก แแ แแก
แแฃแแฌแ แคแแแแ แแแฆแแแ แแ: แแแกแ แแ แกแแแแแแก แจแแกแแฎแแ แแฎแแแแ แแแก แจแแแแแ แแแแแแ, แ แแช แฆแ แแแ แฉแแแฃแฆแ แแแแแ แฉแแแ แแแแแฌแงแแแขแแแแแแก แฌแแ แแก. แแแแแแแแแ แ แแ แแชแแแแแแ แแแแก แจแแกแแฎแแ, แแแแแ แจแแแแชแแแแแแ แแแแแฌแแ แ แแแแแแแแแขแแชแแ, แแแแก แแแชแแแแ, แ แแ แกแแแฃแแแ แ แแแแแแแ แแแแแแแแฃแจแแแแแแแ.
แกแแแแขแแ แแกแ แแก แแ แแก, แ แแ SCSU แแงแแแแแก แแแแแแก แซแแแแแ แแกแแแแก แแแแแแก, แ แแช แแ แแแแแแ แแแแแแแแ (โแแแแแแแกโ แชแแแแแก แแแชแแแแ แแกแแแ แแงแแแแแแ โแคแแแฏแ แแแกโ แแ แแแแแ แแแขแแ แฎแแแแแกแแฌแแแแแ, แแแแ แ แแ แแแฅแแก). แแแแแแ แแฃแแแ, แแ แคแแ แแแขแก แแฅแแก แฃแแ แงแแคแแแ แแฎแแ แแแแ: แแก แแแแแ แฃแคแ แ แแฎแแแก แแ แแก แจแแแฃแแจแแแก แแแแแ แแแแแแแแ, แแแแ แ แแแแแ แแแแก. แแแ แซแแ, แกแขแแแแแ แขแ แแซแแแแ แแ แแแแแ แฌแแ แแแแแแแแก แแแแแแก, แแแแ แแ แแ แแแแแแก, แแฃ แ แแแแ แฃแแแ แแแ แฉแแแ แแแขแแแแแฃแ แ - แแแแกแแแแแก แแแแแ แแ แฃแแแ แแแแแแงแแแแก แ แแแแ แกแแฎแแก แแแ แแกแขแแแ. แแแ แแแแ, SCSU แจแแคแ แแขแแ แ, แ แแแแแแช แแฌแแ แแแแแก แแแ แ แจแแคแฃแแแแก, แฃแคแ แ แ แแฃแแ แแ แ แแฃแแ แแฅแแแแ, แแแแ แ แฉแแแ แแแแแ แแแแ.
แจแแแแ แแแแกแแแแก, แแ แแแแแแแชแ SCSU-แก แจแแแแ แแแแ แแแ แขแแแ แแแแแแแแแขแแชแแ JavaScript-แแ - แแแแแก แแแชแฃแแแแแก แแแแแกแแแ แแกแแ, แแก แจแแแแ แแแฃแแ แแงแ แฉแแแก UTF-C-แกแแแ, แแแแ แแ แแแแแแ แ แจแแแแฎแแแแแจแ แจแแแแแ แแแแแแ แแ แแชแแแขแแ แฃแแ แแกแ แแงแ (แแแแฏแแ แจแแแซแแแแ แแแแแแญแแ แแแก แแแก, แแแแ แแ แแแแแ แแ แ). แแแแแแแแแ, แขแแฅแกแขแแแ แแแ แแฃแ แแ แแแ แซแแฃแ แแแแแแ แแงแ แแแแแ แแแฃแแ UTF-C-แแ 60%-แแ แฃแแแแแกแ แแแแ แ SCSU (แแแแแ แแแแ แแแแแแฅแขแฃแ แ แแแแแแแก แแแแ).
แชแแแแ, แแแแแแแขแแ, แ แแ SCSU-แก แแแ แแ, แแกแแแ แแ แกแแแแแก แฃแแแแแแแก แแแแแแฅแขแฃแ แ แฌแแ แแแแแแแแก แแแแแ แแ แแ แแแ -
แจแแกแแซแแ แแแฃแแฏแแแแกแแแแแ
แแแแแ แแแแ, แ แแแแแแช แฌแแ แแแแแแแแแ, แแ แแ แแก แฃแแแแแ แกแแแฃแ แ แแแแแแแแ (แแก แแ แแก แแแแแ, แกแแแแช แฉแแแ แแแแแแแ แงแแแแแแ แแแขแแ แแแแกแฎแแแแแแแ Unicode Consortium-แแก แแแแแแแแกแแแ). แแ แฃแแแ แแฆแแแแจแแ, แ แแ แแแ แจแแแฃแจแแแแ แซแแ แแแแแแ แแ แแ แแแแชแแแแกแแแแก (แแ แแแแแแแแแแแ แแแฅแกแแแแแแก แจแแแแฎแแ แแ แแคแแฅแกแแก แฎแแจแ) แแ แแแกแ แแแแแแ แแ แคแฃแแฅแชแแ แจแแแซแแแแ แแ แแงแแก แแแ แแแ แแแ แแแแฃแแ แกแฎแแ แแแแชแแแแแแกแแแแก. แแแแ แแ แแก, แ แแ แแก แแ แแ แแก แกแขแแแแแ แขแ, แจแแแซแแแแ แแงแแก แแแฃแกแ - แแฅแแแ แจแแแแซแแแแ แแแ แขแแแแ แจแแชแแแแแ แแแ แแฅแแแแก แกแแญแแ แแแแแแแ.
แแแแแแแแแ, แแจแแแ แแ แจแแแแซแแแแ แแแแแแแ แแแชแแแแ แกแแฎแแแแฌแแคแแก แแ แกแแแแแ, แแแแแแแแ แแแฅแแแแฅแแแแแก แแ แแฅแแแ แแแแแ แแแ - แฃแแ แแแแ แแ แแแแแแฎแแแ แชแแแแแแแ offs
, auxOffs
ะธ is21Bit
แจแแคแ แแขแแ แกแ แแ แแแแแแแ แจแ. แแ แจแแแแฎแแแแแจแ, แจแแฃแซแแแแแแ แแฅแแแแ แแ แแ แแ แแแแแ แแแแแแแก แกแแแแแแแแแแก แแแแแแแแแแ แแแแแแก แแคแแฅแขแฃแ แแ แจแแคแฃแแแ, แแแแ แแ แแฅแแแแ แแแ แแแขแแ, แ แแ แแ แแ แแ แแแแแ แกแแแแแแ แงแแแแแแแแก แแแจแแคแ แฃแแแ แแแแแ แแแแขแแแแ, แแแแขแแฅแกแขแแก แแแฃแฎแแแแแแ.
แแแ แแ แแแแกแ, แแฅแแแ แจแแแแซแแแแ แแแแ แแแ แแแแแแแ แ แแแแแ แแขแฃแ แแแแแ แแแแฃแแแกแฎแแแแ แแแแแแแ แแแแแก แจแแชแแแแ - แแแแแแแแแ, แ แฃแกแฃแ แขแแฅแกแขแแแแ แคแแแฃแกแแ แแแ, แแแแแแแแแ แแแแงแแแแ แจแแคแ แแขแแ แ แแ แแแแแแแ แ offs = 0x0400
ะธ auxOffs = 0
. แแก แแแแกแแแฃแแ แแแแ แแแแแแฃแ แแ แแแฅแแแแฅแแแแแก แแ แแฅแแแ แ แแแแแแก แจแแแแฎแแแแแจแ. แแแแแแแ, แแก แแฅแแแแ แซแแแแ แ แแ แแแขแแแแ แแแแแ แแแแก แแแแแงแแแแแแก แแกแแแแกแ, แแแแ แแ แกแแญแแ แแแแแกแแแแแ แงแแแแ แฃแแแแแแแแแ แกแแแแแแแแแแก แฉแแกแแแก แแแ แแจแ.
แแแ แ แแแฎแกแแแแแ แแแแแ แแ แแ แแแแแ แแ แแก แแก, แ แแ UTF-C-แจแ แแแจแแคแ แฃแ แแแ แขแแฅแกแขแจแ แแ แแ แกแแแแแก แกแฌแ แแคแ แแแ, แ แแแ แแแแแแ แกแแแแแแแแแแก แกแแแฆแแ แแแ แงแแแแแแ แแฎแแแก แแแแแแแแฃแ แแแแขแแแ. แแฃ แแแแ, แแแฅแแแ, 100 แแแแขแก แแแแฌแงแแแขแ แแแแแ แแแฃแแ แแฃแคแแ แแแแ, แ แแกแแแแ แแแแแแก แแแฆแแแแก, แ แแแแแแแช แแแ แแคแแ แก แแแแแแแแแ. แแแแแ แแแ แแ แแ แแก แจแแฅแแแแแ แแ แแแแ แแแแแแแแขแแแแ แแฃแ แแแแแก แจแแกแแแแฎแแ, แแแแ แแ แแแแแแแ แแก แจแแแซแแแแ แแแแแกแฌแแ แแแก. แแแแขแ 0xBF
แแ แแกแแแแก แฃแแแ แแแแแฉแแแแก แ แแแแ แช แแแ แแแแ แแแแขแ (แแแแ แแ แจแแแซแแแแ แแงแแก แแแแ แ แแ แแแกแแแ). แแแแขแแ, แแแแแ แแแแกแแก, แจแแแแซแแแแ แฉแแกแแแ แแแแแแแแแแ แแแ 0xBF 0xBF 0xBF
แงแแแแแ, แแแฅแแแ, 10 KB - แแแจแแ, แแฃ แกแแแฆแแ แแก แแแแแ แแญแแ แแแแแ, แกแแแแแ แแกแ แแฅแแแแ แแ แฉแแฃแแ แแแฌแแแแก แกแแแแแ แแแ, แกแแแแ แแกแแแแกแ แแแ แแแ แ แแ แแแแซแแแแแแ. แฃแแแแแกแแแแแแก แแแงแแแแแแ 0xBF
แแแ แแแขแแ แแแฃแแ แแฅแแแแ แแแ แกแแแแแแก แแแกแแฌแงแแกแ. (แแแจแแคแแ แแกแแก, แแก แกแแแ แแแแขแแแแ แแแแแแแแแแ แแแ, แ แ แแฅแแ แฃแแแ, แแแแแ แแ แแแฃแแ แแฅแแแแ.)
แจแแฏแแแแแ
แแฃ แแฅแแแแ แฌแแแแแแฎแ, แแแแแชแแ! แแแแแ แแแฅแแก, แแฅแแแแช, แ แแแแ แช แแ, แแกแฌแแแแแ แ แแแแ แแฎแแแ (แแ แแแแแฃแแฏแแแแกแแ แแแฎแกแแแ แแแ) แฃแแแแแแแก แกแขแ แฃแฅแขแฃแ แแก แจแแกแแฎแแ.
แแแแ แแแแ แแ. แแแ แแฃแแแก แแแแแแแแ แแแแฉแแแแแแก แฃแแแ แแขแแกแแแแแก UTF-8-แแแ แแ SCSU-แกแแแ แจแแแแ แแแแ.
แแแแแ แแฆแฌแแ แแแ แแแแแแ แแ แฃแแแ แฉแแแแแแแแก แกแขแแแแแ แขแแแแก แฎแแแงแแคแแ. แแฃแแชแ, แแแแแแแ, แฉแแแ แแฃแจแแแแแก แจแแแแแแแแ แแแแงแแคแแแ แแแ , แแแแขแแ แแแแงแแคแแแ แแแ แแแแแ
แแ แแแแแก, แแ แแแแแ แแ แแฎแแ แแแแแแแฎแแแแแ แงแฃแ แแแฆแแแแก แแ แจแแแแฎแแแแแแแ, แ แแแแกแแช แแแแแแงแแแแแ UTF-C แแ แฆแแ แก:
- แแฃ แแฅแแแแ แกแขแ แแฅแแแแแ แกแแแแแแ แแ แซแแแแ (100-200 แกแแแแแแแแแ). แแ แจแแแแฎแแแแแจแ, แแฅแแแ แฃแแแ แแคแแฅแ แแ แจแแแฃแแจแแแก แแแแแ แแแแแแแก แแแแแงแแแแแแแ, แ แแแแ แแชแแ deflate.
- แฒแฃ แแญแแ แแแแ ASCII แแแแญแแแ แแแแแแ, แแแฃ แแฅแแแแแแแก แแแแจแแแแแแแแแแ, แ แแ แแแจแแคแ แฃแแ แแแแแแแแแแ แแแแแ แแ แจแแแชแแแแแก ASCII แแแแแแก, แ แแแแแแแช แแ แแงแ แแแแแแแแ แแแ แกแขแ แแฅแแแจแ. แแแแก แกแแญแแ แแแแแก แแแแแแแ แแชแแแแแ แจแแกแแซแแแแแแแ, แแฃ แแแกแแแ แแฎแแ แแก API-แแแแแ แฃแ แแแแ แแแแแกแแก (แแแแแแแแแ, แแแแแชแแแแ แแแแแกแแแ แแฃแจแแแแแกแแก), แแฅแแแ แแแแแกแชแแแ แแแแแ แแแแก แจแแแแแก, แ แแแแ แช แแแแขแแแแก แแแกแขแ แแฅแขแฃแ แแแแแแแฅแขแก แแ แแ แ แ แแแแ แช แกแขแ แแฅแแแแแก. แฌแแแแแฆแแแแ แจแแแแฎแแแแแจแ, แแฅแแแ แ แแกแแแแ แแแฃแแแแแแแ แแแฃแชแแแแแแแก แแแฆแแแแก.
- แแฃ แแกแฃแ แ แกแฌแ แแคแแ แแแแแแ แกแแแแแแแแแแก แกแแแฆแแ แแแ แแแแแแแแฃแ แ แแคแกแแขแฃแ แแ (แแแแแแแแแ, แ แแแแกแแช แฎแแแแก แแแฌแแแ แแแแแแแแแฃแแแ). แแก แจแแแซแแแแ แแแแแแแแก, แแแแ แแ แแฎแแแแ แฎแแแแก แแแแแแแ แกแแแแแ แแแแ (แแ แฌแแแ แแแฌแแแจแ แแฆแฌแแ แแแ แแแแแคแแแแชแแแก แแแแแงแแแแแแ).
- แแฃ แกแแญแแ แแ แกแขแ แแฅแแแแแแก แจแแแแแแกแแ แแแแ แแชแแแแแก แกแฌแ แแคแแ แจแแกแ แฃแแแแ (แแแฎแแ แแกแฎแแแ, แแแแจแ แฅแแแกแขแ แแฅแแแแแแก แซแแแแ, แจแแแ แแแแ). แแแแกแแแแแก แกแแญแแ แแ แกแขแ แแฅแแแแแแก แแแจแแคแแ แ แฏแแ , แแแแขแแ UTF-C แแ แจแแแแฎแแแแแแจแ แฃแคแ แ แแแแ แแฅแแแแ แแแแ แ UTF-8 (แแแแ แแ แฃแคแ แ แกแฌแ แแคแ แแแแ แ แจแแแฃแแจแแแก แแแแแ แแแแแแ). แแแแแแแแ แแ แแ แแ แแแแแ แกแขแ แแฅแแแ แงแแแแแแแแก แแ แแแแแ แแ แแ แแก แแแแแ แแแฃแแ, แแแแแแแ แแแแก แแฃแกแขแ แจแแแแ แแแ แแ แแ แแก แกแแญแแ แ แแ แจแแแซแแแแ แแแแแแแแก แแแแขแ-แแแแขแ แกแแคแฃแซแแแแแ.
แแแแแฎแแแแแก แแแ แแฆแ: แแแแฎแแแ แแแแแ
แฌแงแแ แ: www.habr.com