KomepiutaPolokalame

UTF-8 - uiga encoding

lagolagoina toetoe Unicode seti uiga uma oi ai nei. O le seti uiga Unicode ituaiga o encoding sili o UTF-8 encoding. E lagolagoina le tulaga ogatasi ma ASCII, tetee atu i faaleagaina o le faamatalaga, o le le lelei ma le faigofie o le faagasologa. Ae mea muamua muamua.

pepa coding

Komepiuta faagaoioia e le gata o numera mea matematika lavelave, faapea foi ma le faapotopotoga o le iunite o le teuina ma le taulimaina o tumau-tele faamatalaga - byte ma le 32-sina upu. e tatau ona tulaga faatonuina Encoding i tala lenei pe a fuafuaina pe faapefea ona e tuuina atu o le aofai o tagata.

I le faiga o le komepiuta, o le integers teuina i le manatu sela o 8 faagutu (1 byte), 16 po o le 32 faagutu. Taitasi ituaiga faamatalaina a encoding Unicode, lea faasologa o sela manatua o se integer tutusa i se faailoga faapitoa. I le tulaga e tolu ituaiga eseese o coding tagata Unicode 8, 16 ma le poloka 32-si. E tusa ai, ona iloa i latou e pei UTF-8, UTF-16 ma UTF-32. Igoa UTF tu mo Faatulagaina Faaliliuina Unicode. ituaiga e tolu taitasi o encoding auala e uiga Unicode faatusa tutusa ua lelei i talosaga eseese.

e mafai ona faaaoga encryption faamatalaga e fai ma sui o tagata uma i le tulaga Unicode. O lea, ua atoatoa talafeagai i latou faafitauli mo le tele o mafuaaga, o le faaaogaina o ituaiga eseese o coding. e mafai ona unambiguously ona liua taitasi coding i so o se isi e lua e aunoa ma le gau o faamatalaga.

nenalozheniya mataupu faavae

Taitasi o le ituaiga Unicode encoding atiina ae i le vaaiga o le lē fesiliaʻi vaega. Mo se faataitaiga, avea ma Pupuni-932 o tagata o se tasi pe lua bytes o code. O le umi faasologa e faalagolago i le byte muamua, o lea tulaga faatauaina taʻitaʻiga byte i le faasologa o le lua-byte ma nofofua disjoint byte. Ae peitai, o le taua o le a byte nofofua ma faasologa byte trailing mafai feagai. O lona uiga mo se faataitaiga o le D suesuega amio (code 44) e mafai ona maua ai e sese le ulu atu i le vaega lona lua o le faasologa o uiga e lua byte "D" (code 84 44). Ina ia maua mai lea faasologa e saʻo, e tatau ona ave le polokalama amanaia le bytes mavae.

O le tulaga o faigata, pe afai o le afitusi bytes taitaiga ma trailing. O lona uiga, ina ia mafai ona aveese o le a avea ailililo a lookup faafeagai ao leʻi taunuu i le amataga o le mau po o le faasologa code tulaga ese. e le gata lē faimeamāeʻa lenei mea, ae e le o puipuia mai mea sese e mafai ai, talu ai ua avea unreadable na o le tasi byte sese i le tumu i le mau.

aloese faatulagaga liua Unicode lenei faafitauli ona o le taua o le tau, trailing, ma se tasi iunite o teuina e le o le faamatalaga e tasi. O lenei mautinoa ai Unicode uma mo le sailia ma le faatusatusaga, aua le tuuina atu o taunuuga sese ona o le faafuasei o vaega eseese o le code amio. O le mea moni e faapea o nei ituaiga o coding tausia le nenalozheniya mataupu faavae, tulaga ese ai i latou mai isi East Asia encodings eseese byte.

O le isi itu nonintersection encodings Unicode o le tasi i le uiga ua i ai se tuaoi faamatalaina manino. O lenei aveesea e le manaomia e vaai faavavevave i se numera faavavau o faatusa mavae. O lenei vaega e taʻua i nisi taimi encoding lava clocking. Faaleagaina o iunite code le a faailoa atu e suia ai na o le tasi le amio, ma o loo iai lava tagata o loo siomia ai. I le 8-si faatulagaga liua, pe afai o le manatu e faasino i le byte, e amata i 10xxxxxx (i le code binary) e maua ai e manaomia ai le amataga o le faatusa o le tasi i le tolu fesuiaiga faafeagai.

pea e le aunoa

lagolagoina atoatoa Unicode Consortium ituaiga 3 uma o encodings. E taua tele le e tetee i le UTF-8 ma Unicode, e pei mamanu liua uma - tutusa pepa aloaia o embodiment o le Unicode tulaga faatonuina amio-encoding.

Byte-aoaoga faamasani

E fai ma sui UTF-32 tagata o le a manaomia se 32-si code iunite, lea coincides ma le code Unicode. UTF-16 - tasi i le lua iunite e 16 sina. A UTF-8 faaaoga e oo atu i le 4 bytes.

ua fuafuaina encoding UTF-8 e talafeagai ma byte-taulai faiga faale-ASCII. O le tele o polokalama oi ai nei ma le faiga o faamatalaga tekinolosi mo se taimi umi faalagolago i le faatusa o le tagata i se faasologa o bytes. faalagolago maliega faafeagaiga tele i le faamaoni o ASCII encoding ma faaaogā pe aloese le tagata faapitoa pulea. O se auala faigofie e faamasani i tulaga Unicode mafaia, e faaaoga 8-si coding fai ma sui mo tagata Unicode, so o se uiga tutusa ASCII po o le a pulea le amio. I lenei iuga, ma o UTF-8 encoding.

umi ma liuliuina

UTF-8 - coding o le umi ma liuliuina, e aofia ai 8-si iunite tau teuina, le faagutu i luga o le faailoa atu lea o se vaega o le faasologa o byte tagata taitoatasi ea. O se tasi o le tele o tulaga faatauaina e faatulagaina i le elemene muamua o le code faasologa, o le isi - mo le isi. O lenei tuuina encoding disjointness.

ASCII

UTF-8 encoding atoatoa lagolagoina tulafono laiti ASCII (0x00-0x7F). O lona uiga e faapea o le tagata Unicode U + 0000-U + 007F ua liua i nofofua byte UTF-8 0x00-0x7F ma faapea ona avea indistinguishable mai ASCII. Gata i lea, e aloese ai mai tulaga faanimonimo, 0x00-0x7F le faaaogaina o le tau aogā o so o se sili atu i se faatusa byte tasi o tagata Unicode. Ina ia encode faatusa neideograficheskih isi nai lo ASCII, e faaaoga ai se faasologa o lua bytes. Faatusa e faasolo U + 0800-U + FFFF loo faatusalia mai e tolu bytes, ma tulafono laiti faaopoopo ma le silia U + FFFF manaomia e fa bytes.

lalolagi o le talosaga

encoding UTF-8 masani ua tuuina le faamuamua i le maliega faafeagaiga HTML, ma faapena.

XML ua avea le tulaga muamua ma le lagolago atoa mo UTF-8 encoding. faalapotopotoga tulaga faatonuina foi fautuaina ai. Support faafitauli i le URL tuatusi e ese mai le ASCII-tagata, na foia ina ua oo mai le consortium W3C ma le vaega inisinia IETF i se maliega i le coding uma i lauga o le URL faapitoa i UTF-8.

Ogatasi ma ASCII faafaigofie le suiga i le polokalama fou. Faatasi ai ma le UTF-8 galue sili ona faatonu mau, e aofia ai JEdit, Emacs, BBEdit, gaseʻeleʻele, ma "Notepad" o le faiga o faagaoioia Pupuni. E leai se isi ituaiga o encoding le mafai ona Unicode mitamita o se lagolago e pei o le meafaigaluega.

o coding lelei e aofia ai se faasologa o bytes. Faatasi ai ma le UTF-8 manoa e faigofie ona galulue i C ma isi gagana polokalame. o le ituaiga o le pau lenei o encoding, o le poloaiga e le manaomia ai igoa bytes BOM po o se tautinoga encoding i XML.

lava synchronization

I se siosiomaga e faaaoga e 8-sina faatusa o le gaosi faatusatusa i isi eseese byte seti uiga, ei ai le UTF-8 lelei nei:

  • O le tulafono muamua byte faasologa o loo i ai faamatalaga e uiga i lona umi. O lenei faateleina ai le le lelei o suesuega tuusao.
  • Faafaigofie le mauaina o le amataga o le faailoga e pei ona faatapulaaina le byte amata i se vaega tumau o le tulaga faatauaina.
  • E leai se fetaulaiga ala faatauaina byte.

Faatusatusa le faamanuiaga

encoding UTF-8 e puupuu. Ae ina ua faaaoga mo encoding tagata Asia i Sasae (Saina, Iapani, Korea, tusitusia Saina le faaaogaina o faailoga) faaaogāina sequences 3-byte. Foi UTF-8 encoding e faatauvaa i isi ituaiga o coding saosaoa gaosi. O se laina sailiili binary maua ai le taunuuga lava e tasi e pei o le binary sailiili Unicode.

O le amio polokalame encoding

O le amio encoding polokalame e aofia ai pepa faatumu faatusa encoding ma metotia mo tasi byte iunite tau code nofoaga. Ina ia iloa le encoding polokalame Unicode tulaga faatonuina e maua i le faaaogaina o se faailoga ina uluai byte (BOM, Byte faailoga poloaiga).

Ina ua BOM i UTF-8 vaega pine ua faatapulaaina na o le faasinomaga i le faaaogaina o ituaiga o coding. Faafitauli i le fuafuaina o le UTF-8 endian, e pei lona tele iunite encoding o se tasi byte. Le faaaogaina o le BOM mo lenei ituaiga o coding ua lē manaomia po o ua fautuaina. e mafai ona tupu BOM i le mau ina ia liua mai isi codings faaaogaina byte faailoga poloaiga po o saini mo UTF-8 encoding. O se faasologa o le 3 bytes EF pulu 16 16 BF 16.

Le auala e faatulaga le UTF-8 encoding

O le HTML coding ua faapipiiina UTF-8 ma le tulafono nei:

ulu

˂meta http-equiv = "Aano-Ituaiga" mataupu = "mau / HTML; charset = utf-8" ˃

I PHP UTF-8 ua faatulaga encoding le faaaogaina o le header () galuega tauave i le amataga o le faila ina ua mavae le faatulagaina o le mea sese taua le tulaga o galuega faatino:

˂? Php

error_reporting (-1);

header ( "Aano-Ituaiga: mau / HTML; charset = utf-8 ');

E fesootai i se nofoaga autu o faamatalaga MySQL UTF-8 encoding ua faatulaga:

˂? Php

mysql_set_charset ( 'utf8');

O le encoding faila-CSS o UTF-8 tagata ua faamaoti mai e faapea:

@charset "utf-8";

A e laveaiina le faila o ituaiga uma filifili UTF-8 encoding aunoa BOM, a lē o le a le galue i le nofoaga. Ina ia faia lenei mea i DreamWeave manaomia e filifili le mea menu "suiga - Page Meatotino - Igoa / Encoding" e suia le encoding e UTF-8. Mulimuli e reloading le itulau, aveese le faailoga siaki mai le "fesootai saini Unicode (BOM)» ma faaaoga le suiga. Afai ei ai se mau i luga o se itulau po o se sa faailoa nofoaga autu o faamatalaga se isi ituaiga o coding, e talafeagai ona toe ulufale mai po o le toe encode. Afai e te galue i faaupuga masani, ia mautinoa e faaaoga le fesuiai u.

E mafai foi ona faasaoina o le faila i encoding UTF-8 i le "Notepad" o le Pupuni. Ina ua uma ona filifilia o le mea menu "Pokolame - Teu A ..." i le faatuina o le pepa faatumu e tatau ai o encoding ma faasaoina le faila i UTF-8.

I se Notepad faatonu mau ++, pe afai ua faatulaga e ese UTF-8, e ala i le mea menu "Liliu i UTF-8 e aunoa BOM» suia le amio ma laveai i UTF-8.

e leai se isi

I le talaaga o globalization, lea e aveesea tuaoi faaupufai ma gagana, o le uiga seti e maua uiga i le lotoifale, e itiiti faaaogaina. o Unicode se seti uiga e tasi e lagolagoina localizations uma. A UTF-8 - o se faataitaiga o le faatinoga lelei o Unicode, lea o le:

  • E lagolagoina e le tele o ituaiga meafaigaluega, e aofia ai le tulaga ogatasi ma encoding ASCII;
  • E tetee atu faamatalaga faaleagaina;
  • faigofie ma le lelei i le togafitiga;
  • o tulaga tutoatasi.

Faatasi ai ma le toe afio mai o le UTF-8 felafolafoaiga e uiga i mea ituaiga o encoding po o uiga o seti e sili atu, e avea o se uiga.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 sm.birmiss.com. Theme powered by WordPress.