Šta je Unicode?
Unikod je univerzalni standard za kodiranje karaktera koji se koristi za podršku karaktera u ne-ASCII skriptama. Internet je originalno izgrađen na ASCII, koji je baziran na engleskom alfabetu i sastoji se od samo 128 karaktera.
Unikod omogućava podršku za sve jezike širom sveta i njihove jedinstvene skupove karaktera - Unikod može podržati preko 1 milion karaktera! Način na koji Unikod radi je omogućavanjem više bitova, skraćeno za b binarna cifra to , koji su jedinice informacija na mašini. ASCII karakteri zahtevaju samo oko 7 bitova, dok Unikod koristi 16 bitova. Ovo je neophodno jer je potrebno više bitova za procesiranje jezika kao što su kineski, arapski i ruski.
Postoje različite vrste Unikoda uključujući UTF-8 i UTF-16, dva najčešća. UTF-8 je postao tipični standard koji se koristi na vebu jer prilagođava broj korišćenih bitova u zavisnosti od karaktera. To znači da ASCII karakteri u UTF-8 zauzimaju samo bitove koji su im potrebni za procesiranje.