Cos'è Unicode?
Unicode è uno standard universale di codifica dei caratteri utilizzato per supportare caratteri in script non ASCII. Internet è stato originariamente costruito su ASCII, che si basa sull'alfabeto inglese e consiste di soli 128 caratteri.
Unicode permette di supportare tutte le lingue del mondo e i loro set di caratteri unici - Unicode può supportare oltre 1 milione di caratteri! Il modo in cui funziona Unicode è permettendo più bit, abbreviazione di b inary dig it , che sono unità di informazione su una macchina. I caratteri ASCII richiedono solo circa 7 bit, mentre Unicode utilizza 16 bit. Questo è necessario perché servono più bit per elaborare lingue come il cinese, l'arabo e il russo.
Ci sono diversi tipi di Unicode tra cui UTF-8 e UTF-16, i due più comuni. UTF-8 è diventato lo standard tipico utilizzato sul web perché regola il numero di bit utilizzati a seconda del carattere. Questo significa che i caratteri ASCII in UTF-8 occupano solo i bit necessari per elaborarli.