O que é Unicode?
Unicode é um padrão universal de codificação de caracteres que é usado para suportar caracteres em scripts não-ASCII. A Internet foi originalmente construída em ASCII, que é baseado no alfabeto inglês e consiste em apenas 128 caracteres.
Unicode permite o suporte a todos os idiomas ao redor do mundo e seus conjuntos de caracteres únicos - Unicode pode suportar mais de 1 milhão de caracteres! A maneira como o Unicode funciona é permitindo mais bits, abreviação de b dígito binário isto , que são unidades de informação em uma máquina. Caracteres ASCII só requerem cerca de 7 bits, enquanto Unicode usa 16 bits. Isso é necessário porque leva mais bits para processar idiomas como chinês, árabe e russo.
Existem diferentes tipos de Unicode, incluindo UTF-8 e UTF-16, os dois mais comuns. UTF-8 tornou-se o padrão típico usado na web porque ajusta o número de bits usados dependendo do caractere. Isso significa que caracteres ASCII em UTF-8 só ocupam os bits que precisam para processar.