Apa itu Unicode?
Unicode adalah standar pengkodean karakter universal yang digunakan untuk mendukung karakter dalam skrip non-ASCII. Internet awalnya dibangun di atas ASCII, yang didasarkan pada alfabet Inggris dan hanya terdiri dari 128 karakter.
Unicode memungkinkan dukungan untuk semua bahasa di dunia dan set karakter unik mereka - Unicode dapat mendukung lebih dari 1 juta karakter! Cara kerja Unicode adalah dengan mengizinkan lebih banyak bit, singkatan dari b inary dig it , yang merupakan unit informasi pada mesin. Karakter ASCII hanya membutuhkan sekitar 7 bit, sementara Unicode menggunakan 16 bit. Ini diperlukan karena dibutuhkan lebih banyak bit untuk memproses bahasa seperti Cina, Arab, dan Rusia.
Ada berbagai jenis Unicode termasuk UTF-8 dan UTF-16, dua yang paling umum. UTF-8 telah menjadi standar tipikal yang digunakan di web karena menyesuaikan jumlah bit yang digunakan tergantung pada karakter. Ini berarti bahwa karakter ASCII dalam UTF-8 hanya mengambil bit yang mereka butuhkan untuk diproses.