Что такое ASCII и что такое ASCII vs. Не-ASCII символы в доменах?
ASCII, произносится ask-ee , означает Американский стандартный код для обмена информацией. ASCII изначально был основан на английском алфавите и состоит из 128 символов, включая A-Z, 0-9, пунктуацию, пробелы и другие управляющие коды, которые можно найти на стандартной английской клавиатуре. Эти 128 символов затем присваиваются числам от 0 до 127 для их представления при передаче данных с одного компьютера на другой. В то время как код ASCII изначально был разработан для телетайпов (устройство, используемое для отправки и получения сообщений), он нашел более широкое применение с развитием персональных компьютеров.
ASCII и не-ASCII символы в доменных именах
ASCII-домены, как и ASCII в целом, основан на английском алфавите. Эти домены ограничены только следующими символами: A-Z, 0-9 и дефисами (-). Другие виды пунктуации, пробелы и т.д. не допускаются для этих доменов. ASCII домены гораздо более распространены, чем домены с не-ASCII символами, так как последние стали доступны для публичной регистрации только недавно (около 2010 года).
Примеры ASCII-доменов:
- .com
- .org
- .xyz
- .co
Не-ASCII домены обычно называют Интернационализированные доменные имена (IDN). Совсем недавно, международные доменные расширения также стали доступны на различных языках и письменностях. Эти типы доменов позволяют включать гораздо большее разнообразие символов, что открывает Интернет для большего количества людей по всему миру через доступность и использование других языков. Короче говоря, не-ASCII домены не ограничены строго символами ASCII (A-Z, 0-9 и дефисами), они позволяют использовать широкий спектр уникальных символов.
Примеры не-ASCII символов, используемых в международных доменных расширениях:
- .भारत (используется для сайтов в Индии)
- .网络 (эквивалент .NET в Китае)
- .קום (эквивалент .COM на иврите)
- .இந்தியா (означает 'Тамильский' для Индии, который является языком, на котором говорят в некоторых частях Индии)