Декодер Unicode

Преобразование между Unicode-экранированием и текстом. Поддержка \uXXXX, \UXXXXXXXX, сущностей &#XXXX; и поиск кодовых точек. Вся обработка выполняется в вашем браузере.

Кодирование и декодирование Информация о символе Обработка на стороне клиента

Ввод

Вывод

Результат появится здесь...

Информация о символе

Символ	Кодовая точка	Байты UTF-8	HTML-сущность	Экранирование CSS	Экранирование JS

Как использовать декодер Unicode

Выберите режим

Выберите режим «Декодирование» (экранирование в текст) или «Кодирование» (текст в экранирование).

Введите данные

Вставьте Unicode-экранирование или обычный текст в зависимости от режима.

Преобразование

Нажмите «Преобразовать» и просмотрите результат и подробности о символах.

Что такое кодирование Unicode?

Кодирование Unicode позволяет представлять символы из любого языка или системы символов в различных форматах. Распространённые форматы кодирования включают \uXXXX (JavaScript/JSON), &#NNNNN; (HTML-сущности) и U+XXXX (кодовые точки Unicode). Эти кодирования обеспечивают безопасную передачу и отображение текста в различных системах.

Форматы кодирования

Кодировка JavaScript

Используется в строках JSON и JavaScript

HTML-сущности (&#XXXX;)

Используется в HTML для представления специальных символов

Экранирование CSS (\XXXXXX)

Используется в содержимом и идентификаторах CSS

Часто задаваемые вопросы

Какие форматы Unicode-экранирования поддерживаются?

Этот инструмент поддерживает \uXXXX (BMP), \UXXXXXXXX (полный Unicode), &#DDDD; (десятичная HTML-сущность), &#xHHHH; (шестнадцатеричная HTML-сущность) и U+XXXX (нотация кодовой точки) для декодирования.

Как работает кодирование UTF-8?

UTF-8 кодирует каждую кодовую точку Unicode, используя от 1 до 4 байтов. Символы ASCII (от U+0000 до U+007F) используют 1 байт, латинские и другие распространённые символы — 2 байта, большинство CJK-символов — 3 байта, а эмодзи и редкие символы — 4 байта.

В чём разница между \u и \U?

\uXXXX использует 4 шестнадцатеричные цифры и может представлять символы в базовой многоязычной плоскости (от U+0000 до U+FFFF). \UXXXXXXXX использует 8 шестнадцатеричных цифр и может представлять любой символ Unicode, включая символы за пределами BMP.