Decodificador Unicode

Convierte entre escapes Unicode y texto. Compatible con \uXXXX, \UXXXXXXXX, entidades &#XXXX; y búsqueda de puntos de código. Todo el procesamiento se realiza en tu navegador.

Codificar y decodificar Información de caracteres Procesamiento en el cliente
El resultado aparecerá aquí...

Cómo usar el decodificador Unicode

1

Elige el modo

Selecciona el modo Decodificar (escape a texto) o Codificar (texto a escape).

2

Introduce los datos

Pega escapes Unicode o texto plano según el modo seleccionado.

3

Convierte

Haz clic en Convertir y revisa el resultado y los detalles de los caracteres.

¿Qué es la codificación Unicode?

La codificación Unicode permite que los caracteres de cualquier idioma o sistema de símbolos se representen en diferentes formatos. Los formatos de codificación comunes incluyen \uXXXX (JavaScript/JSON), &#NNNNN; (entidades HTML) y U+XXXX (puntos de código Unicode). Estas codificaciones garantizan que el texto pueda transmitirse y mostrarse de forma segura entre diferentes sistemas.

Formatos de codificación

Codificación JavaScript

Usado en cadenas JSON y JavaScript

Entidades HTML (&#XXXX;)

Usado en HTML para representar caracteres especiales

Escapes CSS (\XXXXXX)

Usado en contenido CSS e identificadores

Preguntas frecuentes

¿Qué formatos de escape Unicode son compatibles?

Esta herramienta es compatible con \uXXXX (BMP), \UXXXXXXXX (Unicode completo), &#DDDD; (entidad HTML decimal), &#xHHHH; (entidad HTML hexadecimal) y U+XXXX (notación de punto de código) para decodificación.

¿Cómo funciona la codificación UTF-8?

UTF-8 codifica cada punto de código Unicode usando de 1 a 4 bytes. Los caracteres ASCII (U+0000 a U+007F) usan 1 byte, los caracteres latinos y otros comunes usan 2 bytes, la mayoría de caracteres CJK usan 3 bytes, y los emoji y caracteres raros usan 4 bytes.

¿Cuál es la diferencia entre \u y \U?

\uXXXX usa 4 dígitos hexadecimales y puede representar caracteres en el Plano Multilingüe Básico (U+0000 a U+FFFF). \UXXXXXXXX usa 8 dígitos hexadecimales y puede representar cualquier carácter Unicode, incluyendo aquellos más allá del BMP.