Décodeur Unicode

Convertissez entre les échappements Unicode et le texte. Prend en charge \uXXXX, \UXXXXXXXX, les entités &#XXXX; et la recherche de points de code. Tout le traitement est effectué dans votre navigateur.

Encodage et décodage Informations sur les caractères Traitement côté client
Le résultat apparaîtra ici...

Comment utiliser le décodeur Unicode

1

Choisissez le mode

Sélectionnez le mode Décoder (échappement vers texte) ou Encoder (texte vers échappement).

2

Entrez les données

Collez des échappements Unicode ou du texte brut selon le mode.

3

Convertissez

Cliquez sur Convertir et consultez le résultat et les détails des caractères.

Qu'est-ce que l'encodage Unicode ?

L'encodage Unicode permet aux caractères de n'importe quel système linguistique ou symbolique d'être représentés dans différents formats. Les formats d'encodage courants incluent \uXXXX (JavaScript/JSON), &#NNNNN; (entités HTML) et U+XXXX (points de code Unicode). Ces encodages garantissent que le texte peut être transmis et affiché en toute sécurité entre différents systèmes.

Formats d'encodage

Encodage JavaScript

Utilisé dans les chaînes JSON et JavaScript

Entités HTML (&#XXXX;)

Utilisé en HTML pour représenter les caractères spéciaux

Échappements CSS (\XXXXXX)

Utilisé dans le contenu et les identifiants CSS

Questions fréquentes

Quels formats d'échappement Unicode sont pris en charge ?

Cet outil prend en charge \uXXXX (BMP), \UXXXXXXXX (Unicode complet), &#DDDD; (entité HTML décimale), &#xHHHH; (entité HTML hexadécimale) et U+XXXX (notation de point de code) pour le décodage.

Comment fonctionne l'encodage UTF-8 ?

UTF-8 encode chaque point de code Unicode en utilisant 1 à 4 octets. Les caractères ASCII (U+0000 à U+007F) utilisent 1 octet, les caractères latins et courants utilisent 2 octets, la plupart des caractères CJC utilisent 3 octets, et les emoji et caractères rares utilisent 4 octets.

Quelle est la différence entre \u et \U ?

\uXXXX utilise 4 chiffres hexadécimaux et peut représenter les caractères du plan multilingue de base (U+0000 à U+FFFF). \UXXXXXXXX utilise 8 chiffres hexadécimaux et peut représenter n'importe quel caractère Unicode, y compris ceux au-delà du BMP.