Décodeur Unicode
Convertissez entre les échappements Unicode et le texte. Prend en charge \uXXXX, \UXXXXXXXX, les entités &#XXXX; et la recherche de points de code. Tout le traitement est effectué dans votre navigateur.
Le résultat apparaîtra ici...
Informations sur le caractère
| Caractère | Point de code | Octets UTF-8 | Entité HTML | Échappement CSS | Échappement JS |
|---|
Comment utiliser le décodeur Unicode
Choisissez le mode
Sélectionnez le mode Décoder (échappement vers texte) ou Encoder (texte vers échappement).
Entrez les données
Collez des échappements Unicode ou du texte brut selon le mode.
Convertissez
Cliquez sur Convertir et consultez le résultat et les détails des caractères.
Qu'est-ce que l'encodage Unicode ?
L'encodage Unicode permet aux caractères de n'importe quel système linguistique ou symbolique d'être représentés dans différents formats. Les formats d'encodage courants incluent \uXXXX (JavaScript/JSON), &#NNNNN; (entités HTML) et U+XXXX (points de code Unicode). Ces encodages garantissent que le texte peut être transmis et affiché en toute sécurité entre différents systèmes.
Formats d'encodage
Encodage JavaScript
Utilisé dans les chaînes JSON et JavaScript
Entités HTML (&#XXXX;)
Utilisé en HTML pour représenter les caractères spéciaux
Échappements CSS (\XXXXXX)
Utilisé dans le contenu et les identifiants CSS
Questions fréquentes
Cet outil prend en charge \uXXXX (BMP), \UXXXXXXXX (Unicode complet), &#DDDD; (entité HTML décimale), &#xHHHH; (entité HTML hexadécimale) et U+XXXX (notation de point de code) pour le décodage.
UTF-8 encode chaque point de code Unicode en utilisant 1 à 4 octets. Les caractères ASCII (U+0000 à U+007F) utilisent 1 octet, les caractères latins et courants utilisent 2 octets, la plupart des caractères CJC utilisent 3 octets, et les emoji et caractères rares utilisent 4 octets.
\uXXXX utilise 4 chiffres hexadécimaux et peut représenter les caractères du plan multilingue de base (U+0000 à U+FFFF). \UXXXXXXXX utilise 8 chiffres hexadécimaux et peut représenter n'importe quel caractère Unicode, y compris ceux au-delà du BMP.