Publication > L'encodage du texte au format Unicode dans les animations Flash > A propos du format Unicode

 

A propos du format Unicode

Unicode est une norme d'encodage universel des caractères pour la représentation de texte en informatique. Unicode permet de représenter le texte de différentes langues de façon plus cohérente, en affectant à chaque caractère une valeur numérique et un nom uniques. Unicode définit des codes pour les caractères des principales langues écrites du monde entier. Des scripts existent pour les alphabets européens, le texte écrit de droite à gauche et les alphabets asiatiques. Unicode permet également de représenter les marques de ponctuation, les éléments diacritiques, les symboles mathématiques, les symboles techniques, etc.

Les deux formes d'encodage Unicode les plus communes sont UTF-16 (Unicode Transformation Format) et UTF-8. L'encodage UTF-16 est un encodage sur 16 bits représentant chaque point de code (chaque caractère, accent ou autre représentation de caractère) comme une séquence de deux octets. L'encodage UTF-8 permet de représenter le point de code 16 bits sous la forme d'une séquence de quatre octets qui peut être enregistré, récupérée et transmise sur un réseau.