>> Électroniques Technologie >  >> Maison intelligente >> Vie intelligente

UTF 7 contre UTF 8

UTF-7 et UTF-8 sont deux types de format de transformation Unicode, la norme utilisée pour coder les caractères Unicode 16 bits tels que les lettres internationales et les symboles spéciaux dans un format pouvant être transmis via des systèmes 7 bits ou 8 bits. UTF-8 est le format d'encodage le plus couramment utilisé, populaire dans les pages Web et de nombreux programmes de messagerie. UTF-7 fournit un encodage pour certains protocoles de messagerie qui ne fonctionneront pas avec UTF-8.

Unicode

Unicode est une norme internationale de représentation des caractères sous forme d'entiers. Il utilise 16 bits par caractère contre les sept bits utilisés par ASCII, le code standard américain pour l'échange d'informations. ASCII ne peut reproduire que 128 caractères contre les 65 000 caractères uniques disponibles en Unicode. Cette gamme plus large de caractères rend Unicode plus approprié pour les langues d'Asie de l'Est et d'autres avec de grands jeux de caractères, mais les caractères Unicode doivent être encodés s'ils doivent être transmis via des canaux 7 bits ou 8 bits.

UTF-8

UTF-8 est le format de transformation universel le plus courant utilisé pour convertir les caractères Unicode en segments 8 bits pour une transmission sur le Web par e-mail ou via d'autres canaux 8 bits. Ce format de codage change chaque caractère Unicode en un à quatre octets, selon la valeur entière du caractère Unicode, et il est très efficace pour les documents qui utilisent principalement des lettres également trouvées dans le jeu de caractères ASCII. UTF-8 a tendance à occuper plus d'espace que l'encodage à un octet pour les alphabets non occidentaux.

UTF-7

UTF-7 est une variante spéciale du format universel de transformation proposé pour la première fois au milieu des années 1990. Il a été conçu pour représenter le texte Unicode avec une chaîne de caractères ASCII, produisant une méthode de codage plus efficace pour le courrier électronique que UTF-8 plus le codage imprimable entre guillemets nécessaire pour transmettre sur un chemin de données 7 bits. L'utilisation de l'encodage UTF-7 réduit considérablement la taille des caractères encodés.

Considérations

Bien que UTF-7 soit plus efficace sur les canaux 7 bits que UTF-8 plus quoted-printable, la plupart des autorités, y compris Internet Mail Consortium et Microsoft Developer Network, recommandent d'utiliser UTF-8 sur UTF-7 chaque fois que possible. En effet, UTF-7 crée des problèmes de sécurité et de robustesse qui ne sont pas présents dans son parent 8 bits. L'IMC recommande également que tous les programmes d'affichage de courrier créés après le 1er janvier 1999 soient capables d'afficher le courrier en UTF-8.


Vie intelligente