Unicode près de dépasser la somme de tous les autres codages sur la Toile


Il y a environ 18 mois, nous avions publié un graphique qui illustrait le fait qu'Unicode était devenu le premier codage sur la Toile, dépassant tous les autres codages pris individuellement. Depuis, sa croissance s'est poursuivie de plus belle.

Comme on le sait, les pages internet peuvent utiliser toute une gamme de codages de caractères allant d'ASCII, à l'ISO Latin 1 ou des codages comme le Shift-JIS pour le japonais. La plupart des codages ne permettent de ne représenter que quelques langues, mais Unicode permet d'en représenter des milliers de l'arabe, au zoulou en passant par le chinois. Google utilise l'Unicode comme jeu de caractères pivot : tous les autres codages sont convertis vers Unicode avant tout autre traitement.

Unicode quasi majoritaire sur la Toile !

Le graphique ci-dessus est tiré des données internes de Google lorsque celui-ci indexe les pages internet. Il se pourrait donc que les chiffres donnés diffèrent quelque peu de ceux que pourrait fournir un autre moteur de recherche. Toutefois, la tendance est très claire : Unicode continue de s'imposer et s'apprête à dépasser la somme de tous les autres codages.

Source : Google

 



 

 

La référence en français sur Unicode 5.0 ( sur Amazon)

 

 

Commandez en ligne?            

 

  Livre Unicode 5.0 en pratique Préface  Nouveau

Table des matières  Nouveau

Avant-propos  Nouveau

Premier Chapitre  Nouveau

Index  Nouveau

Lexique (exclusif au site Internet)  Nouveau

Errata  Nouveau