Table des caractères Unicode (0000-FFFF)
Unicode est une norme informatique développée par le Consortium Unicode qui vise à donner à tout caractère de n'importe quel système d’écriture de langue un identifiant numérique unique, et ce de manière unifiée, quelle que soit la plate-forme informatique ou le logiciel.
Unicode et la norme ISO/CEI 10646 attribuent à chaque caractère un nom officiel au sein d’un répertoire commun unifié entre toutes les langues et tous les usages. Dès que le répertoire commun est approuvé, les caractères sont groupés en blocs en fonction de leur usage et des écritures supportées, et reçoivent une identification numérique unique appelée point de code, identifiée généralement sous la forme "U+...." (où "...." représente un nombre hexadécimal de 4 à 6 chiffres, entre U+0000 et U+10FFFF).
Plan multilingue de base (PMB/BMP)
[modifier | modifier le code]Les tables suivantes listent tous les blocs de points de code alloués dans ce plan dans les normes ISO/CEI 10646 et Unicode.
Légende des conventions de couleurs et de style |
---|
Les blocs affichés sur fond clair sont alloués et contiennent des caractères affichables et normalisés. Certains de ces blocs peuvent également contenir des signes diacritiques. |
Les blocs affichés sur fond bleu sont alloués et contiennent des signes diacritiques normalisés qui se combinent avec d’autres caractères de base après lesquels ils sont codés dans les textes. |
Les blocs affichés sur fond jaune pâle sont alloués et contiennent des caractères affichables et normalisés pour des écritures de droite à gauche (ils nécessitent la prise en charge des écritures bidirectionnelles pour un rendu correct ; certains de ces caractères, mais pas tous, peuvent nécessiter une présentation en miroir selon le contexte directionnel). Certains de ces blocs peuvent également contenir des signes diacritiques. |
Les blocs affichés sur fond vert sont alloués définitivement et attribués à des caractères à usage privé et libre, mais non interopérables. |
Les blocs affichés sur fond rouge sont alloués définitivement mais les points de codes ne sont pas attribués à des caractères affichables (ce sont des caractères spéciaux ou de contrôle). |
Les blocs affichés sur fond gris foncé ne sont pas encore attribués officiellement (dans la version actuelle Unicode 16.0). Parmi ceux-ci :
|
Les blocs affichés sur fond noir sont pour des points de codes réservés de façon permanente à des « non-caractères ».
|
|
Alphabets occidentaux modernes
[modifier | modifier le code]+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | +A0 | +B0 | +C0 | +D0 | +E0 | +F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0000 | commandes C0 | latin de base | commandes C1 | latin – 1 | ||||||||||||
U+0100 | latin étendu – A | latin étendu – B | ||||||||||||||
U+0200 | latin étendu – B | alphabet phonétique international | lettres modificatives avec chasse | |||||||||||||
U+0300 | diacritiques | grec et copte | ||||||||||||||
U+0400 | cyrillique | |||||||||||||||
U+0500 | cyrillique – supplément | arménien |
Abjads afroasiatiques modernes (écrits de droite à gauche)
[modifier | modifier le code]+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | +A0 | +B0 | +C0 | +D0 | +E0 | +F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0500 | hébreu | |||||||||||||||
U+0600 | arabe | |||||||||||||||
U+0700 | syriaque | arabe – supplément | thâna | n’ko | ||||||||||||
U+0800 | samaritain | mandéen | syriaque – supplément | arabe étendu – B | arabe étendu – A |
Abugidas sud-asiatiques modernes
[modifier | modifier le code]+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | +A0 | +B0 | +C0 | +D0 | +E0 | +F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0900 | devanâgarî | bengalî | ||||||||||||||
U+0A00 | gourmoukhî (ou gurmukhi) | goudjarati (ou gujarâtî) | ||||||||||||||
U+0B00 | oriyâ (ou odia) | tamoul | ||||||||||||||
U+0C00 | télougou | kannara (ou kannada) | ||||||||||||||
U+0D00 | malayalam | singhalais (ou cingalais) | ||||||||||||||
U+0E00 | thaï | lao (ou laotien) | ||||||||||||||
U+0F00 | tibétain | |||||||||||||||
U+1000 | birman |
Autres alphabets et syllabaires modernes
[modifier | modifier le code]+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | +A0 | +B0 | +C0 | +D0 | +E0 | +F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+1100 | géorgien – assomtavrouli et mkhédrouli | |||||||||||||||
U+1100 | hangûl (ou hangeul) – jamos | |||||||||||||||
U+1200 | éthiopien | |||||||||||||||
U+1300 | éthiopien – supplément | chérokie | ||||||||||||||
U+1400 U+1500 |
syllabaires autochtones canadiens | |||||||||||||||
U+1600 | ogam (ou ogham) | runes (ou futhark) |
Abugidas asiatiques du sud-est modernes
[modifier | modifier le code]+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | +A0 | +B0 | +C0 | +D0 | +E0 | +F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+1700 | tagalog (ou baybayin, alibata) | hanounóo | bouhide (ou bouhid) | tagbanoua (ou tagbanwa) | khmer (ou cambodgien) |
Abjad asiatique (traditionnellement écrit de haut en bas, parfois de gauche à droite)
[modifier | modifier le code]+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | +A0 | +B0 | +C0 | +D0 | +E0 | +F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+1800 | mongol (ou bitchig) |
Syllabaires modernes – extension
[modifier | modifier le code]+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | +A0 | +B0 | +C0 | +D0 | +E0 | +F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+1800 | syllabaires autochtones canadiens étendus |
Autres abugidas sud-asiatiques modernes et alphabets modernes – extensions
[modifier | modifier le code]+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | +A0 | +B0 | +C0 | +D0 | +E0 | +F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+1900 | limbu | taï-le | nouveau taï-lue | khmer (ou cambodgien) – symboles | ||||||||||||
U+1A00 | bougui (ou bouguinais, bugi, lontara) | taï tham (ou lanna) | diacritiques – compléments | |||||||||||||
U+1B00 | balinais | soundanais | batak | |||||||||||||
U+1C00 | lepcha | ol tchiki | cyrillique étendu – C | géorgien étendu – mtavrouli | soundanais | extensions védiques |
Alphabets occidentaux modernes – suppléments
[modifier | modifier le code]+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | +A0 | +B0 | +C0 | +D0 | +E0 | +F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+1D00 | phonétique – supplément | phonétique étendu – supplément | diacritiques – supplément | |||||||||||||
U+1E00 | latin étendu – supplément | |||||||||||||||
U+1F00 | grec étendu |
Symboles et ponctuations d’usage général ou technique
[modifier | modifier le code]+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | +A0 | +B0 | +C0 | +D0 | +E0 | +F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+2000 | ponctuation générale | exposants et indices | symboles monétaires | signes combinatoires pour symboles | ||||||||||||
U+2100 | symboles de type lettre | formes numérales | flèches | |||||||||||||
U+2200 | symboles mathématiques | |||||||||||||||
U+2300 | symboles techniques divers | |||||||||||||||
U+2400 | pictogrammes de commande | reconnaissance optique | alphanumériques cerclés | |||||||||||||
U+2500 | filets | pavés | formes géométriques | |||||||||||||
U+2600 | symboles divers | |||||||||||||||
U+2700 | casseau | symboles mathématiques divers – A | flèches – supplément – A | |||||||||||||
U+2800 | combinaisons Braille | |||||||||||||||
U+2900 | flèches – supplément – B | symboles mathématiques divers – B | ||||||||||||||
U+2A00 | opérateurs mathématiques supplémentaires | |||||||||||||||
U+2B00 | symboles et flèches divers |
Alphabets modernes – suppléments
[modifier | modifier le code]+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | +A0 | +B0 | +C0 | +D0 | +E0 | +F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+2C00 | glagolitique | latin étendu – C | copte | |||||||||||||
U+2D00 | géorgien – supplément | tifinaghe | éthiopien étendu | cyrillique ét. – A | ||||||||||||
U+2E00 | ponctuation complémentaire |
Syllabaires, sinogrammes, clés et traits les plus courants d’Asie orientale
[modifier | modifier le code]+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | +A0 | +B0 | +C0 | +D0 | +E0 | +F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+2E00 | sinogrammes – clés CJC – supplément | |||||||||||||||
U+2F00 | sinogrammes – clés chinoises du Kangxi | — | sino. – descr. | |||||||||||||
U+3000 | symboles et ponct. CJC | hiragana | katakana | |||||||||||||
U+3100 | bopomofo | hangûl – jamos de compatibilité | kanboun | bopomofo étendu | sinogrammes – traits CJC | katakana – supplément | ||||||||||
U+3200 | lettres et mois CJC entourés | |||||||||||||||
U+3300 | sinogrammes de compatibilité CJC | |||||||||||||||
U+3400 ... U+4000 ... |
sinogrammes unifiés CJC – supplément A | |||||||||||||||
U+4D00 | hexagrammes du Yi Jing | |||||||||||||||
U+4E00 ... U+5000 ... U+6000 ... U+7000 ... U+8000 ... U+9000 ... U+9FFF |
sinogrammes unifiés CJC | |||||||||||||||
U+A000 ... |
yi – syllabaire des Monts frais | |||||||||||||||
U+A400 | yi – clés | lissou (ou lisu, Fraser) |
Alphabets, abugidas et syllabaires modernes – extensions
[modifier | modifier le code]+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | +A0 | +B0 | +C0 | +D0 | +E0 | +F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+A500 | vaï | |||||||||||||||
U+A600 | cyrillique étendu – B | bamoun (ou bamoum, shü-mom) | ||||||||||||||
U+A700 | lettres modificatives de ton | latin étendu – D | ||||||||||||||
U+A800 | sylotî nâgrî | formes numériques communes indiennes | phags-pa | saurachtra (ou saurashtra) | dévanâgarî étendu | |||||||||||
U+A900 | kayah li | redjang (ou rejang) | jamos hangûl – A | javanais | birman étendu – B | |||||||||||
U+AA00 | cham | birman étendu – A | taï việt | meitei mayek étendu | ||||||||||||
U+AB00 | éthiopien étendu – A | latin étendu – E | chérokie – supplément | meitei mayek | ||||||||||||
U+AC00 ... U+B000 ... U+C000 ... U+D000 ... |
hangûl – syllabes précomposées | |||||||||||||||
U+D700 | jamos hangûl étendus – B |
Points de codes à usage spécial
[modifier | modifier le code]+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | +A0 | +B0 | +C0 | +D0 | +E0 | +F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+D800 ... |
demi-zone haute d’indirection | |||||||||||||||
U+DB00 | demi-zone haute d’indirection à usage privé | |||||||||||||||
U+DC00 ... U+DF00 |
demi-zone basse d’indirection | |||||||||||||||
U+E000 ... U+F000 ... U+F800 |
zone à usage privé |
Caractères de compatibilité, formes de présentation et autres caractères spéciaux
[modifier | modifier le code]+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | +A0 | +B0 | +C0 | +D0 | +E0 | +F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+F900 U+FA00 |
sinogrammes de compatibilité CJC | |||||||||||||||
U+FB00 | formes de présentation alphabétiques | |||||||||||||||
U+FC00 | formes de présentation arabes – A | |||||||||||||||
U+FD00 | non-caractères | |||||||||||||||
U+FE00 | sélecteurs de variante | formes de présentation verticales | demi- diacritiques |
formes de compatibilité CJC |
petites formes | formes de présentation arabes – B | ||||||||||
U+FF00 | formes de demi-chasse et de pleine chasse | spéciaux |
Voir aussi
[modifier | modifier le code]Liens externes
[modifier | modifier le code]- Tables de caractères classées par écriture, sur le site officiel Unicode (dernière version normalisée) :
- (en) Roadmap to the BMP (Plane 0) (écritures supportées ou en cours de normalisation), sur le site officiel Unicode.