ISO/IEC 6937
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/06/05 08:57 UTC 版)
ISO/IEC 6937:2001, Information technology — Coded graphic character set for text communication — Latin alphabet(情報技術 — 文字コミュニケーションのためのコード化された図形文字集合 — ラテンアルファベット)は、ISO基本ラテンアルファベットにないラテン文字を表現するためにASCII(ISO/IEC 646)をマルチバイト拡張したものである。ITU-T(当時はCCITT)によってテレマティクスのために開発され、T.51として勧告された。1983年にISO標準となった。
特定のバイトコードが、ダイアクリティカルマークつきの文字のためのバイトとして使われる。第1バイトの値がダイアクリティカルマークの種別を表し、ASCIIの値を持つ第2バイトが、ダイアクリティカルマークがつく文字を表す。第1バイトと第2バイトは特定の組み合わせのみが許容され、第1バイトの解釈は第2バイトによって例外がある。ISO/IEC 6937ではダイアクリティカルマークつきの組み合わせ後の文字は1つもコード化されていない。ダイアクリティカルマークその物を表したい場合は、第2バイトにASCIIのスペースを入れる。
ISO/IEC 6937はヒュージ・マックレガー・ロス、ピーター・フェンウィック、ベルナルド・マルティ、レーク・ゼッケンドルフによって設計された。
ISO 6937/2ではラテン文字を使用する現代のヨーロッパの言語で使われている327の文字が定義されている。キリル文字・ギリシャ文字などのラテン文字ではない文字は含まれていない。ダイアクリティカルマークつきのラテン文字でも、ルーマニア語のȘ(Sコンマ)など一部は含んでいない。Sコンマについては、規格制定時にコンマビローとセディーユの区別をしていなかったので、コンマビローの代わりにセディーユを使用する。
IANAでは、ISO 6937/2のバージョンの違いに応じてISO_6937-2-25とISO_6937-2-addの2つの名称を与えている。ただし、この文字コードがインターネット上では使用されたことはない。
ISO/IEC 6937の右半分を指すISO/IEC 2022のエスケープシーケンスは ESC - R
(十六進数 1B 2D 52
)である[1]。
1バイト文字
ISO 6937/2の基本文字(0x00-0x7f)はISO 646に基づいているが、国際通貨記号(¤)に割り当てられていた0x24をドル記号($)に変更している。
!"#¤%&'()*+,-./0123456789:;<=>?@ ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_` abcdefghijklmnopqrstuvwxyz{|}
補足文字(0x80-0xff)には、字幅のあるおよび字幅のないの図形文字、追加記号と、将来の追加のための予約領域が含まれている。
2バイト文字
基本文字に含まれないアルファベットは2バイトでコード化する。第1バイトは「字幅のないダイアクリティカルマーク」(non spacing diacritical mark)で、第2バイトの基本アルファベットにそのダイアクリティカルマークをつける。例えば、アキュート・アクセントつきの小文字のe (é)は「[字幅のないアキュート・アクセント] + e」として表現される。
ISO 6937の「字幅のないダイアクリティカルマーク」は以下の13種類である。
種類 | コード | 第2バイト | 生成結果 |
---|---|---|---|
グレイヴ・アクセント | 0xC1 | AEIOUaeiou | ÀÈÌÒÙàèìòù |
アキュート・アクセント | 0xC2 | ACEILNORSUYZacegilnorsuyz | ÁĆÉÍĹŃÓŔŚÚÝŹáćéģíĺńóŕśúýź |
サーカムフレックス | 0xC3 | ACEGHIJOSUWYaceghijosuwy | ÂĈÊĜĤÎĴÔŜÛŴŶâĉêĝĥîĵôŝûŵŷ |
チルダ | 0xC4 | AINOUainou | ÃĨÑÕŨãĩñõũ |
マクロン | 0xC5 | AEIOUaeiou | ĀĒĪŌŪāēīōū |
ブレーヴェ | 0xC6 | AGUagu | ĂĞŬăğŭ |
ドット | 0xC7 | CEGIZcegz | ĊĖĠİŻċėġż |
トレマ(ウムラウト) | 0xC8 | AEIOUYaeiouy | ÄËÏÖÜŸäëïöüÿ |
リング | 0xCA | AUau | ÅŮåů |
セディーユ | 0xCB | CGKLNRSTcklnrst | ÇĢĶĻŅŖŞŢçķļņŗşţ |
ダブルアキュート | 0xCD | OUou | ŐŰőű |
オゴネク | 0xCE | AEIUaeiu | ĄĘĮŲąęįų |
ハーチェク | 0xCF | CDELNRSTZcdelnrstz | ČĎĚĽŇŘŠŤŽčďěľňřšťž |
符号表
UnicodeでU+0300—U+036Fの範囲にある結合文字は、ISO/IEC 6937では0xC1—0xCFにあり、第1バイト(lead byte)としてのみ使用される。この範囲にあるダイアクリティカルマークがついた文字は、組み合わせ済みの文字とさてはコード化されていない。ダイアクリティカルマークの組み合わせで表現できない文字については、コード化されている。
例外的に、「セディーユつきの小文字のg」はアキュート・アクセント(0xC2)を第1バイトとする。これは、「セディーユつきの小文字のg」は、Ģ ģのように「g」の上にカンマを逆にしたものを付けた形になるためである。
Unicodeでは大文字のĐ(ストローク付きD)とÐ(エズ)を区別しているが、ISO/IEC 6937では区別せずに0xE2を割り当てている。小文字は字形が異なるため、ストローク付きD(đ)に0xF2、エズ(ð)に0xF3と別のコードを割り当てている。
凡例:
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
_ | 00 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
_ | 116 | 17 | 18 | 19 | 21 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 |
_ | 2SP 0020 32 | ! 0021 33 | " 0022 34 | # 0023 35 | $ 0024 36 | % 0025 37 | & 0026 38 | ' 0027 39 | ( 0028 40 | ) 0029 41 | * 002A 42 | + 002B 43 | , 002C 44 | - 002D 45 | . 002E 46 | / 002F 47 |
_ | 30 0030 48 | 1 0031 49 | 2 0032 50 | 3 0033 51 | 4 0034 52 | 5 0035 53 | 6 0036 54 | 7 0037 55 | 8 0038 56 | 9 0039 57 | : 003A 58 | ; 003B 59 | < 003C 60 | = 003D 61 | > 003E 62 | ? 003F 63 |
_ | 4@ 0040 64 | A 0041 65 | B 0042 66 | C 0043 67 | D 0044 68 | E 0045 69 | F 0046 70 | G 0047 71 | H 0048 72 | I 0049 73 | J 004A 74 | K 004B 75 | L 004C 76 | M 004D 77 | N 004E 78 | O 004F 79 |
_ | 5P 0050 80 | Q 0051 81 | R 0052 82 | S 0053 83 | T 0054 84 | U 0055 85 | V 0056 86 | W 0057 87 | X 0058 88 | Y 0059 89 | Z 005A 90 | [ 005B 91 | \ 005C 92 | ] 005D 93 | ^ 005E 94 | _ 005F 95 |
_ | 6` 0060 96 | a 0061 97 | b 0062 98 | c 0063 99 | d 0064 100 | e 0065 101 | f 0066 102 | g 0067 103 | h 0068 104 | i 0069 105 | j 006A 106 | k 006B 107 | l 006C 108 | m 006D 109 | n 006E 110 | o 006F 111 |
_ | 7p 0070 112 | q 0071 113 | r 0072 114 | s 0073 115 | t 0074 116 | u 0075 117 | v 0076 118 | w 0077 119 | x 0078 120 | y 0079 121 | z 007A 122 | { 007B 123 | | 007C 124 | } 007D 125 | ~ 007E 126 | DEL 007F 127 |
_ | 8128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 137 | 138 | 139 | 140 | 141 | 142 | 143 |
_ | 9144 | 145 | 146 | 147 | 148 | 149 | 150 | 151 | 152 | 153 | 154 | 155 | 156 | 157 | 158 | 159 |
_ | ANBSP 00A0 160 | ¡ 00A1 161 | ¢ 00A2 162 | £ 00A3 163 | 164 | ¥ 00A5 165 | 166 | § 00A7 167 | ¤ 00A4 168 | ‘ 2018 169 | “ 201C 170 | « 00AB 171 | ← 2190 172 | ↑ 2191 173 | → 2192 174 | ↓ 2193 175 |
_ | B° 00B0 176 | ± 00B1 177 | ² 00B2 178 | ³ 00B3 179 | × 00D7 180 | µ 00B5 181 | ¶ 00B6 182 | · 00B7 183 | ÷ 00F7 184 | ’ 2019 185 | ” 201D 186 | » 00BB 187 | ¼ 00BC 188 | ½ 00BD 189 | ¾ 00BE 190 | ¿ 00BF 191 |
_ | C192 | ̀ 0300 193 | ́ 0301 194 | ̂ 0302 195 | ̃ 0303 196 | ̄ 0304 197 | ̆ 0306 198 | ̇ 0307 199 | ̈ 0308 200 | 201 | ̊ 030A 202 | ̧ 0327 203 | 204 | ̋ 030B 205 | ̨ 0328 206 | ̌ 030C 207 |
_ | D― 2015 208 | ¹ 00B9 209 | ® 00AE 210 | © 00A9 211 | ™ 2122 212 | ♪ 266A 213 | ¬ 00AC 214 | ¦ 00A6 215 | 216 | 217 | 218 | 219 | ⅛ 215B 220 | ⅜ 215C 221 | ⅝ 215D 222 | ⅞ 215E 223 |
_ | EΩ 2126 224 | Æ 00C6 225 | Đ 0110 226 | ª 00AA 227 | Ħ 0126 228 | 229 | IJ 0132 230 | Ŀ 013F 231 | Ł 0141 232 | Ø 00D8 233 | Œ 0152 234 | º 00BA 235 | Þ 00DE 236 | Ŧ 0166 237 | Ŋ 014A 238 | ʼn 0149 239 |
_ | Fĸ 0138 240 | æ 00E6 241 | đ 0111 242 | ð 00F0 243 | ħ 0127 244 | ı 0131 245 | ij 0133 246 | ŀ 0140 247 | ł 0142 248 | ø 00F8 249 | œ 0153 250 | ß 00DF 251 | þ 00FE 252 | ŧ 0167 253 | ŋ 014B 254 | SHY 00AD 255 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F |
出典
- ^ Supplementary Set of ISO/IEC 6937:1992 The high-ASCII half of the character set. (The left-hand side is U.S. ASCII.)
- ISO/IEC_6937のページへのリンク