다국적 문자 집합
보이기
MIME / IANA | DEC-MCS |
---|---|
다른 이름 | IBM1100, CP1100, WE8DEC, csDECMCS, dec |
언어 | 영어 등 |
상위 인코딩 | US-ASCII |
다음 인코딩 | ISO 8859-1, LICS, BraSCII, 코드 인코딩(Cork encoding) |
다국적 문자 집합(Multinational Character Set, DMCS, MCS)은 1983년 디지털 이큅먼트 코퍼레이션(DEC)이 대중적인 VT220 단말기에 사용할 목적으로 만든 문자 인코딩이다. 이것은 강세 문자, 통화 기호, 그 밖에 7비트 ASCII에 없는 상형 문자들을 추가한 ASCII의 8비트 확장이었다. 단지 VT220 NRCS(National Replacement Character Set)을 위해 구현된 코드 페이지들 가운데 하나이다.[1][2] MCS는 1992년 이후로 IBM 코드 페이지 1100(다국적 에뮬레이션)으로 등록되어 있다.[3] 연관된 정렬에 의거하여 오라클은 WE8DEC, N8DEC, DK8DEC, S8DEC, SF8DEC로 부른다.[4][5]
이러한 확장 아스키 집합이 일반적이었지만(NRCS가 12개 이상의 유럽 언어를 위한 집합을 제공함) 1985년에 MCS는 ECMA-94[6], 1987년의 ISO 8859-1[7]의 조상으로 구별하고 있다.
ECMA-94, ISO 8859-1, 그리고 유니코드의 첫 256 코드 지점들을 갖춘 MCS의 코드 차트는 차이점 보다 유사점이 더 많다. 사용하지 않는 코드 지점을 포함하여, ISO 8859-1와의 차이는 다음과 같다:
MCS 코드 지점 | 유니코드 매핑 | 문자 |
---|---|---|
0xA8 | U+00A4 | ¤ |
0xD7 | U+0152 | Œ |
0xDD | U+0178 | Ÿ |
0xF7 | U+0153 | œ |
0xFD | U+00FF | ÿ |
코드 페이지 레이아웃
[편집]문자 숫자 구두점 기호 기타 미정의
—0 | —1 | —2 | —3 | —4 | —5 | —6 | —7 | —8 | —9 | —A | —B | —C | —D | —E | —F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0− |
NUL 0000 0 |
SOH 0001 1 |
STX 0002 2 |
ETX 0003 3 |
EOT 0004 4 |
ENQ 0005 5 |
ACK 0006 6 |
BEL 0007 7 |
BS 0008 8 |
HT 0009 9 |
LF 000A 10 |
VT 000B 11 |
FF 000C 12 |
CR 000D 13 |
SO 000E 14 |
SI 000F 15 |
1− |
DLE 0010 16 |
DC1 0011 17 |
DC2 0012 18 |
DC3 0013 19 |
DC4 0014 20 |
NAK 0015 21 |
SYN 0016 22 |
ETB 0017 23 |
CAN 0018 24 |
EM 0019 25 |
SUB 001A 26 |
ESC 001B 27 |
FS 001C 28 |
GS 001D 29 |
RS 001E 30 |
US 001F 31 |
2− |
SP 0020 32 |
! 0021 33 |
" 0022 34 |
# 0023 35 |
$ 0024 36 |
% 0025 37 |
& 0026 38 |
' 0027 39 |
( 0028 40 |
) 0029 41 |
* 002A 42 |
+ 002B 43 |
, 002C 44 |
- 002D 45 |
. 002E 46 |
/ 002F 47 |
3− |
0 0030 48 |
1 0031 49 |
2 0032 50 |
3 0033 51 |
4 0034 52 |
5 0035 53 |
6 0036 54 |
7 0037 55 |
8 0038 56 |
9 0039 57 |
: 003A 58 |
; 003B 59 |
< 003C 60 |
= 003D 61 |
> 003E 62 |
? 003F 63 |
4− |
@ 0040 64 |
A 0041 65 |
B 0042 66 |
C 0043 67 |
D 0044 68 |
E 0045 69 |
F 0046 70 |
G 0047 71 |
H 0048 72 |
I 0049 73 |
J 004A 74 |
K 004B 75 |
L 004C 76 |
M 004D 77 |
N 004E 78 |
O 004F 79 |
5− |
P 0050 80 |
Q 0051 81 |
R 0052 82 |
S 0053 83 |
T 0054 84 |
U 0055 85 |
V 0056 86 |
W 0057 87 |
X 0058 88 |
Y 0059 89 |
Z 005A 90 |
[ 005B 91 |
\ 005C 92 |
] 005D 93 |
^ 005E 94 |
_ 005F 95 |
6− |
` 0060 96 |
a 0061 97 |
b 0062 98 |
c 0063 99 |
d 0064 100 |
e 0065 101 |
f 0066 102 |
g 0067 103 |
h 0068 104 |
i 0069 105 |
j 006A 106 |
k 006B 107 |
l 006C 108 |
m 006D 109 |
n 006E 110 |
o 006F 111 |
7− |
p 0070 112 |
q 0071 113 |
r 0072 114 |
s 0073 115 |
t 0074 116 |
u 0075 117 |
v 0076 118 |
w 0077 119 |
x 0078 120 |
y 0079 121 |
z 007A 122 |
{ 007B 123 |
| 007C 124 |
} 007D 125 |
~ 007E 126 |
DEL 007F 127 |
8− |
IND 0084 132 |
NEL 0085 133 |
SSA 0086 134 |
ESA 0087 135 |
HTS 0088 136 |
HTJ 0089 137 |
VTS 008A 138 |
PLD 008B 139 |
PLU 008C 140 |
RI 008D 141 |
SS2 008E 142 |
SS3 008F 143 | ||||
9− |
DCS 0090 144 |
PU1 0091 145 |
PU2 0092 146 |
STS 0093 147 |
CCH 0094 148 |
MW 0095 149 |
SPA 0096 150 |
EPA 0097 151 |
CSI 009B 155 |
ST 009C 156 |
OSC 009D 157 |
PM 009E 158 |
APC 009F 159 | |||
A− |
en:¡ 00A1 161 |
¢ 00A2 162 |
£ 00A3 163 |
¥ 00A5 165 |
§ 00A7 167 |
¤ 00A4 168 |
en:ⓒ 00A9 169 |
en:ª 00AA 170 |
« 00AB 171 |
|||||||
B− |
° 00B0 176 |
± 00B1 177 |
en:² 00B2 178 |
³ 00B3 179 |
μ 00B5 181 |
¶ 00B6 182 |
· 00B7 183 |
en:¹ 00B9 185 |
en:º 00BA 186 |
» 00BB 187 |
¼ 00BC 188 |
1/2 00BD 189 |
en:¿ 00BF 191 | |||
C− |
A 00C0 192 |
A 00C1 193 |
A 00C2 194 |
A 00C3 195 |
A 00C4 196 |
A 00C5 197 |
Æ 00C6 198 |
C 00C7 199 |
E 00C8 200 |
E 00C9 201 |
E 00CA 202 |
E 00CB 203 |
en:I 00CC 204 |
I 00CD 205 |
en:I 00CE 206 |
I 00CF 207 |
D− |
N 00D1 209 |
en:O 00D2 210 |
O 00D3 211 |
Ô 00D4 212 |
O 00D5 213 |
O 00D6 214 |
Œ 0152 215 |
Ø 00D8 216 |
Ù 00D9 217 |
en:U 00DA 218 |
en:U 00DB 219 |
U 00DC 220 |
Ÿ 0178 221 |
ß 00DF 223 | ||
E− |
A 00E0 224 |
A 00E1 225 |
A 00E2 226 |
A 00E3 227 |
A 00E4 228 |
A 00E5 229 |
Æ 00E6 230 |
C 00E7 231 |
E 00E8 232 |
E 00E9 233 |
E 00EA 234 |
E 00EB 235 |
en:i 00EC 236 |
I 00ED 237 |
en:i 00EE 238 |
I 00EF 239 |
F− |
N 00F1 241 |
en:o 00F2 242 |
O 00F3 243 |
ô 00F4 244 |
O 00F5 245 |
O 00F6 246 |
Œ 0153 247 |
Ø 00F8 248 |
ù 00F9 249 |
en:u 00FA 250 |
en:u 00FB 251 |
U 00FC 252 |
ÿ 00FF 253 |
|||
—0 | —1 | —2 | —3 | —4 | —5 | —6 | —7 | —8 | —9 | —A | —B | —C | —D | —E | —F |
각주
[편집]- ↑ “VT220 Programmer Reference Manual” 2판. Digital Equipment Corporation (DEC). 1984 [1983].
- ↑ “TinyTERM Emulator — National Replacement Character Set (NRCS)”. Century Software. 2016년 12월 1일에 원본 문서에서 보존된 문서. 2016년 12월 1일에 확인함. [sic]
- ↑ 가 나 “SBCS code page information - CPGID: 01100 / Name: Multinational Emulation”. 《IBM Software: Globalization: Coded character sets and related resources: Code pages by CPGID: Code page identifiers》. 1. IBM. 1992년 10월 1일. 2016년 12월 3일에 원본 문서에서 보존된 문서. 2016년 12월 2일에 확인함. [1] [2][깨진 링크(과거 내용 찾기)] [3][깨진 링크(과거 내용 찾기)]
- ↑ Baird, Cathy; Chiba, Dan; Chu, Winson; Fan, Jessica; Ho, Claire; Law, Simon; Lee, Geoff; Linsley, Peter; Matsuda, Keni; Oscroft, Tamzin; Takeda, Shige; Tanaka, Linus; Tozawa, Makoto; Trute, Barry; Tsujimoto, Mayumi; Wu, Ying; Yau, Michael; Yu, Tim; Wang, Chao; Wong, Simon; Zhang, Weiran; Zheng, Lei; Zhu, Yan; Moore, Valarie (2002) [1996]. 〈Appendix A: Locale Data〉. 《Oracle9i Database Globalization Support Guide》 (PDF) Release 2 (9.2)판. Oracle Corporation. Oracle A96529-01. 2017년 2월 14일에 원본 문서 (PDF)에서 보존된 문서. 2017년 2월 14일에 확인함.
- ↑ “Oracle characterset descriptions for 9.2”. Daylight Chemical Information Systems. 2017. 2017년 2월 14일에 원본 문서에서 보존된 문서. 2017년 2월 14일에 확인함.
- ↑ 《Standard ECMA-94: 8-bit Single-Byte Coded Graphic Character Set》 (PDF) 1판. European Computer Manufacturers Association (ECMA). March 1985 [1984-12-14]. 2016년 12월 1일에 원본 문서 (PDF)에서 보존된 문서. 2016년 12월 1일에 확인함.
[…] Since 1982 the urgency of the need for an 8-bit single-byte coded character set was recognized in ECMA as well as in ANSI/X3L2 and numerous working papers were exchanged between the two groups. In February 1984 ECMA TC1 submitted to ISO/TC97/SC2 a proposal for such a coded character set. At its meeting of April 1984 SC decided to submit to TC97 a proposal for a new item of work for this topic. Technical discussions during and after this meeting led TC1 to adopt the coding scheme proposed by X3L2. Part 1 of Draft International Standard DTS 8859 is based on this joint ANSI/ECMA proposal. […] Adopted as an ECMA Standard by the General Assembly of Dec. 13–14, 1984. […]
- ↑ Czyborra, Roman (1998). “ISO 8859-1 and MCS”. 《ISO 8859 Alphabet Soup》. 2016년 12월 1일에 원본 문서에서 보존된 문서. 2016년 12월 1일에 확인함. [4] [5]
- ↑ “VT220 Programmer Reference Manual”. Digital Equipment Corporation (DEC). Table 2-3: DEC Multinational Character Set (C1 and GR Codes). 2016년 8월 17일에 원본 문서에서 보존된 문서. 2016년 12월 2일에 확인함.
- ↑ 《VAX/VMS User's Manual》. Digital Equipment Corporation (DEC). April 1986. AI-Y517A-TE.
- ↑ DEC (February 1992) [November 1989]. 〈Chapter 2: Character Encoding - DEC Supplemental Graphic Character Set〉. 《VT420 Programmer Reference Manual》 (PDF) 2판. Digital Equipment Corporation. 24–25쪽. EK–VT420–RM.002. 2017년 1월 29일에 원본 문서 (PDF)에서 보존된 문서. 2017년 1월 29일에 확인함.
- ↑ Flohr, Guido (2016) [2006]. “Locale::RecodeData::DEC_MCS - Conversion routines for DEC_MCS”. 《CPAN libintl-perl》. 1.0. 2017년 1월 14일에 원본 문서에서 보존된 문서. 2017년 1월 14일에 확인함.
- ↑ Kostis, Kosta. “DEC Multinational Character Set (DEC MCS)”. 1.20. 2017년 1월 16일에 원본 문서에서 보존된 문서. 2017년 1월 16일에 확인함.
- ↑ Cowan, John (1999년 7월 7일). “DEC Multinational Character Set (1987) to Unicode”. 0.1. Unicode, Inc. 2017년 2월 18일에 원본 문서에서 보존된 문서. 2017년 2월 18일에 확인함.