Windows-1252またはコードページ1252 (Code Page 1252, CP1252) は、Microsoft Windowsの英語版および他の数種の西欧言語版で従来のコンポーネントが既定で使用するラテン文字文字コードである。

概要

編集

Windowsコードページのグループの一種である。LaTeXパッケージではansinewと呼ばれる。この文字コードはISO 8859-1上位集合だが、0x80から0x9Fの範囲に制御文字ではなく図形文字を収録していることにより、IANAISO-8859-1とは異なる。Windowsではコードページ番号1252およびIANA登録名 "windows-1252" という名前で知られる。このコードページはISO 8859-15に含まれる印字可能文字もすべて収録している (ただしいくつかは異なるコードポイントにマップされている)。

ISO 8859-1と比較して追加された文字としては、各種の欧文記号の他、フランス語Œフィンランド語などで用いるŠŽユーロ記号、ISO 8859-1では小文字しか収録されていなかったŸがある。これらの文字は ISO/IEC 8859-15 でも定義されている。

多くのウェブブラウザがMIME charset ISO-8859-1をWindows-1252として扱い (ISO-8859-1の余分な制御コードはどのみちHTMLでは禁止されている)、そのため文字コードはISO-8859-1と宣言しているWebページにしばしばWindows-1252の符号が見られる。これは電子メールクライアントでも同様である。しかしこのような文字の使用には、とりわけ受信側がLinuxやMac OSなど、Windows以外のシステムであるときに、困難が伴う可能性がある。他のシステムは0x80から0x9Fの範囲に意味のある文字を割り当てていないかもしれないし、異なる独自拡張の文字を割り当てているかもしれない。

Windows-1252のような、Windowsで使われるコードページを参照するために「ANSIコードページ」という用語が使われることもある。Windows-1252はMicrosoft Windows用語ではANSIコードページとみなされているが、このコードページがANSIで標準化されたことはない。この名前は (後に変更されてISO-8859-1となった) 初期のANSI草案から取られた。このように、Windows-1252は非標準のコードページであり歴史的理由からANSIコードページと呼ばれている[1]

Unicode (UTF-8形式であることが多い) がWindows-1252などの8ビット「コードページ」に代わって徐々に使われるようになりつつある。

コード表

編集

以下の表にWindows-1252を示す。下線は制御文字、および制御文字と図形文字の中間的性質をもつ文字を表す。ISO-8859-1からの変更点は背景色を変え、十進表記を「太字・イタリック」にすることで強調している。

Windows-1252 (CP1252)
x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF
0x NUL
0
SOH
1
STX
2
ETX
3
EOT
4
ENQ
5
ACK
6
BEL
7
BS
8
TAB
9
LF
10
VT
11
FF
12
CR
13
SO
14
SI
15
1x DLE
16
DC1
17
DC2
18
DC3
19
DC4
20
NAK
21
SYN
22
ETB
23
CAN
24
EM
25
SUB
26
ESC
27
FS
28
GS
29
RS
30
US
31
2x SP
32
!
33
"
34
#
35
$
36
%
37
&
38
'
39
(
40
)
41
*
42
+
43
,
44
-
45
.
46
/
47
3x 0
48
1
49
2
50
3
51
4
52
5
53
6
54
7
55
8
56
9
57
:
58
;
59
<
60
=
61
>
62
?
63
4x @
64
A
65
B
66
C
67
D
68
E
69
F
70
G
71
H
72
I
73
J
74
K
75
L
76
M
77
N
78
O
79
5x P
80
Q
81
R
82
S
83
T
84
U
85
V
86
W
87
X
88
Y
89
Z
90
[
91
\
92
]
93
^
94
_
95
6x `
96
a
97
b
98
c
99
d
100
e
101
f
102
g
103
h
104
i
105
j
106
k
107
l
108
m
109
n
110
o
111
7x p
112
q
113
r
114
s
115
t
116
u
117
v
118
w
119
x
120
y
121
z
122
{
123
|
124
}
125
~
126
DEL
127
8x
128
 
129

130
ƒ
131

132

133

134

135
ˆ
136

137
Š
138

139
Œ
140
 
141
Ž
142
 
143
9x  
144

145

146

147

148

149

150

151
˜
152

153
š
154

155
œ
156
 
157
ž
158
Ÿ
159
Ax NBSP
160
¡
161
¢
162
£
163
¤
164
¥
165
¦
166
§
167
¨
168
©
169
ª
170
«
171
¬
172
SHY
173
®
174
¯
175
Bx °
176
±
177
²
178
³
179
´
180
µ
181

182
·
183
¸
184
¹
185
º
186
»
187
¼
188
½
189
¾
190
¿
191
Cx À
192
Á
193
Â
194
Ã
195
Ä
196
Å
197
Æ
198
Ç
199
È
200
É
201
Ê
202
Ë
203
Ì
204
Í
205
Î
206
Ï
207
Dx Ð
208
Ñ
209
Ò
210
Ó
211
Ô
212
Õ
213
Ö
214
×
215
Ø
216
Ù
217
Ú
218
Û
219
Ü
220
Ý
221
Þ
222
ß
223
Ex à
224
á
225
â
226
ã
227
ä
228
å
229
æ
230
ç
231
è
232
é
233
ê
234
ë
235
ì
236
í
237
î
238
ï
239
Fx ð
240
ñ
241
ò
242
ó
243
ô
244
õ
245
ö
246
÷
247
ø
248
ù
249
ú
250
û
251
ü
252
ý
253
þ
254
ÿ
255

マイクロソフトユニコードコンソーシアムのWebサイト上の情報によれば、符号位置 81, 8D, 8F, 90, および 9D は未使用である。しかし、コードページからUnicodeへ変換するためのWindows API呼び出しはこれらを対応するC1制御記号にマップしている。符号位置 80 のユーロ文字はキャロン (ハーチェク) 付きの S や Z と同様、このコードページの以前のバージョンでは存在していなかった。

英語版のWindowsでは、Windows-1252の文字はAltキーを押下したままゼロに続けて文字の3桁10進符号をテンキーで入力することにより挿入できる (ゼロを省略する点以外同様の方法で、古いコードページ437の文字も入力できる)。

脚注

編集

関連項目

編集

外部リンク

編集