ISO 8859
- 1 year ago
- 0
- 0
ISO/IEC 8859-1 (также известная как ISO 8859-1 и Latin-1 ) — кодовая страница , предназначенная для западноевропейских языков; она базируется на символьном наборе популярных в прошлом терминалов VT220 . Кодовые позиции 0—31 (0x0—0x1F) и 127—159 (0x7F—0x9F) не определены. По образцу ISO 8859-1 сделаны все остальные кодировки серии ISO 8859 .
ISO-8859-1 — кодировка, зарегистрированная IANA в 1992 г. В отличие от ISO/IEC 8859-1, кодовые позиции 0—31 и 127—159 здесь заполнены управляющими символами (большинство из которых используется весьма редко). В HTML ISO-8859-1 является кодировкой по умолчанию (в XHTML , однако, кодировкой по умолчанию является UTF-8 ).
IANA разрешает использовать следующие варианты названия: ISO_8859-1:1987 , ISO_8859-1 , ISO-8859-1 , iso-ir-100 , sISOLatin1 , latin1 , l1 , IBM819 , CP819 .
В Юникоде первые 256 кодовых позиций совпадают с ISO-8859-1.
В Microsoft Windows для западноевропейских языков используется кодировка Windows-1252 , которая отличается от ISO-8859-1 тем, что позиции 128—159 (0x80—0x9F) здесь заняты разными полезными типографскими символами. Большинство браузеров не различает ISO-8859-1 и Windows-1252 — фактически, и в том, и в другом случае они отображают текст как Windows-1252.
Такая путаница между этими двумя кодировками привела к тому, что многие программы, генерирующие файлы HTML, ошибочно обозначали символы их кодами из Windows−1252 вместо кодов Юникода (исходя из того, что номер символа в ISO-8859-1 равен его номеру в Юникоде): например,
тире
(—) обозначалось
—
вместо правильного
—
,
многоточие
обозначалось
…
вместо правильного
…
и т. д.; из-за распространённости этого явления современные браузеры продолжают показывать, например,
—
как тире, хотя на самом деле
—
— это
управляющий символ
«end of guarded area», применение которого в HTML бессмысленно.
В проекте стандарта HTML 5 предписывается показывать ISO-8859-1 как Windows-1252.
Нижняя часть (0—127) таблиц кодировки не показана, поскольку полностью соответствует обычному ASCII . Числа под буквами обозначают шестнадцатеричный код буквы в Юникоде .
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. |
PAD
80 |
HOP
81 |
BPH
82 |
NBH
83 |
IND
84 |
NEL
85 |
SSA
86 |
ESA
87 |
HTS
88 |
HTJ
89 |
VTS
8A |
PLD
8B |
PLU
8C |
RI
8D |
SS2
8E |
SS3
8F |
9. |
DCS
90 |
PU1
91 |
PU2
92 |
STS
93 |
CCH
94 |
MW
95 |
SPA
96 |
EPA
97 |
SOS
98 |
SGCI
99 |
SCI
9A |
CSI
9B |
ST
9C |
OSC
9D |
PM
9E |
APC
9F |
A. |
A0 |
¡
A1 |
¢
A2 |
£
A3 |
¤
A4 |
¥
A5 |
¦
A6 |
§
A7 |
¨
A8 |
©
A9 |
ª
AA |
«
AB |
¬
AC |
AD |
®
AE |
¯
AF |
B. |
°
B0 |
±
B1 |
²
B2 |
³
B3 |
´
B4 |
µ
B5 |
¶
B6 |
·
B7 |
¸
B8 |
¹
B9 |
º
BA |
»
BB |
¼
BC |
½
BD |
¾
BE |
¿
BF |
C. |
À
C0 |
Á
C1 |
Â
C2 |
Ã
C3 |
Ä
C4 |
Å
C5 |
Æ
C6 |
Ç
C7 |
È
C8 |
É
C9 |
Ê
CA |
Ë
CB |
Ì
CC |
Í
CD |
Î
CE |
Ï
CF |
D. |
Ð
D0 |
Ñ
D1 |
Ò
D2 |
Ó
D3 |
Ô
D4 |
Õ
D5 |
Ö
D6 |
×
D7 |
Ø
D8 |
Ù
D9 |
Ú
DA |
Û
DB |
Ü
DC |
Ý
DD |
Þ
DE |
ß
DF |
E. |
à
E0 |
á
E1 |
â
E2 |
ã
E3 |
ä
E4 |
å
E5 |
æ
E6 |
ç
E7 |
è
E8 |
é
E9 |
ê
EA |
ë
EB |
ì
EC |
í
ED |
î
EE |
ï
EF |
F. |
ð
F0 |
ñ
F1 |
ò
F2 |
ó
F3 |
ô
F4 |
õ
F5 |
ö
F6 |
÷
F7 |
ø
F8 |
ù
F9 |
ú
FA |
û
FB |
ü
FC |
ý
FD |
þ
FE |
ÿ
FF |
Интересно расположение символов × и ÷ посреди букв: первоначально там планировалось разместить лигатуру Œœ , но в конечном итоге было решено, что она не нужна, и освободившиеся два места были заполнены небуквенными символами.
В первоначальной версии этой кодировки отсутствовали символы: € (0x80), ˆ (0x88), ˜ (0x98), Ž (0x8E), ž (0x9E).
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. |
€
20AC |
‚
201A |
ƒ
192 |
„
201E |
…
2026 |
†
2020 |
‡
2021 |
ˆ
2C6 |
‰
2030 |
Š
160 |
‹
2039 |
Œ
152 |
Ž
17D |
|||
9. |
‘
2018 |
’
2019 |
“
201C |
”
201D |
•
2022 |
–
2013 |
—
2014 |
˜
2DC |
™
2122 |
š
161 |
›
203A |
œ
153 |
ž
17E |
Ÿ
178 |
||
A. |
A0 |
¡
A1 |
¢
A2 |
£
A3 |
¤
A4 |
¥
A5 |
¦
A6 |
§
A7 |
¨
A8 |
©
A9 |
ª
AA |
«
AB |
¬
AC |
AD |
®
AE |
¯
AF |
B. |
°
B0 |
±
B1 |
²
B2 |
³
B3 |
´
B4 |
µ
B5 |
¶
B6 |
·
B7 |
¸
B8 |
¹
B9 |
º
BA |
»
BB |
¼
BC |
½
BD |
¾
BE |
¿
BF |
C. |
À
C0 |
Á
C1 |
Â
C2 |
Ã
C3 |
Ä
C4 |
Å
C5 |
Æ
C6 |
Ç
C7 |
È
C8 |
É
C9 |
Ê
CA |
Ë
CB |
Ì
CC |
Í
CD |
Î
CE |
Ï
CF |
D. |
Ð
D0 |
Ñ
D1 |
Ò
D2 |
Ó
D3 |
Ô
D4 |
Õ
D5 |
Ö
D6 |
×
D7 |
Ø
D8 |
Ù
D9 |
Ú
DA |
Û
DB |
Ü
DC |
Ý
DD |
Þ
DE |
ß
DF |
E. |
à
E0 |
á
E1 |
â
E2 |
ã
E3 |
ä
E4 |
å
E5 |
æ
E6 |
ç
E7 |
è
E8 |
é
E9 |
ê
EA |
ë
EB |
ì
EC |
í
ED |
î
EE |
ï
EF |
F. |
ð
F0 |
ñ
F1 |
ò
F2 |
ó
F3 |
ô
F4 |
õ
F5 |
ö
F6 |
÷
F7 |
ø
F8 |
ù
F9 |
ú
FA |
û
FB |
ü
FC |
ý
FD |
þ
FE |
ÿ
FF |