Interested Article - ISO 8859-1

ISO/IEC 8859-1 (также известная как ISO 8859-1 и Latin-1 ) — кодовая страница , предназначенная для западноевропейских языков; она базируется на символьном наборе популярных в прошлом терминалов VT220 . Кодовые позиции 0—31 (0x0—0x1F) и 127—159 (0x7F—0x9F) не определены. По образцу ISO 8859-1 сделаны все остальные кодировки серии ISO 8859 .

ISO-8859-1 — кодировка, зарегистрированная IANA в 1992 г. В отличие от ISO/IEC 8859-1, кодовые позиции 0—31 и 127—159 здесь заполнены управляющими символами (большинство из которых используется весьма редко). В HTML ISO-8859-1 является кодировкой по умолчанию (в XHTML , однако, кодировкой по умолчанию является UTF-8 ).

IANA разрешает использовать следующие варианты названия: ISO_8859-1:1987 , ISO_8859-1 , ISO-8859-1 , iso-ir-100 , sISOLatin1 , latin1 , l1 , IBM819 , CP819 .

В Юникоде первые 256 кодовых позиций совпадают с ISO-8859-1.

В Microsoft Windows для западноевропейских языков используется кодировка Windows-1252 , которая отличается от ISO-8859-1 тем, что позиции 128—159 (0x80—0x9F) здесь заняты разными полезными типографскими символами. Большинство браузеров не различает ISO-8859-1 и Windows-1252 — фактически, и в том, и в другом случае они отображают текст как Windows-1252.

Такая путаница между этими двумя кодировками привела к тому, что многие программы, генерирующие файлы HTML, ошибочно обозначали символы их кодами из Windows−1252 вместо кодов Юникода (исходя из того, что номер символа в ISO-8859-1 равен его номеру в Юникоде): например, тире (—) обозначалось — вместо правильного — , многоточие обозначалось … вместо правильного … и т. д.; из-за распространённости этого явления современные браузеры продолжают показывать, например, — как тире, хотя на самом деле — — это управляющий символ «end of guarded area», применение которого в HTML бессмысленно.

В проекте стандарта HTML 5 предписывается показывать ISO-8859-1 как Windows-1252.

Таблицы

Нижняя часть (0—127) таблиц кодировки не показана, поскольку полностью соответствует обычному ASCII . Числа под буквами обозначают шестнадцатеричный код буквы в Юникоде .

ISO-8859-1

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

8.
PAD
80
HOP
81
BPH
82
NBH
83
IND
84
NEL
85
SSA
86
ESA
87
HTS
88
HTJ
89
VTS
8A
PLD
8B
PLU
8C
RI
8D
SS2
8E
SS3
8F

9.
DCS
90
PU1
91
PU2
92
STS
93
CCH
94
MW
95
SPA
96
EPA
97
SOS
98
SGCI
99
SCI
9A
CSI
9B
ST
9C
OSC
9D
PM
9E
APC
9F

A.

A0
¡
A1
¢
A2
£
A3
¤
A4
¥
A5
¦
A6
§
A7
¨
A8
©
A9
ª
AA
«
AB
¬
AC
­
AD
®
AE
¯
AF

B.
°
B0
±
B1
²
B2
³
B3
´
B4
µ
B5

B6
·
B7
¸
B8
¹
B9
º
BA
»
BB
¼
BC
½
BD
¾
BE
¿
BF

C.
À
C0
Á
C1
Â
C2
Ã
C3
Ä
C4
Å
C5
Æ
C6
Ç
C7
È
C8
É
C9
Ê
CA
Ë
CB
Ì
CC
Í
CD
Î
CE
Ï
CF

D.
Ð
D0
Ñ
D1
Ò
D2
Ó
D3
Ô
D4
Õ
D5
Ö
D6
×
D7
Ø
D8
Ù
D9
Ú
DA
Û
DB
Ü
DC
Ý
DD
Þ
DE
ß
DF

E.
à
E0
á
E1
â
E2
ã
E3
ä
E4
å
E5
æ
E6
ç
E7
è
E8
é
E9
ê
EA
ë
EB
ì
EC
í
ED
î
EE
ï
EF

F.
ð
F0
ñ
F1
ò
F2
ó
F3
ô
F4
õ
F5
ö
F6
÷
F7
ø
F8
ù
F9
ú
FA
û
FB
ü
FC
ý
FD
þ
FE
ÿ
FF

Интересно расположение символов × и ÷ посреди букв: первоначально там планировалось разместить лигатуру Œœ , но в конечном итоге было решено, что она не нужна, и освободившиеся два места были заполнены небуквенными символами.

Windows−1252

В первоначальной версии этой кодировки отсутствовали символы: (0x80), ˆ (0x88), ˜ (0x98), Ž (0x8E), ž (0x9E).

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

8.

20AC

201A
ƒ
192

201E

2026

2020

2021
ˆ
2C6

2030
Š
160

2039
Œ
152
Ž
17D

9.

2018

2019

201C

201D

2022

2013

2014
˜
2DC

2122
š
161

203A
œ
153
ž
17E
Ÿ
178

A.

A0
¡
A1
¢
A2
£
A3
¤
A4
¥
A5
¦
A6
§
A7
¨
A8
©
A9
ª
AA
«
AB
¬
AC
­
AD
®
AE
¯
AF

B.
°
B0
±
B1
²
B2
³
B3
´
B4
µ
B5

B6
·
B7
¸
B8
¹
B9
º
BA
»
BB
¼
BC
½
BD
¾
BE
¿
BF

C.
À
C0
Á
C1
Â
C2
Ã
C3
Ä
C4
Å
C5
Æ
C6
Ç
C7
È
C8
É
C9
Ê
CA
Ë
CB
Ì
CC
Í
CD
Î
CE
Ï
CF

D.
Ð
D0
Ñ
D1
Ò
D2
Ó
D3
Ô
D4
Õ
D5
Ö
D6
×
D7
Ø
D8
Ù
D9
Ú
DA
Û
DB
Ü
DC
Ý
DD
Þ
DE
ß
DF

E.
à
E0
á
E1
â
E2
ã
E3
ä
E4
å
E5
æ
E6
ç
E7
è
E8
é
E9
ê
EA
ë
EB
ì
EC
í
ED
î
EE
ï
EF

F.
ð
F0
ñ
F1
ò
F2
ó
F3
ô
F4
õ
F5
ö
F6
÷
F7
ø
F8
ù
F9
ú
FA
û
FB
ü
FC
ý
FD
þ
FE
ÿ
FF

Примечания

  1. . Дата обращения: 15 января 2010. 6 января 2010 года.
  2. . Дата обращения: 25 июня 2010. 19 июня 2010 года.

Ссылки

Источник —

Same as ISO 8859-1