КОИ-8
- 1 year ago
- 0
- 0
КОИ-8 ( к од о бмена и нформацией, 8 бит), KOI8 — восьмибитовая кодовая страница , совместимая с ASCII . Разработана для кодирования букв кириллических алфавитов . Была широко распространена как основная русская кодировка в Unix -совместимых ОС и в электронной почте , однако ближе к 2010 году , с распространением Юникода , постепенно выходит из употребления.
Существует также семибитовая версия кодировки, не полностью совместимая с ASCII — КОИ-7 . КОИ-7 и КОИ-8 описаны в ныне не действующем ГОСТ 19768-74. Они восходят к двоичной кодировке ДКОИ для ЕС ЭВМ, а та, в свою очередь, основана на кодировке телеграфа .
Разработчики КОИ-8 поместили символы русского алфавита в верхней части кодовой таблицы таким образом, что позиции символов кириллицы соответствуют их фонетическим аналогам в английском алфавите из нижней части таблицы. Это означает, что если в тексте, написанном в КОИ-8, для каждого символа убрать по одному биту слева, то получится относительно читаемый текст, подобный транслиту . Например, слова «Русский Текст» превратятся в «rUSSKIJ tEKST». Из‑за этого символы кириллицы расположены не в алфавитном порядке.
Существует несколько вариантов кодировки КОИ-8 для различных кириллических алфавитов, расширяющих определённые коды (общий диапазон 192—255 с 32 русскими буквами в двух регистрах остаётся неизменным во всех вариантах). Русский алфавит описывается в кодировке KOI8-R , украинский — в KOI8-U , таджикский — в KOI8-T.
В 1990-х годах KOI8-R стал фактически стандартом для кодирования русской кириллицы в UNIX -подобных операционных системах и электронной почте . Автор данной кодировки () Андрей Чернов в начале 1990-х годов работал в компании Демос (сеть Релком ) и непосредственно участвовал в запуске и наладке первого интернет-канала между Россией и западными странами . КОИ-8 стала первой русской стандартизированной кодировкой в интернете.
IETF утвердил несколько RFC по вариантам кодировки KOI-8:
IANA зарегистрировала кодировки в своём списке.
Стандарт предписывает наличие графических символов «рамок» ( псевдографики ), однако, это требование выполняется довольно редко.
В Microsoft Windows KOI8-R присвоен код страницы 20866, KOI8-U — 21866.
Начало таблицы кодировки ( латиница ) полностью соответствует кодировке ASCII .
В приведённых таблицах числа под буквами обозначают шестнадцатеричный код буквы в Юникоде .
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. |
─
2500 |
│
2502 |
┌
250C |
┐
2510 |
└
2514 |
┘
2518 |
├
251C |
┤
2524 |
┬
252C |
┴
2534 |
┼
253C |
▀
2580 |
▄
2584 |
█
2588 |
▌
258C |
▐
2590 |
9. |
░
2591 |
▒
2592 |
▓
2593 |
⌠
2320 |
■
25A0 |
∙
2219 |
√
221A |
≈
2248 |
≤
2264 |
≥
2265 |
A0 |
⌡
2321 |
°
B0 |
²
B2 |
·
B7 |
÷
F7 |
A. |
═
2550 |
║
2551 |
╒
2552 |
ё
451 |
╓
2553 |
╔
2554 |
╕
2555 |
╖
2556 |
╗
2557 |
╘
2558 |
╙
2559 |
╚
255A |
╛
255B |
╜
255C |
╝
255D |
╞
255E |
B. |
╟
255F |
╠
2560 |
╡
2561 |
Ё
401 |
╢
2562 |
╣
2563 |
╤
2564 |
╥
2565 |
╦
2566 |
╧
2567 |
╨
2568 |
╩
2569 |
╪
256A |
╫
256B |
╬
256C |
©
A9 |
C. |
ю
44E |
а
430 |
б
431 |
ц
446 |
д
434 |
е
435 |
ф
444 |
г
433 |
х
445 |
и
438 |
й
439 |
к
43A |
л
43B |
м
43C |
н
43D |
о
43E |
D. |
п
43F |
я
44F |
р
440 |
с
441 |
т
442 |
у
443 |
ж
436 |
в
432 |
ь
44C |
ы
44B |
з
437 |
ш
448 |
э
44D |
щ
449 |
ч
447 |
ъ
44A |
E. |
Ю
42E |
А
410 |
Б
411 |
Ц
426 |
Д
414 |
Е
415 |
Ф
424 |
Г
413 |
Х
425 |
И
418 |
Й
419 |
К
41A |
Л
41B |
М
41C |
Н
41D |
О
41E |
F. |
П
41F |
Я
42F |
Р
420 |
С
421 |
Т
422 |
У
423 |
Ж
416 |
В
412 |
Ь
42C |
Ы
42B |
З
417 |
Ш
428 |
Э
42D |
Щ
429 |
Ч
427 |
Ъ
42A |
Показаны только не совпадающие строки таблиц, поскольку всё остальное совпадает.
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. |
═
2550 |
║
2551 |
╒
2552 |
ё
451 |
є
454 |
╔
2554 |
і
456 |
ї
457 |
╗
2557 |
╘
2558 |
╙
2559 |
╚
255A |
╛
255B |
ґ
491 |
╝
255D |
╞
255E |
B. |
╟
255F |
╠
2560 |
╡
2561 |
Ё
401 |
Є
404 |
╣
2563 |
І
406 |
Ї
407 |
╦
2566 |
╧
2567 |
╨
2568 |
╩
2569 |
╪
256A |
Ґ
490 |
╬
256C |
©
A9 |
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. |
═
2550 |
║
2551 |
╒
2552 |
ё
451 |
є
454 |
╔
2554 |
і
456 |
ї
457 |
╗
2557 |
╘
2558 |
╙
2559 |
╚
255A |
╛
255B |
ґ
491 |
ў
45E |
╞
255E |
B. |
╟
255F |
╠
2560 |
╡
2561 |
Ё
401 |
Є
404 |
╣
2563 |
І
406 |
Ї
407 |
╦
2566 |
╧
2567 |
╨
2568 |
╩
2569 |
╪
256A |
Ґ
490 |
Ў
40E |
©
A9 |
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. |
ғ
493 |
җ
497 |
қ
49B |
ҝ
49D |
ң
4A3 |
ү
4AF |
ұ
4B1 |
ҳ
4B3 |
ҷ
4B7 |
ҹ
4B9 |
һ
4BB |
▀
2580 |
ә
4D9 |
ӣ
4E3 |
ө
4E9 |
ӯ
4EF |
9. |
Ғ
492 |
Җ
496 |
Қ
49A |
Ҝ
49C |
Ң
4A2 |
Ү
4AE |
Ұ
4B0 |
Ҳ
4B2 |
Ҷ
4B6 |
Ҹ
4B8 |
Һ
4BA |
⌡
2321 |
Ә
4D8 |
Ӣ
4E2 |
Ө
4E8 |
Ӯ
4EE |
A. |
A0 |
ђ
452 |
ѓ
453 |
ё
451 |
є
454 |
ѕ
455 |
і
456 |
ї
457 |
ј
458 |
љ
459 |
њ
45A |
ћ
45B |
ќ
45C |
ґ
491 |
ў
45E |
џ
45F |
B. |
№
2116 |
Ђ
402 |
Ѓ
403 |
Ё
401 |
Є
404 |
Ѕ
405 |
І
406 |
Ї
407 |
Ј
408 |
Љ
409 |
Њ
40A |
Ћ
40B |
Ќ
40C |
Ґ
490 |
Ў
40E |
Џ
40F |
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. |
қ
49B |
ғ
493 |
‚
201A |
Ғ
492 |
„
201E |
…
2026 |
†
2020 |
‡
2021 |
‰
2030 |
ҳ
4B3 |
‹
2039 |
Ҳ
4B2 |
ҷ
4B7 |
Ҷ
4B6 |
||
9. |
Қ
49A |
‘
2018 |
’
2019 |
“
201C |
”
201D |
•
2022 |
–
2013 |
—
2014 |
™
2122 |
›
203A |
||||||
A. |
ӯ
4EF |
Ӯ
4EE |
ё
451 |
¤
A4 |
ӣ
4E3 |
¦
A6 |
§
A7 |
«
AB |
¬
AC |
AD |
®
AE |
|||||
B. |
°
B0 |
±
B1 |
²
B2 |
Ё
401 |
Ӣ
4E2 |
¶
B6 |
·
B7 |
№
2116 |
»
BB |
©
A9 |
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. |
Ђ
0402 |
Ѓ
0403 |
¸
00B8 |
ѓ
0453 |
„
201E |
…
2026 |
†
2020 |
§
00A7 |
€
20AC |
¨
00A8 |
Љ
0409 |
‹
2039 |
Њ
040A |
Ќ
040C |
Ћ
040B |
Џ
040F |
9. |
ђ
0452 |
‘
2018 |
’
2019 |
“
201C |
”
201D |
•
2022 |
–
2013 |
—
2014 |
£
00A3 |
·
00B7 |
љ
0459 |
›
203A |
њ
045A |
ќ
045C |
ћ
045B |
џ
045F |
A. |
00A0 |
ѵ
0475 |
ѣ
0463 |
ё
0451 |
є
0454 |
ѕ
0455 |
і
0456 |
ї
0457 |
ј
0458 |
®
00AE |
™
2122 |
«
00AB |
ѳ
0473 |
ґ
0491 |
ў
045E |
´
00B4 |
B. |
°
00B0 |
Ѵ
0474 |
Ѣ
0462 |
Ё
0401 |
Є
0404 |
Ѕ
0405 |
І
0406 |
Ї
0407 |
Ј
0408 |
№
2116 |
¢
00A2 |
»
00BB |
Ѳ
0472 |
Ґ
0490 |
Ў
040E |
©
00A9 |
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. |
00A0 |
ђ
0452 |
ѓ
0453 |
ё
0451 |
є
0454 |
ѕ
0455 |
і
0456 |
ї
0457 |
ј
0458 |
љ
0459 |
њ
045A |
ћ
045B |
ќ
045C |
00AD |
ў
045E |
џ
045F |
B. |
№
2116 |
Ђ
0402 |
Ѓ
0403 |
Ё
0401 |
Є
0404 |
Ѕ
0405 |
І
0406 |
Ї
0407 |
Ј
0408 |
Љ
0409 |
Њ
040A |
Ћ
040B |
Ќ
040C |
¤
00A4 |
Ў
040E |
Џ
040F |
Кодировка KOI8-Unified (KOI8-F) предложена компанией «Fingertip Software» .
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. |
─
2500 |
│
2502 |
┌
250C |
┐
2510 |
└
2514 |
┘
2518 |
├
251C |
┤
2524 |
┬
252C |
┴
2534 |
┼
253C |
▀
2580 |
▄
2584 |
█
2588 |
▌
258C |
▐
2590 |
9. |
░
2591 |
‘
2018 |
’
2019 |
“
201C |
”
201D |
•
2022 |
–
2013 |
—
2014 |
©
00A9 |
™
2122 |
00A0 |
»
00BB |
®
00AE |
«
00AB |
·
00B7 |
¤
00A4 |
A. |
00A0 |
ђ
0452 |
ѓ
0453 |
ё
0451 |
є
0454 |
ѕ
0455 |
і
0456 |
ї
0457 |
ј
0458 |
љ
0459 |
њ
045A |
ћ
045B |
ќ
045C |
ґ
0491 |
ў
045E |
џ
045F |
B. |
№
2116 |
Ђ
0402 |
Ѓ
0403 |
Ё
0401 |
Є
0404 |
Ѕ
0405 |
І
0406 |
Ї
0407 |
Ј
0408 |
Љ
0409 |
Њ
040A |
Ћ
040B |
Ќ
040C |
Ґ
0490 |
Ў
040E |
Џ
040F |
Кодировка KOI8-M представляла собой смесь кодировок KOI8-R и Alt (Альтернативная кодировка CP866 согласно ГОСТ 19768-87).
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. |
░
2591 |
▒
2592 |
▓
2593 |
│
2502 |
┤
2524 |
╡
2561 |
╢
2562 |
╖
2556 |
╕
2555 |
╣
2563 |
║
2551 |
╗
2557 |
╝
255D |
╜
255C |
╛
255B |
┐
2510 |
9. |
└
2514 |
┴
2534 |
┬
252C |
├
251C |
─
2500 |
┼
253C |
╞
255E |
╟
255F |
╚
255A |
╔
2554 |
╩
2569 |
╦
2566 |
╠
2560 |
═
2550 |
╬
256C |
╧
2567 |
A. |
╨
2568 |
╤
2564 |
╥
2565 |
╙
2559 |
╘
2558 |
╒
2552 |
╓
2553 |
╫
256B |
╪
256A |
┘
2518 |
┌
250C |
█
2588 |
▄
2584 |
▌
258C |
▐
2590 |
▀
2580 |
B. |
Ё
0401 |
ё
0451 |
🮣
1FBA3 |
🮢
1FBA2 |
🮠
1FBA0 |
🮡
1FBA1 |
→
2192 |
←
2190 |
↑
2191 |
↓
2193 |
÷
00F7 |
±
00B1 |
№
2116 |
¤
00A4 |
■
25A0 |
00A0 |
В некоторых странах СЭВ были созданы модификации КОИ-8 для национальных вариантов латиницы . Базовая идея была та же самая — при «срезании» восьмого бита текст должен оставаться более или менее понятным.