Interested Article - КОИ-8

КОИ-8 ( к од о бмена и нформацией, 8 бит), KOI8 — восьмибитовая кодовая страница , совместимая с ASCII . Разработана для кодирования букв кириллических алфавитов . Была широко распространена как основная русская кодировка в Unix -совместимых ОС и в электронной почте , однако ближе к 2010 году , с распространением Юникода , постепенно выходит из употребления.

Существует также семибитовая версия кодировки, не полностью совместимая с ASCII — КОИ-7 . КОИ-7 и КОИ-8 описаны в ныне не действующем ГОСТ 19768-74. Они восходят к двоичной кодировке ДКОИ для ЕС ЭВМ, а та, в свою очередь, основана на кодировке телеграфа .

Разработчики КОИ-8 поместили символы русского алфавита в верхней части кодовой таблицы таким образом, что позиции символов кириллицы соответствуют их фонетическим аналогам в английском алфавите из нижней части таблицы. Это означает, что если в тексте, написанном в КОИ-8, для каждого символа убрать по одному биту слева, то получится относительно читаемый текст, подобный транслиту . Например, слова «Русский Текст» превратятся в «rUSSKIJ tEKST». Из‑за этого символы кириллицы расположены не в алфавитном порядке.

Существует несколько вариантов кодировки КОИ-8 для различных кириллических алфавитов, расширяющих определённые коды (общий диапазон 192—255 с 32 русскими буквами в двух регистрах остаётся неизменным во всех вариантах). Русский алфавит описывается в кодировке KOI8-R , украинский — в KOI8-U , таджикский — в KOI8-T.

В 1990-х годах KOI8-R стал фактически стандартом для кодирования русской кириллицы в UNIX -подобных операционных системах и электронной почте . Автор данной кодировки () Андрей Чернов в начале 1990-х годов работал в компании Демос (сеть Релком ) и непосредственно участвовал в запуске и наладке первого интернет-канала между Россией и западными странами . КОИ-8 стала первой русской стандартизированной кодировкой в интернете.

IETF утвердил несколько RFC по вариантам кодировки KOI-8:

  • — KOI8-R (буквы русского алфавита);
  • — KOI8-U (буквы украинского алфавита);
  • — ISO-IR-111 (с ошибкой в определении основного диапазона).

IANA зарегистрировала кодировки в своём списке.

Стандарт предписывает наличие графических символов «рамок» ( псевдографики ), однако, это требование выполняется довольно редко.

В Microsoft Windows KOI8-R присвоен код страницы 20866, KOI8-U — 21866.

Начало таблицы кодировки ( латиница ) полностью соответствует кодировке ASCII .

В приведённых таблицах числа под буквами обозначают шестнадцатеричный код буквы в Юникоде .

Кодировка KOI8-R (русская)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

8.

2500

2502

250C

2510

2514

2518

251C

2524

252C

2534

253C

2580

2584

2588

258C

2590

9.

2591

2592

2593

2320

25A0

2219

221A

2248

2264

2265

A0

2321
°
B0
²
B2
·
B7
÷
F7

A.

2550

2551

2552
ё
451

2553

2554

2555

2556

2557

2558

2559

255A

255B

255C

255D

255E

B.

255F

2560

2561
Ё
401

2562

2563

2564

2565

2566

2567

2568

2569

256A

256B

256C
©
A9

C.
ю
44E
а
430
б
431
ц
446
д
434
е
435
ф
444
г
433
х
445
и
438
й
439
к
43A
л
43B
м
43C
н
43D
о
43E

D.
п
43F
я
44F
р
440
с
441
т
442
у
443
ж
436
в
432
ь
44C
ы
44B
з
437
ш
448
э
44D
щ
449
ч
447
ъ
44A

E.
Ю
42E
А
410
Б
411
Ц
426
Д
414
Е
415
Ф
424
Г
413
Х
425
И
418
Й
419
К
41A
Л
41B
М
41C
Н
41D
О
41E

F.
П
41F
Я
42F
Р
420
С
421
Т
422
У
423
Ж
416
В
412
Ь
42C
Ы
42B
З
417
Ш
428
Э
42D
Щ
429
Ч
427
Ъ
42A

Другие варианты

Показаны только не совпадающие строки таблиц, поскольку всё остальное совпадает.

Кодировка KOI8-U (русско-украинская)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

A.

2550

2551

2552
ё
451
є
454

2554
і
456
ї
457

2557

2558

2559

255A

255B
ґ
491

255D

255E

B.

255F

2560

2561
Ё
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256A
Ґ
490

256C
©
A9

Кодировка KOI8-RU (русско-белорусско-украинская)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

A.

2550

2551

2552
ё
451
є
454

2554
і
456
ї
457

2557

2558

2559

255A

255B
ґ
491
ў
45E

255E

B.

255F

2560

2561
Ё
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256A
Ґ
490
Ў
40E
©
A9

Кодировка KOI8-C (Центральная Азия)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. ғ
493
җ
497
қ
49B
ҝ
49D
ң
4A3
ү
4AF
ұ
4B1
ҳ
4B3
ҷ
4B7
ҹ
4B9
һ
4BB

2580
ә
4D9
ӣ
4E3
ө
4E9
ӯ
4EF
9. Ғ
492
Җ
496
Қ
49A
Ҝ
49C
Ң
4A2
Ү
4AE
Ұ
4B0
Ҳ
4B2
Ҷ
4B6
Ҹ
4B8
Һ
4BA

2321
Ә
4D8
Ӣ
4E2
Ө
4E8
Ӯ
4EE
A.
A0
ђ
452
ѓ
453
ё
451
є
454
ѕ
455
і
456
ї
457
ј
458
љ
459
њ
45A
ћ
45B
ќ
45C
ґ
491
ў
45E
џ
45F
B.
2116
Ђ
402
Ѓ
403
Ё
401
Є
404
Ѕ
405
І
406
Ї
407
Ј
408
Љ
409
Њ
40A
Ћ
40B
Ќ
40C
Ґ
490
Ў
40E
Џ
40F

Кодировка KOI8-T (таджикская)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. қ
49B
ғ
493

201A
Ғ
492

201E

2026

2020

2021

2030
ҳ
4B3

2039
Ҳ
4B2
ҷ
4B7
Ҷ
4B6
9. Қ
49A

2018

2019

201C

201D

2022

2013

2014

2122

203A
A. ӯ
4EF
Ӯ
4EE
ё
451
¤
A4
ӣ
4E3
¦
A6
§
A7
«
AB
¬
AC

AD
®
AE
B. °
B0
±
B1
²
B2
Ё
401
Ӣ
4E2

B6
·
B7

2116
»
BB
©
A9

Кодировка KOI8-O, KOI8-S (славянская, старая орфография)

0407
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

8.
Ђ
0402
Ѓ
0403
¸
00B8
ѓ
0453

201E

2026

2020
§
00A7

20AC
¨
00A8
Љ
0409

2039
Њ
040A
Ќ
040C
Ћ
040B
Џ
040F

9.
ђ
0452

2018

2019

201C

201D

2022

2013

2014
£
00A3
·
00B7
љ
0459

203A
њ
045A
ќ
045C
ћ
045B
џ
045F

A.

00A0
ѵ
0475
ѣ
0463
ё
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
®
00AE

2122
«
00AB
ѳ
0473
ґ
0491
ў
045E
´
00B4

B.
°
00B0
Ѵ
0474
Ѣ
0462
Ё
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408

2116
¢
00A2
»
00BB
Ѳ
0472
Ґ
0490
Ў
040E
©
00A9

Кодировка ISO-IR-111, KOI8-E

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

A.

00A0
ђ
0452
ѓ
0453
ё
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A
ћ
045B
ќ
045C
­
00AD
ў
045E
џ
045F

B.

2116
Ђ
0402
Ѓ
0403
Ё
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A
Ћ
040B
Ќ
040C
¤
00A4
Ў
040E
Џ
040F

Кодировка KOI8-Unified, KOI8-F

Кодировка KOI8-Unified (KOI8-F) предложена компанией «Fingertip Software» .

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

8.

2500

2502

250C

2510

2514

2518

251C

2524

252C

2534

253C

2580

2584

2588

258C

2590

9.

2591

2018

2019

201C

201D

2022

2013

2014
©
00A9

2122

00A0
»
00BB
®
00AE
«
00AB
·
00B7
¤
00A4

A.

00A0
ђ
0452
ѓ
0453
ё
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A
ћ
045B
ќ
045C
ґ
0491
ў
045E
џ
045F

B.

2116
Ђ
0402
Ѓ
0403
Ё
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A
Ћ
040B
Ќ
040C
Ґ
0490
Ў
040E
Џ
040F

Кодировка KOI8-M

Кодировка KOI8-M представляла собой смесь кодировок KOI8-R и Alt (Альтернативная кодировка CP866 согласно ГОСТ 19768-87).

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

8.

2591

2592

2593

2502

2524

2561

2562

2556

2555

2563

2551

2557

255D

255C

255B

2510

9.

2514

2534

252C

251C

2500

253C

255E

255F

255A

2554

2569

2566

2560

2550

256C

2567

A.

2568

2564

2565

2559

2558

2552

2553

256B

256A

2518

250C

2588

2584

258C

2590

2580

B.
Ё
0401
ё
0451
🮣
1FBA3
🮢
1FBA2
🮠
1FBA0
🮡
1FBA1

2192

2190

2191

2193
÷
00F7
±
00B1

2116
¤
00A4

25A0

00A0

Некириллические варианты КОИ-8

В некоторых странах СЭВ были созданы модификации КОИ-8 для национальных вариантов латиницы . Базовая идея была та же самая — при «срезании» восьмого бита текст должен оставаться более или менее понятным.

Примечания

  1. // Fingertip Software site

Ссылки

Same as КОИ-8