Interested Article - Плоскость (Юникод)

В стандарте Юникод плоскость — непрерывный диапазон из 65 536 (2 16 ) кодовых позиций. Существует 17 плоскостей, обозначенных числами от 0 до 16, что соответствует возможным значениям 00—10 16 первых двух шестнадцатеричных цифр в шестизначном формате номера кодовой позиции (U+ hh hhhh ). Последняя кодовая позиция в Юникоде — последняя кодовая позиция в плоскости 16, U+10FFFF. Плоскость 0 называется Основная многоязычная плоскость ( англ. Basic Multilingual Plane, BMP ), она содержит наиболее часто используемые символы. Остальные плоскости (1—16) называются «дополнительными» . В версии Юникода 14.0 задействованы кодовые позиции семи плоскостей, при этом две из них предназначены для частного использования.

Ограничение в 17 плоскостей обусловлено кодировкой UTF-16 , в которой могли быть закодированы 2 20 (1 048 576) кодовых позиций (16 плоскостей) и BMP . Кодировка UTF-8 была разработана с гораздо большим лимитом в 2 31 (2 147 483 648) кодовых позиций (32 768 плоскостей) и могла задействовать 2 21 (2 097 152) кодовых позиций (32 плоскости) даже при лимите в 4 байта .

Плоскости Юникода:

  • Плоскость 0 (0000—FFFF): Основная многоязычная плоскость ( англ. Basic Multilingual Plane, BMP )
  • Плоскость 1 (10000—1FFFF): Дополнительная многоязычная плоскость ( англ. Supplementary Multilingual Plane, SMP )
  • Плоскость 2 (20000—2FFFF): Дополнительная идеографическая плоскость ( англ. Supplementary Ideographic Plane, SIP )
  • Плоскость 3 (30000—3FFFF): Третичная идеографическая плоскость ( англ. Tertiary Ideographic Plane, TIP )
  • Плоскости 4—13 (40000—DFFFF) не используются
  • Плоскость 14 (E0000—EFFFF): Специализированная дополнительная плоскость ( англ. Supplementary Special-purpose Plane, SSP )
  • Плоскость 15 (F0000—FFFFF) Дополнительная область для частного использования — A ( англ. Supplementary Private Use Area-A, SPUA-A )
  • Плоскость 16 (100000—10FFFF) Дополнительная область для частного использования — B ( англ. Supplementary Private Use Area-B, SPUA-B )

Основная многоязычная плоскость

Основная многоязычная плоскость. Каждая пронумерованная ячейка содержит 256 кодовых позиций.

Плоскость 0 (Основная многоязычная плоскость, англ. Basic Multilingual Plane , BMP ) отведена для символов большинства современных письменностей и большого числа специальных символов. Большая часть таблицы занята идеограммами ККЯ и корейскими слогами .

В Юникоде 15.0 в этой плоскости представлены следующие блоки:

Дополнительная многоязычная плоскость

Дополнительная многоязыковая плоскость. Каждая пронумерованная ячейка содержит 256 кодовых позиций.

Плоскость 1 (Дополнительная многоязыковая плоскость, англ. Supplementary Multilingual Plane , SMP ) отведена преимущественно для исторических письменностей, но включает также символы условных обозначений, такие как музыкальные и математические символы.

В Юникоде 15.0 в этой плоскости представлены следующие наборы символов:

  • (10000—1007F)
  • (10080—100FF)
  • (10100—1013F)
  • (10140—1018F)
  • Древние символы (10190—101CF)
  • (101D0—101FF)
  • Ликийское письмо (10280—1029F)
  • (102A0—102DF)
  • (102E0—102FF)
  • (10300—1032F)
  • Готское письмо (10330—1034F)
  • Древнепермское письмо (10350—1037F)
  • (10380—1039F)
  • (103A0—103DF)
  • (10400—1044F)
  • (10450—1047F)
  • (10480—104AF)
  • Осейдж (104B0—104FF)
  • (10500—1052F)
  • (10530—1056F)
  • (10570—105BF)
  • (10600—1077F)
  • (10780—107BF)
  • (10800—1083F)
  • (10840—1085F)
  • (10860—1087F)
  • (10880—108AF)
  • (108E0—108FF)
  • (10900—1091F)
  • Лидийское письмо (10920—1093F)
  • Мероитские иероглифы (10980—1099F)
  • (109A0—109FF)
  • (10A00—10A5F)
  • (10A60—10A7F)
  • (10A80—109FF)
  • (10AC0—10AFF)
  • Авестийское письмо (10B00—10B3F)
  • (10B40—10B5F)
  • (10B60—10B7F)
  • (10B80—10BAF)
  • (10C00—10C4F)
  • (10C00—10C4F)
  • (10D00—10D3F)
  • (10E60—10E7F)
  • (10E80—10EBF)
  • (10EC0—10EFF)
  • (10F00—10F2F)
  • (10F30—10F6F)
  • (10F70—10FAF)
  • (10FB0—10FBF)
  • (10FE0—10FFF)
  • (11000—1107F)
  • (11080—110CF)
  • (110D0—110FF)
  • (11100—1114F)
  • (11150—1117F)
  • (11180—111DF)
  • (111E0—111FF)
  • (11200—1124F)
  • (11280—112AF)
  • (112B0—112FF)
  • (11300—1137F)
  • (11400—1147F)
  • (11480—114DF)
  • (11580—115FF)
  • (11600—1165F)
  • (11660—1167F)
  • (11680—116CF)
  • (11700—1174F)
  • (11800—1184F)
  • (118A0—118FF)
  • (11900—1195F)
  • (119A0—119FF)
  • (11A00—11A4F)
  • (11A50—11AAF)
  • (11AB0—11ABF)
  • (11AC0—11AFF)
  • (11B00—11B5F)
  • (11C00—11C6F)
  • (11C70—11CBF)
  • (11D00—11D5F)
  • (11D60—11DAF)
  • (11EE0—11EFF)
  • (11F00—11F5F)
  • (11FB0—11FBF)
  • (11FC0—11FFF)
  • (12000—123FF)
  • (12400—1247F)
  • (12480—1254F)
  • (12F90—12FFF)
  • (13000—1342F)
  • Управляющие символы форматирования египетских иероглифов (13430—1345F)
  • (14400—1467F)
  • (16800—16A3F)
  • (16A40—16A6F)
  • (16A70—16ACF)
  • (16AD0—16AFF)
  • (16B00—16B8F)
  • (16E40—16E9F)
  • (16FE0—16FFF)
  • (16F00—16F9F)
  • Тангутское письмо (17000—187FF)
  • (18800—18AFF)
  • (18B00—18CFF)
  • (18D00—18D8F)
  • (1AFF0—1AFFF)
  • (1B000—1B0FF)
  • (1B100—1B12F)
  • (1B130—1B16F)
  • (1B170—1B2FF)
  • (1BC00—1BC9F)
  • Форматирующие символы стенографии (1BCA0—1BCAF)
  • (1CF00—1CFCF)
  • (1D000—1D0FF)
  • (1D100—1D1FF)
  • (1D200—1D24F)
  • (1D2C0—1D2DF)
  • Цифры майя (1D2E0—1D2FF)
  • (1D300—1D35F)
  • (1D360—1D37F)
  • (1D400—1D7FF)
  • (1D800—1DAAF)
  • (1DF00—1DFFF)
  • (1E000—1E02F)
  • (1E030—1E08F)
  • (1E100—1E14F)
  • (1E290—1E2BF)
  • (1E2C0—1E2FF)
  • (1E4D0—1E4FF)
  • (1E7E0—1E7FF)
  • (1E800—1E8DF)
  • (1E900—1E95F)
  • (1EC70—1ECBF)
  • (1ED00—1ED4F)
  • (1EE00—1EEFF)
  • (1F000—1F02F)
  • (1F030—1F09F)
  • (1F0A0—1F0FF)
  • (1F100—1F1FF)
  • (1F200—1F2FF)
  • (1F300—1F5FF)
  • Эмотиконы (1F600—1F64F)
  • (1F650—1F67F)
  • (1F680—1F6FF)
  • (1F700—1F77F)
  • (1F780—1F7FF)
  • (1F800—1F8FF)
  • (1F900—1F9FF)
  • (1FA00—1FA6F)
  • (1FA70—1FAFF)
  • (1FB00—1FBFF)

Дополнительная идеографическая плоскость

Дополнительная идеографическая плоскость. Каждая пронумерованная ячейка содержит 256 кодовых позиций.

Плоскость 2 (Дополнительная идеографическая плоскость, англ. Supplementary Ideographic Plane , SIP ) отведена для редко используемых иероглифов ККЯ .

В Юникоде 15.0 в этой плоскости представлены следующие наборы иероглифов:

Третичная идеографическая плоскость

Третичная идеографическая плоскость. Каждая пронумерованная ячейка содержит 256 кодовых позиций.

Плоскость 3 (Третичная идеографическая плоскость, англ. Tertiary Ideographic Plane , TIP ) содержит редко используемые китайские иероглифы , в неё также предполагается внести исторические формы китайского письма.

В Юникоде 15.0 в этой плоскости представлены следующие блоки:

  • (30000—3134F)
  • (31350—323AF)

Оставшаяся часть Третичной идеографической плоскости разделена на следующие диапазоны :

  • Чжуаньшу (32400—352FF) — иероглифы в стиле « » (сяочжуань, 小篆) и « » (дачжуань, 大篆) ;
  • Цзягувэнь (35400—36BFF) — древнейшие китайские иероглифы эпохи Шан ( цзягувэнь , 甲骨文), встречающиеся в гадательных надписях на панцирях, черепах и костях животных

В будущем также предполагается включить иероглифы эпох Шан и Чжоу ( цзиньвэнь , 金文), встречающиеся в ритуальных надписях на бронзовых сосудах и музыкальных инструментах, и наборы иероглифов Периода Сражающихся царств .

Специализированная дополнительная плоскость

Специализированная дополнительная плоскость. Каждая пронумерованная ячейка содержит 256 кодовых позиций.

Плоскость 14 (Специализированная дополнительная плоскость, англ. Supplementary Special-purpose Plane , SSP ) отведена для символов, используемых по особому назначению.

В Юникоде 15.0 в этой плоскости представлены следующие блоки:

  • (E0000—E007F)
  • (E0100—E01EF)

Области для частного использования

Некоторые диапазоны Юникода отведены для частного использования и экспериментов. Они включают:

  • Частную область в Базовой многоязыковой плоскости (E000—F8FF)
  • Дополнительные плоскости 15 (F0000—U+FFFFF) и 16 (100000—10FFFF)

См. также

Примечания

  1. . Дата обращения: 30 сентября 2018. 24 сентября 2018 года.
  2. See Table 3.5 «UTF-16 Bit Distribution» in the Unicode Standard от 31 марта 2019 на Wayback Machine
  3. See Table 3.6 «UTF-8 Bit Distribution» in the Unicode Standard от 31 марта 2019 на Wayback Machine
  4. (англ.) (PDF) (12 марта 2020). Дата обращения: 17 марта 2020. 29 февраля 2020 года.
  5. (англ.) (PDF) (20 июня 2019). Дата обращения: 17 марта 2020. 30 ноября 2019 года.
  6. (англ.) (PDF) (21 октября 2015). Дата обращения: 20 ноября 2017. 14 июня 2019 года.

Ссылки

  • (англ.)
  • (рус.) (англ.)
Источник —

Same as Плоскость (Юникод)