Комбинируемые диакритические знаки
- 1 year ago
- 0
- 0
Диакрити́ческие зна́ки ( др.-греч. διακριτικός — «служащий для различения», от др.-греч. κριτικός — «способный различать»):
Иногда дополнительно требуют, чтобы диакритические знаки были меньшего размера, чем буквы.
Система диакритических знаков какой-либо письменности или текста также называется диакри́тикой .
В некоторых случаях с одной буквой могут употребляться одновременно два, три или даже четыре диакритических знака: ặ , , ᶑ , ᾧ .
Огласовки в консонантных системах письма (например, в иврите , арабском и сирийском языках), по внешнему виду близкие к диакритическим знакам, по смыслу являются скорее особой разновидностью букв.
К диакритикам прибегают в случае, если букв алфавита не хватает для передачи звуков речи или же для смыслоразличения. Основной альтернативой диакритикам при звукоразличении служат сочетания двух ( диграфы ), трёх ( триграфы ) и более букв для обозначения одного звука. Например, звук [ ʃ ] передаётся буквой š в ряде языков, или диграфом ch во французском, португальском, или sh в английском, или триграфом sch в немецком. Диакритики употребляются как с гласными, так и с согласными буквами. Основной недостаток диакритиков — загромождение письма мелкими, но важными деталями, опущение которых может привести к серьёзным ошибкам. Существуют языки, в которых диакритические знаки не столь распространены ( русский ) или практически не используются ( английский ). В некоторых случаях имеется тенденция к вытеснению диакритизованных букв диграфами (немецкий: ö → ое в печатном тексте и компьютеризации, однако с развитием поддержки умляутов это явление практически сошло на нет).
Древнейшими диакритическими знаками были, вероятно, древнегреческие знаки ударения и придыхания, изобретение которых приписывается Аристофану Византийскому .
Диакритики широко используются в языках, использующих латинский алфавит . Это связано с тем, что в классическом латинском языке не было шипящих звуков, носовых гласных, палатализованных (смягчённых) согласных, которые имелись или развились в других языках, особенно неродственных. Так, если в итальянском возможна передача шипящих чисто позиционно (например, в слове città «читта» — «город», где c+i автоматически означают шипящий звук), то в других языках, не связанных с латынью, это невозможно. В португальском и французском языках сильной диакритизации подвергаются гласные буквы (ê, è, ë, ï, ã) — как звуко- и смыслоразличительной, так и чисто этимологической: île < лат. insula «остров». В романских языках имеется и особый диакритизованный согласный ç , в испанском — буква ñ , возникшая в результате надстрочного «двухэтажного» написания двух букв nn в латинских словах типа annum > anno > año «год».
Диакритические знаки можно классифицировать различными способами.
При необходимости (например, в случае технических ограничений) диакритический знак может опускаться, иногда со вставкой или заменой букв слова.
Одинаково выглядящие диакритические знаки могут иметь разное значение, название и статус в различных языках и системах письма.
Отнесение того или иного элемента графической системы к диакритическим знакам в большой мере условно. Так, в современной русской письменности можно найти «диакритические знаки» разной бесспорности (от абсолютной до почти нулевой):
Замечание. Сколько-нибудь устоявшихся русских названий для большинства диакритических знаков нет. В настоящее время конкурируют:
Дополнительно усложняет ситуацию и тот факт, что два разных в одном языке знака в другом могут оказаться взаимозаменяемыми шрифтовыми вариантами.
Описание, код | Пример | Возможное использование |
---|---|---|
Неслитные надстрочные знаки |
||
/-образный штрих над буквой
U+0301 |
á |
1.
Острое ударение
— диакритический значок над буквой, используемый в греческом, романских, славянских и мн. др. языках. Для обозначения именно
«острого ударения» как явления в других языках
в русском можно встретить сразу несколько терминов, например,
2. В русском языке используется термин «ударение» («знак ударения»), что связано с наличием всего одного вида ударения в языке (усиление голосом тона гласного звука, на который падает ударение). Используется в учебной литературе, словарях, либо для разрешения неясности (например, «бо́льшим»). |
ń , ѓ | черта ( польск. kreska ( «крэ́ска» — черта, линия )) в польском обозначает специфическое смягчение согласных, а над ó — произношение как [u]; то же смягчающее значение используется в лужицких, хорватском, македонском и некоторых других языках | |
á | в чешском, словацком и венгерском — показатель долготы гласных | |
á | в транскрипции пиньинь китайского языка над гласным обозначает восходящий тон | |
\-образный штрих над буквой
U+0300 |
à | тяжёлое ударение : др.-греч. βᾰρεῖα , ц.-сл. вария , лат. gravis ( гравис ), фр. accent grave , англ. grave ; используется в греческом (политоническая орфография), романских (прежде всего во французском), южнославянских и мн. др. языках |
à | в транскрипции пиньинь китайского языка над гласным обозначает нисходящий тон | |
надстрочное двоеточие
U+0308 |
ë, ï, ü | знак раздельного чтения буквосочетаний: греч. diaeresis или dialytika, греч. и фр. trema ( трема ); используется в греческом, романских и некоторых других языках (иногда даже в английском) |
ä, ö, ü | умляут — знак немецкой и некоторых других германских письменностей, указывающий на изменившееся («смягчившееся») произношение некоторых гласных; заимствован также некоторыми другими языками (например, финским, эстонским, венгерским, турецким и словацким) | |
ё | двоеточие входит в состав русской (и белорусской) буквы «ё» | |
ї | двоеточие входит в состав украинской буквы «ї» [йи] | |
ї , ѷ | в церковнославянском кендема , то есть две точки (либо два штриха // или \\, что было равнозначно), ставится над буквой i и ижицей ( ѵ ) в том случае, когда они читаются как [и] и не имеют на себе других надстрочных знаков (ударения или придыхания) | |
ӥ | в фонетической транскрипции русского текста: изменение гласного, вызванное положением между мягкими согласными | |
шапочка над буквой
(^-образная: U+0302, круглая: U+0311, ст.-сл. знак мягкости: U+0484, над парой букв: U+0361) |
â, ê, û… | облечённое ударение : др.-греч. περισπασμός, ц.-сл. камора , лат. circumflexus ( циркумфлекс ), фр. accent circonflexe , англ. circumflex ; используется в греческом (политоническая орфография), романских (прежде всего во французском), сербском, ц.-сл. и мн. др. языках; в классических языках шапочка обычно круглая или даже (в греческом) в форме тильды (см. ниже), во французском, иногда в сербском — заострённая. |
â | в латинской транслитерации персидского языка обозначает долгий гортанный ɑ | |
ĉ , ĝ , ĥ , ĵ , ŝ | в языке эсперанто надстрочный символ ^ официально называется «циркумфлекс» ( эсп. «cirkumflekso»), неофициально — «шапочка» ( эсп. «ĉapelo»); модифицирует чтение соответствующих согласных без «шапочки» так, что они читаются соответственно как русские ч , дьжь , х , ж и ш (приблизительно) | |
î | в румынском языке острая шапочка над â и î означает их чтение как [ы] | |
ê, ŝ | в некоторых системах латинской транслитерации кириллицы через ê может передаваться буква «э» , а через ŝ — буква «щ» | |
ж͡дж | в некоторых системах транскрипции круглая шапочка над группой букв обозначает их слитное произношение ( аффрикату ) | |
л̑ | в старославянском круглая шапочка над согласной (иногда несколько смещённая вправо) означает её мягкость | |
â, î, û | В турецком шапочка ( тур. düzeltme işareti , «знак поправки») над гласной в арабских и персидских заимствованиях обозначает долгий гласный или мягкость предыдущего звука g или k . Также может обозначать мягкость предшествующего l в топонимах и антропонимах. | |
«птичка» над буквой
U+030C |
ž , ě | крючок ( гачек , чеш. háček ) — знак чешской письменности, отмечающий шипящие и мягкие согласные, а также сильно смягчающее произношение буквы ě (обычно соответствующее старому славянскому ятю ); над некоторыми буквами может для красоты выглядеть как почти прилипший апостроф : Ľ , ď и т. п.; заимствован в некоторые другие письменности (в хорватской использовался в обоих значениях); используется в некоторых системах латинской транслитерации русской и других кириллиц. В английском компьютерном сленге с 1980-х годов для этого знака появилось название caron неясного происхождения ( caret + macron ?, carom + on ?, лат. corona ?), которое впоследствии расползлось в другие языки и официальные документы (вроде стандарта Юникода). |
ž | обозначает звук ж в некоторых финно-угорских, балтийских и славянских языках | |
š | обозначает звук ш в некоторых финно-угорских, балтийских и славянских языках | |
č | обозначает звук ч в некоторых финно-угорских, балтийских и славянских языках | |
ǎ | в транскрипции пиньинь китайского языка над гласным обозначает нисходяще-восходящий тон | |
ѯ | крючок входит в состав старославянской буквы «Ѯ» (Кси). | |
// над буквой
U+030B |
ő , ű | «венгерский умляут»: ő и ű означают долгие варианты звуков, выражаемых буквами ö и ü |
ѵ̋ | в церковнославянском: шрифтовой вариант начертания ѵ̈ | |
\\ над буквой
U+030F |
и̏ | в сербском: краткое нисходящее ударение |
ѷ | в церковнославянском: шрифтовой вариант начертания ѵ̈ (для ижицы самый распространённый, а вот ї чаще рисовали с точками или вертикальными штрихами) | |
надстрочный кружок
U+030A |
å | в некоторых скандинавских языках через å обозначается долгое [a], перешедшее в [o]; прописное Å — обозначение ангстремов |
ů | в чешском языке с помощью кружка ( чеш. kroužek ) через ů обозначается долгое [u:], произошедшее от дифтонга uo | |
надстрочная
точка
U+0307 |
i , j | ( англ. tittle ) входит в состав строчных букв i и j большинства языков с латинской и некоторых с кириллической письменностью (при добавлении любого другого надстрочного знака точка обычно удаляется); в некоторых тюркских языках (например, в турецком) различаются буква i с точкой (по-турецки читается как [и]) и без точки (читается как [ы]), причём это различие сохраняется и для прописных букв |
ż | шипящие согласные в старой чешской письменности, буква ż в нынешнем польском языке | |
ė | в литовском языке | |
ṁ | латинская транслитерация санскрита (через ṁ в разных системах могут изображаться как анунасика , так и анусвара , но последняя может быть и ṅ) | |
ḃ, ḋ, ḟ, ṁ, ṗ, ṫ | ранее использовались в ирландском и других гойдельских языках, точка над согласной обозначала леницию . В современной орфографии лениция обозначается добавлением буквы Hh . | |
точка слева над буквой | в фонетической транскрипции русского текста: изменение гласного, вызванное положением после мягкого согласного | |
точка справа над буквой
U+0358 |
a͘ | в фонетической транскрипции русского текста: изменение гласного, вызванное положением перед мягким согласным |
тильда
над буквой
U+0303 (в греческом U+0342) |
ã | в некоторых система транскрипции тильда (происходящая от надстрочных n и m ) над гласными означает их носовое произношение; в этом значении она используется также и в португальском языке |
ñ | в испанском ñ — мягкое [нь] | |
õ | обозначает звук ы в эстонском языке | |
ᾶ | в политонической греческой орфографии тильда — шрифтовой вариант круглой шапочки (см. выше про «облечённое ударение») | |
черта над буквой
U+0304 |
ā | основное значение (идущее от древнегреческого и латыни) — указание на долготу гласных (и слогообразующих согласных); иногда используется греческое название макрон |
ā | в транскрипции пиньинь китайского языка над гласной обозначает ровный тон | |
U-образный надстрочный знак
U+0306 |
ă | основное значение (идущее от древнегреческого и латинского языков) — указание на краткость гласных; лат. brevis ( бревис ), англ. breve |
й | в славянских кириллицах означает неслоговой характер гласных и их переход в согласные; ц.-сл. и рус. название — краткая (c конца XIX века в словарях также кратка ). Входит в состав букв й , ў (используется в белорусском языке) и нек. др. В современных кириллических шрифтах обычно изображается не так, как в греческих и латинских. | |
ӂ | в молдавской кириллице советских времён буква «ӂ» означала аффрикату [дж] | |
ğ | в турецком через ğ обозначается звук, близкий к белорусскому г , а в некоторых диалектах доходящий до полного исчезновения | |
ŭ | в языке эсперанто U-образный надстрочный знак, неофициально называемый «ванночка» ( эсп. «kuveto»), трансформирует гласный u в неслоговый звук, близкий к английскому w , используемый практически исключительно в дифтонгах aŭ и eŭ , например: «aŭroro» («заря»), «Eŭropo» («Европа») | |
(-образный знак
греч.: U+0314, кир.: U+0485 |
ὡ, ῥ | густое придыхание (часто соответствует начальному h- в интернационализмах): др.-греч. δᾰσεῖα , ц.-сл. дасия , лат. spiritus asper ; использовалось в политонической греческой орфографии и в некоторых старых вариантах церковнославянского |
)-образный знак
греч.: U+0313, кир.: U+0486 |
ὀ, ὠ | тонкое придыхание: др.-греч. πνεῦμα ψιλόν , также ψιλή, ц.-сл. духъ, также псили или звательце , лат. spiritus lenis ; используется в политонической греческой орфографии и в церковнославянском (ничего не обозначает, ставится над начальной гласной слов) |
хвостик сверху
U+0309 |
ả | вьетнамский знак одного из музыкальных тонов ( вьетн. dấu hỏi ) |
титло
U+0483 |
а҃ | старо- и церковнославянский знак для указания сокращённых написаний слов и для буквенной записи чисел |
апостроф | н' | в некоторых системах фонетической транскрипции: знак мягкости согласных: любить = [л’уб’ит'] или [l’ub’it'], а в некоторых наоборот (например, в украинском языке ) — твёрдости (но иногда и мягкости тоже). |
Неслитные подстрочные знаки |
||
подстрочная точка
U+0323 |
ḥ | различные системы транскрипции и транслитерации (семитских языков, языков Индии и др.); подстрочная точка может обозначать слогообразующие согласные (ṛ, ḷ), церебральные согласные (ḍ, ṭ, ṇ), анунасику с анусварой и др. |
подстрочная
запятая
U+0326 |
ț | свистящие и шипящие в румынском языке ( ș , ț ) |
ķ | мягкие согласные в латышском ( Ģ , ķ , ļ , ņ ) и ливском ( ḑ , ļ , ņ , ŗ , ț ) языках; при строчной букве g переворачивается и становится надстрочным знаком: ģ | |
подстрочный кружок
U+0325 |
r̥ | в некоторых системах транскрипции (например, в реконструкции индоевропейского или праславянского языка) кружок под согласной обозначает её слоговой характер |
«чашка» под несколькими буквами
U+035C |
t͜s | в некоторых системах фонетической транскрипции знак ͜ под буквосочетанием означает его слитное произношение — аффрикативность |
«шапочка» под буквой
U+032F |
u̯ | в некоторых системах фонетической транскрипции: неслоговой звук |
подчёркивание
U+0331 |
a̱ | в словарях может обозначать ударение |
«птичка» под буквой
U+032C |
s̬ | в МФА — знак звонкости |
йота подписная
U+0345 |
ᾳ | в древнегреческом |
Слитные надстрочные знаки |
||
рожок направо и вверх
U+031B |
ơ | используется во вьетнамском языке |
апостроф слитно
U+0491 |
ґ | используется в украинском языке для выделения взрывного г (в отличие от обычного щелевого г, принятого в украинском). Также используется как факультативная буква в белорусской тарашкевице . |
Слитные подстрочные знаки |
||
седиль
U+0327 |
ç | происходит из испанского языка ( исп. zedilla [седи́лья] — «маленькое „z“»), но ныне там не используется; наиболее известно по употреблению во французском ( фр. cédille [седи́й]), ставится под c в том случае, когда у этой буквы надо обозначить произношение [s] вместо [k]: façade [фасад]; используется также в некоторых других языках под разными буквами и с разным значением (так, в турецком буквы c, ç, s, ş обозначают соответственно звуки [дж], [ч], [с] и [ш]) |
c-образный хвостик
U+0328 |
ę | происходит из средневековой латинской письменности, где знак ę был компактной заменой для лигатуры æ ; оттуда заимствован польской письменностью и получил название ogonek [ого́нэк] = «хвостик»; в польском используется в буквах носовых гласных ą и ę . Из польского заимствован другими языками (в частности, литовским), применяется при различных буквах |
хвостик как у ц или щ | ҷ , ӌ | использовался в 1930-е годы и позже при создании кириллических письменностей для различных языков СССР; обычно шёл вправо и вниз, но иногда влево и вниз |
Слитные внутристрочные знаки |
||
горизонтальный штрих
короткий: U+0335, длинный: U+0336 |
đ | во вьетнамском языке — буква «д» |
диагональный штрих
короткий: U+0337, длинный: U+0338 |
ø | в датском, норвежском, фарерском ø означает то же, что в немецком, шведском, исландском ö |
ł | ł — польское несмягчённое [л], переходящее в неслоговое [у]; перечёркивание обычно наклонное, но в декоративных шрифтах может быть горизонтальным, в виде тильды и т. п.; при письме от руки вместо перечёркивания ставят тильду сверху | |
вертикальный штрих
строчная: U+049C, заглавная: U+049D |
Ҝ | Ҝ — 15-я буква азербайджанского кириллического алфавита. Обозначает звонкий палатальный взрывной согласный [ ɟ ] |
тильда посередине | ɫ |
Хвостики:
Верхний регистр | Нижний регистр | Язык(и) |
---|---|---|
Ӑ | ă | чувашский |
Ӓ | ä | |
Ѓ | ѓ | македонский |
Ќ | ќ | македонский |
Ӳ | ӳ | чувашский |
Ѷ | ѷ | |
Ғ | ғ | узбекский , азербайджанский , башкирский |
Ҟ | ҟ | абхазский |
Ө | ө | казахский , монгольский |
Ұ | ұ | казахский |
Ҝ | ҝ | азербайджанский |
Ҹ | ҹ | азербайджанский |
Й | й | русский , украинский , белорусский , болгарский , абхазский , чувашский, казахский, монгольский , бурятский , калмыцкий |
Ѝ | ѝ | болгарский |
Ҋ | ҋ | кильдинский саамский |
Ў | ў | узбекский, чувашский, белорусский |
Ӂ | ӂ | молдавский |
Ӗ | ĕ | чувашский |
Ҙ | ҙ | башкирский |
Җ | җ | татарский, калмыкский |
Қ | қ | узбекский, абхазский, таджикский, казахский |
Ң | ң | башкирский |
Ҭ | ҭ | абхазский |
Ҳ | ҳ | абхазский |
Ҷ | ҷ | абхазский |
Ҧ | ҧ | абхазский |
Ӈ | ӈ | хантыйский , чукотский , ненецкий |
Ҕ | ҕ | абхазский, якутский |
Ӄ | ӄ | хантыйский, чукотский |
Ґ | ґ | украинский |
Ӣ | ӣ | |
Ӯ | ӯ | |
Ҿ | ҿ | абхазский |
Ҫ | ҫ | башкирский, чувашский |
Ӆ | ӆ | кильдинский саамский язык |
Ӊ | ӊ | кильдинский саамский язык |
Ӎ | ӎ | кильдинский саамский язык |
Ѽ | ѽ | |
Ё | ë | белорусский, русский, чувашский, казахский, монгольский |
Ї | ï | украинский |
Ӝ | ӝ | удмуртский |
Ӛ | ӛ | |
Ӟ | ӟ | |
Ӧ | ö | |
Ӭ | ӭ | кильдинский саамский язык |
Ӱ | ӱ | |
Ӵ | ӵ | |
Ӹ | ӹ | |
Ӥ | ӥ | |
Ҏ | ҏ | кильдинский саамский язык |
Є | є | украинский |
І | і | украинский, белорусский |
Ѳ | ѳ |
Некоторые другие специфические диакритические знаки используются в МФА и в церковнославянской письменности .
Написание некоторых диакритических знаков с помощью HTML -разметки приведено в « Комбинируемых диакритических символах ».
В литовском языке имеется 12 гласных букв. В дополнение к стандартным латинским буквам используются диакритические знаки для обозначения долгих (ilgoji: y, ū) и носовых (nosinė: ą, ę, į, ų — обозначаются огонэком) гласных, оставшихся со времени, когда эти буквы произносились в нос, как некоторые гласные в современном польском. Эти изменённые гласные (кроме ė), в современной разговорной речи никак не выделяются по звучанию относительно основных гласных и несут, в основном, историческую нагрузку в письменности.
Прописные | A | Ą | E | Ę | Ė | I | Į | Y | O | U | Ų | Ū |
Строчные | a | ą | e | ę | ė | i | į | y | o | u | ų | ū |
МФА | a | aː | ɛ | ɛː | eː | i | iː | iː | o | u | uː | uː |
Также и румынские ș , ț часто :10 кодируются с седилью: ş , ţ . В разных шрифтах и программах эти два знака отображаются по-разному: оба с седилью; оба с запятой; ş с седилью, а ţ с запятой; или оба с седилью по умолчанию, но оба с запятой в тексте, чей язык обозначен как румынский.