Interested Article - XDXF

makedict
Тип converter [ прояснить ] словарей
Разработчики mrcoder1234, kubtek
Написана на C++
Первый выпуск 10 сентября 2006 ; 17 лет назад ( 2006-09-10 )
Аппаратная платформа кросс-платформенный
Последняя версия 0.4 ( 14 лет 24 дня тому назад)
Тестовая версия 0.4.1-beta1 (2012 ( 2012 ) )
Репозиторий
Лицензия GNU GPL
Сайт

XDXF ( XML Dictionary eXchange Format) — свободный проект по объединению всех существующих словарных форматов на основе универсального XML- формата , поддерживающего возможность структурно-семантической разметки словарных статей. Проект включает в себя открытый формат XDXF и open-source конвертер словарей различных форматов. Формат позволяет создавать как обычные пользовательские словари, так и тезаурусы и онтологии . Проект находится в фазе активного развития [ источник не указан 1375 дней ] .

Преимущества и недостатки

Основные преимущества перед конкурирующими форматами [ источник не указан 1375 дней ] :

  • обладает богатой схемой мета-информации о файле (издатель, автор, редактор, год издания и т. п.; позволяет сортировать файлы в библиотеке словарей)
  • позволяет ссылаться не только на полные словарные статьи, но и на их части
  • позволяет выделять в словарной статье основные варианты переводов для предпросмотра статей
  • обладает гибкой настройкой полнотекстовой индексации словаря
  • богатая система семантически связанных слов (синонимы, гиперонимы, антонимы, меронимы и т. п.)
  • позволяет относиться словарные статьи к категориям, подобным категориям статей на Википедии

Особенности формата XDXF

Визуальный тип оформления был оставлен с целью сохранить совместимость со старыми версиями и со словарями, сконвертированными из других форматов, не поддерживающих структурно-семантическую разметку. Вид выводимых статей полностью отвечает форматирование, отступы, выделения текста, описанные внутри XML кода. Структурно-семантическое оформление же позволяет иметь вложенные словарные статьи; оформление статей этого вида полностью перелагается на плечи программной оболочки, которая должна позволять настраивать цвета и внешний вид словаря. Есть возможность дополнять их транскрипцией, синонимами, антонимами, гиперонимами, этимологией, фразеологизмами, грамматическую информацию, аббревиатуры, ссылки на другие статьи, внешние медиа-файлы, исключение из индекса, комментарии, примеры использования и другое. Благодаря перечисленному формат XDXF обладает высокой гибкостью: его можно использовать в качестве тезауруса либо онтологии [ источник не указан 1375 дней ] .

Программное обеспечение

Программы словарей

Для чтения формата XDXF существует большое количество программ под большинство платформ:

Конвертер makedict

Для создания словарей в формате xdxf пока не существует ни единого редактора кроме простых xml-editor’ов, однако в рамках проекта был создан — многофункциональный конвертер форматов «любой в любой»: dictd/dsl/sdict/stardict/xdxf → dictd/stardict/xdxf [ источник не указан 1375 дней ] .

Словари

По состоянию на август 2010 , проект содержал 309 свободно распространяемых словарей, суммарным размером 460.16 MiB в сжатом состоянии (и 2 683.04 MiB в несжатом), с 12,488,072 статьями . Однако, до сих пор превалирующее количество свободных и коммерческих словарей остаются неконвертированными в данный формат.

По состоянию на 11.04.2014, репозиторий на сайте проекта XDXF закрыт, и предлагается скачивать словари непосредственно с SourceForge , однако в сети имеется по крайней мере один каталог , упрощающий поиск по базе словарей, что ранее входило в функции репозитория на сайте проекта.

История

В самом начале разработки формата развивался двумя параллельными путями: XDXF и XDXF-L (образовано от logical). Если первая обладала простой структурой и использовалась чаще всего для создания обычных одноязычных и двуязычных словарей, то вторая — позволяла иметь в словаре огромное количество структурированной информации, по сути превращая его из словаря в словарную базу данных с грамматической, морфологической и лексической информацией. Из-за громоздкости формата, разногласий между авторами и различий в грамматике языков из разных языковых семейств окончательная версия формата так и не была выпущена. Однако XDXF приобрёл развитие и сам разделился на две ветки: визуальное оформление словарных статей и структурно-семантическое, вобравшее в себя сильные стороны XDXF-L [ источник не указан 1375 дней ] .

Примечания

  1. XDXF стал использоваться для хранения различных словарей, однако де факто доминирующим форматом не стал. Что, возможно, связано с тем, что пока не разработан редактор, позволяющий создавать статьи через какой-либо интерфейс, поэтому словари создаются либо с помощью конвертации makedict, либо вручную
  2. Пример
  3. . Дата обращения: 7 августа 2010. 14 мая 2006 года.
  4. . Дата обращения: 13 апреля 2011. 31 октября 2011 года.
  5. . Дата обращения: 11 апреля 2014. 13 апреля 2014 года.

Ссылки

  • (англ.)
  • (англ.)
  • (англ.)
  • (англ.)
Источник —

Same as XDXF