Interested Article - Zstandard

Zstandard — алгоритм сжатия данных без потерь, разрабатываемый с 2015 года Яном Колле ( фр. Yann Collet ) при поддержке корпорации Facebook ; zstd — эталонная реализация алгоритма Zstandard на языке программирования Си под свободной лицензией BSD . Версия 1.0 алгоритма и реализации были представлены в конце августа 2016 года .

Сочетает словарный алгоритм сжатия данных типа LZ77 и эффективное энтропийное кодирование типа ANS (FSE — Finite State Entropy ), алгоритм, сходный с кодом Хаффмана , реализующий нецелое количество бит для хранения символов .

Особенности

Целью разработки является достижение коэффициентов сжатия, сопоставимых или превосходящих классический алгоритм deflate (разработан в середине 1990-х, реализован в Zip , gzip и других) при более высокой скорости как сжатия, так и распаковки. Сходные цели решают алгоритмы Brotli ( Google ) и ( Apple , также использует ANS FSE) .

По данным LTCB, zstd 0.6 при максимальной степени сжатия показывает уровень сжатия, близкий к архиваторам boz, yxz, tornado; более высокий, чем у lza, brotli , bzip2 , обеспечивая при этом очень быструю распаковку (2,2 нс/байт на Core i7-3930K при 4,5 ГГц)

Алгоритм реализует 22 уровня сжатия, различающихся скоростью и эффективностью (уровень «1» — самый быстрый, уровень «22» — более эффективный). Опционально алгоритм может проанализировать заданный набор данных для составления специализированных внешних словарей. Задаваемый пользователем словарь улучшает степень сжатия сходных файлов, но требуется при распаковке. Словари применяют для сжатия небольших файлов, имеющих общие наборы строк, например, XML-файлы .

Эталонная реализация алгоритма на Си распространяется под свободной лицензией BSD . Код опубликован на сайте Github . Начиная с версии 1.3.1 из условий было убрано упоминание ограниченной патентной лицензии, а код был перелицензирован под условиями двойной BSD + GPLv2 лицензии.

Применение

Метод Zstandard включён в состав ядра Linux с версии 4.14 от ноября 2017 для использования в файловых системах, в частности, в btrfs и squashfs . Также метод тестировался во FreeBSD для интеграции в файловую систему .

Алгоритм используется в ряде дата-центров и системах обработки «больших данных», в частности, в Amazon RedShift . Поддерживается в базах данных, например RocksDB, в некоторых архиваторах, в частности, в FreeArc .

Описание метода Zstandard и MIME-тип «application/zstd» были поданы в IETF в качестве .

Корпорация Canonical в дистрибутиве Ubuntu планирует перевести пакетный формат deb на сжатие при помощи zstd начиная с версии 18.10 (октябрь 2018) ради ускорения процесса установки примерно на 10 процентов. Сжатие пакетов при помощи Zstd на уровне 19 приводит к немного большему размеру пакета, чем при ранее использовавшемся алгоритме xz ( LZMA ), но zstd позволяет быстрее распаковывать .

Полноценная реализация алгоритма с выбором уровня сжатия используется в форматах .NSZ/.XCZ , разработанных homebrew-сообществом для гибридной игровой консоли Nintendo Switch .

Примечания

  1. — 2023.
  2. License //
  3. Sergio De Simone, от 7 октября 2021 на Wayback Machine / InfoQ, Sep 02, 2016
  4. . The Register. 2016-08-31. из оригинала 3 сентября 2016 . Дата обращения: 6 сентября 2016 .
  5. . Дата обращения: 1 сентября 2016. 5 марта 2016 года.
  6. . Дата обращения: 1 сентября 2016. 11 сентября 2016 года.
  7. от 11 сентября 2016 на Wayback Machine // Opennet.ru, 07.07.2016
  8. Matt Mahoney. (29 августа 2016). Дата обращения: 1 сентября 2016. 31 марта 2022 года.
  9. от 25 января 2018 на Wayback Machine «Facebook developers report massive speedups and compression ratio improvements when using dictionaries»
  10. . Дата обращения: 1 сентября 2016. 8 ноября 2020 года.
  11. (англ.) . ZDnet. 2016-08-31. из оригинала 1 сентября 2016 . Дата обращения: 1 сентября 2016 .
  12. от 12 сентября 2020 на Wayback Machine , GitHub
  13. от 12 сентября 2020 на Wayback Machine , GitHub
  14. от 22 ноября 2021 на Wayback Machine The rest of the 4.14 merge window [LWN.net]]
  15. . Дата обращения: 13 августа 2018. 10 января 2018 года.
  16. . Дата обращения: 13 августа 2018. 25 июля 2019 года.
  17. . Дата обращения: 13 августа 2018. 18 декабря 2019 года.
  18. . Дата обращения: 13 августа 2018. 14 августа 2021 года.
  19. Collet, Yann; Kucherawy, Murray S. . IETF. Дата обращения: 13 июля 2018.
  20. . Softpedia (12 марта 2018). Дата обращения: 13 августа 2018. 6 октября 2021 года.
  21. (англ.) . phoronix (12 марта 2018). Дата обращения: 13 августа 2018. 16 августа 2021 года.
  22. (англ.) . GBAtemp.net - The Independent Video Game Community. Дата обращения: 3 ноября 2019. 15 августа 2021 года.
  23. Nico Bosshard. . — 2019-10-31. 27 марта 2022 года.
  24. . 4pda.to. Дата обращения: 3 ноября 2019.

Ссылки

  • — официальный сайт Zstandard
  • на сайте GitHub
  • , Facebook code, 2016-08-31 (англ.)
  • / Opennet.ru, 01.09.2016
Источник —

Same as Zstandard