Interested Article - Hierarchical Data Format

Hierarchical Data Format , HDF (Иерархический формат данных) — название формата файлов, разработанного для хранения большого объема цифровой информации. Первоначально был разработан Национальным центром суперкомпьютерных приложений , сейчас поддерживается некоммерческой организацией HDF Group.

Библиотеки для работы с форматом и связанные с ним утилиты доступны для использования под свободной лицензией, схожей с лицензией BSD. Формат HDF поддерживается многими коммерческими и некоммерческими программами, в том числе есть библиотеки для работы с ним в Java , Matlab , Scilab , Octave , Mathematica , (англ.) , Python , R и Julia . Свободно распространяемый пакет HDF состоит из библиотеки, утилиты командной строки, исходных текстов для тестирования, интерфейса для Java и Java-программы для просмотра HDF-файлов.

HDF4

HDF4 — старая версия формата, однако все еще активно поддерживаемая HDF Group. Он поддерживает различные модели данных, включая многомерные массивы, растровые изображения и таблицы.

Использует 32-битные целые числа, поэтому имеет проблемы с хранением больших объёмов информации (более нескольких гигабайт).

HDF5

HDF5 — современная версия формата. Получил премию R&D100 от журнала "R&D Magazine" в 2002 году.

Содержит иерархию из двух основных типов объектов:

Пример структуры HDF
  • Datasets — наборы данных, многомерные массивы объектов одного типа
  • Groups — группы, являются контейнерами для наборов данных и других групп

Содержимое файлов HDF5 организовано подобно иерархической файловой системе, и для доступа к данным применяются пути, сходные с POSIX-синтаксисом, например, /path/to/resource . Метаданные хранятся в виде набора именованных атрибутов объектов.

Формат NetCDF 4 основан на HDF5.

Для индексации используются Б-деревья .

Примечания

  1. . Дата обращения: 28 июня 2017.
  2. Background & Context //
  3. 4 января 2011 года.

Ссылки

Источник —

Same as Hierarchical Data Format