Interested Article - Единицы измерения ёмкости носителей и объёма информации

Единицы измерения информации служат для измерения различных характеристик, связанных с информацией.

Чаще всего измерение информации касается измерения ёмкости компьютерной памяти ( запоминающих устройств ) и измерения количества данных, передаваемых по цифровым каналам связи . Реже измеряется количество информации .

Единицы измерения информации

Большой по размеру объём данных может содержать в себе очень малое количество информации. То есть объём данных и количество информации являются разными характеристиками, применяемыми в разных областях, связанных с информацией, но исторически название « количество информации » использовали в значении «объём данных», а для измерения количества информации применяли названия « информационная энтропия » и «ценность информации».

Единицы измерения ёмкости носителей и объёма данных

Применяются для измерения ёмкости носителей информации — запоминающих устройств и для измерения объёмов данных .

Единицы измерения количества информации

Применяются для измерения количества информации в объёме данных . Информационная энтропия

Первичная единица

Первичной характеристикой объёма данных является количество возможных состояний .

Первичной единицей измерения объёма данных является 1 возможное состояние (значение, код).

Вторичные единицы

Вторичной характеристикой объёма данных является разряд .

Ёмкость (объём) одного разряда может быть разной и зависит от основания применённой системы кодирования.

Ёмкости одного разряда в двоичной, троичной и десятичной системах кодирования:

Один двоичный разряд ( бит ) имеет 2 взаимоисключающих возможных состояния (значения, кода).

Один ( трит ) имеет 3 взаимоисключающих возможных состояния (значения, кода).

Один десятичный разряд (децит) имеет 10 взаимоисключающих возможных состояний (значений, кодов).

Третичные единицы

Третичными характеристиками объёма данных являются различные множества разрядов .

Ёмкость множества разрядов равна количеству возможных состояний этого множества разрядов , которое определяется в комбинаторике , равно количеству размещений с повторениями и вычисляется по формуле:

возможных состояний (кодов, значений)

где

количество возможных состояний одного разряда (основание выбранной системы кодирования),
— количество разрядов в множестве разрядов .

То есть ёмкость множества разрядов представляет собой показательную функцию от количества разрядов с основанием, равным количеству возможных состояний одного разряда .

Пример:

1 байт состоит из 8-ми ( ) двоичных разрядов ( ) и может принимать:

возможных состояний (значений, кодов).

Логарифмические единицы

Единицы измерения информации бит , нат , трит и бан (децит)

Когда некоторые величины, в том числе и объём данных, представляют собой показательные функции , то, во многих случаях, удобнее пользоваться не самими величинами, а логарифмами этих величин.

Объём данных тоже можно представлять логарифмически, как логарифм количества возможных состояний .

Объём информации (объём данных) — может измеряться логарифмически. Это означает, что когда несколько объектов рассматриваются как один, количество возможных состояний перемножается , а количество информации — складывается . Не важно, идёт речь о случайных величинах в математике, регистрах цифровой памяти в технике или в квантовых системах в физике.

Для объёмов двоичных данных удобнее пользоваться двоичными логарифмами.

возможных состояния , двоичный разряд = 1 бит
возможных состояний , двоичных разрядов = 1 Байт ( Октет )
возможных состояния , двоичных разрядов = 1 КилоБайт (КилоОктет)
возможных состояний , двоичных разрядов = 1 МегаБайт (МегаОктет)
возможных состояния , двоичных разрядов = 1 ГигаБайт (ГигаОктет)
возможных состояний , двоичных разрядов = 1 ТераБайт (ТераОктет)

Наименьшее целое число, двоичный логарифм которого целое положительное — это 2. Соответствующая ему единица — бит — является основой исчисления информации в цифровой технике.

Для объёмов троичных данных удобнее пользоваться троичными логарифмами.

возможных состояния , троичный разряд ( трит)
возможных состояний , троичных разрядов ( трит ов) = 1 Трайт .

Единица, соответствующая числу 3, трит равна log 2 3≈1,585 бита.

Такая единица как нат (nat), соответствующая натуральному логарифму применяется в инженерных и научных расчётах. В вычислительной технике она практически не применяется, так как основание натуральных логарифмов не является целым числом.

Для объёмов десятичных данных удобнее пользоваться десятичными логарифмами.

возможных состояний , десятичный разряд = 1 децит
возможных состояний , десятичных разряда = 1 килодецит .
возможных состояний , десятичных разрядов = 1 мегадецит .
возможных состояний , десятичных разрядов = 1 гигадецит .

Единица, соответствующая числу 10, децит равна log 2 10≈3.322 бита.

В проводной технике связи (телеграф и телефон) и радио исторически впервые единица информации получила обозначение бод .

Единицы, производные от бита

В целых количествах двоичных разрядов (битов) количество возможных состояний равно степеням двойки.

Тетрада, полубайт, ниббл

Особое название имеют четыре двоичных разряда (4 бита) — тетрада , полу байт , ниббл , которые вмещают в себя количество информации, содержащейся в одной шестнадцатеричной цифре.

Байт

Следующей по порядку популярной единицей информации является 8 бит, или байт (о терминологических тонкостях ). Именно к байту (а не к биту) непосредственно приводятся все большие объёмы информации, исчисляемые в компьютерных технологиях.

Такие величины как машинное слово и т. п., составляющие несколько байт, в качестве единиц измерения почти никогда не используются.

Килобайт

Для измерения больших ёмкостей запоминающих устройств и больших объёмов информации, имеющих большое количество байтов, служат единицы «килобайт» = [1000] байт и «Кбайт» ( кибибайт , kibibyte) = 1024 байт (о путанице десятичных и двоичных единиц и терминов ). Такой порядок величин имеют, например:

  • Сектор диска обычно равен 512 байтам то есть половине Кбайта, хотя для некоторых устройств может быть равен одному или двум кибибайт.
  • Классический размер «блока» в файловых системах UNIX равен одному Кбайт (1024 байт).
  • «Страница памяти» в процессорах x86 (начиная с модели Intel 80386 ) имеет размер 4096 байт, то есть 4 Кбайт.

Объём информации, получаемой при считывании дискеты «3,5″ высокой плотности» равен 1440 Кбайт (ровно); другие форматы также исчисляются целым числом Кбайт.

Мегабайт

Единицы «мегабайт» = 1000 килобайт = [1 000 000] байт и «мебибайт» (mebibyte) = 1024 Кбайт = 1 048 576 байт применяются для измерения объёмов носителей информации.

Объём адресного пространства процессора Intel 8086 был равен 1 Мбайт.

Оперативную память и ёмкость CD-ROM меряют двоичными единицами (мебибайтами, хотя их так обычно не называют), но для объёма НЖМД десятичные мегабайты были более популярны.

Современные жёсткие диски имеют объёмы, выражаемые в этих единицах минимум шестизначными числами, поэтому для них применяются гигабайты.

Гигабайт

Единицы «гигабайт» = 1000 мегабайт = [1 000 000] килобайт = [1 000 000 000] байт и «Гбайт» ( гибибайт , gibibyte) = 1024 Мбайт = 2 30 байт измеряют объём больших носителей информации, например жёстких дисков . Разница между двоичной и десятичной единицами уже превышает 7 %.

Размер 32-битного адресного пространства равен 4 Гбайт ≈ 4,295 Мбайт. Такой же порядок имеют размер DVD-ROM и современных носителей на флеш-памяти . Размеры жёстких дисков уже достигают сотен и тысяч гигабайт.

Для исчисления ещё больших объёмов информации имеются единицы терабайт и тебибайт (10 12 и 2 40 байт соответственно), петабайт и пебибайт (10 15 и 2 50 байт соответственно) и т. д.

Что такое «байт»?

В принципе, байт определяется для конкретного компьютера как минимальный шаг адресации памяти , который на старых машинах не обязательно был равен 8 битам (а память не обязательно состоит из битов — см., например: троичный компьютер ). В современной традиции, байт часто считают равным восьми битам .

В таких обозначениях как байт (русское) или B (английское) под байтом (B) подразумевается именно 8 бит, хотя сам термин «байт» не вполне корректен с точки зрения теории.

Во французском языке используются обозначения o , Ko , Mo и т. д. (от слова octet) дабы подчеркнуть, что речь идёт именно о 8 битах.

Чему равно «кило»?

Долгое время разнице между множителями 1000 и 1024 старались не придавать большого значения. Во избежание недоразумений следует чётко понимать различие между:

  • двоичными кратными единицами, обозначаемыми согласно ГОСТ 8.417-2002 как «Кбайт», «Мбайт», «Гбайт» и т. д. (два в степенях кратных десяти);
  • единицами килобайт , мегабайт , гигабайт и т. д., понимаемыми как научные термины (десять в степенях, кратных трём),

эти единицы по определению равны, соответственно, 10 3 , 10 6 , 10 9 байтам и т. д.

В качестве терминов для «Кбайт», «Мбайт», «Гбайт» и т. д. МЭК предлагает «кибибайт», «мебибайт», «гибибайт» и т. д., однако эти термины критикуются за непроизносимость и не встречаются в устной речи.

В различных областях информатики предпочтения в употреблении десятичных и двоичных единиц тоже различны. Причём, хотя со времени стандартизации терминологии и обозначений прошло уже несколько лет, далеко не везде стремятся прояснить точное значение используемых единиц.

В английском языке для «киби»=1024=2 10 иногда используют прописную букву K , дабы подчеркнуть отличие от обозначаемой строчной буквой приставки СИ кило . Однако, такое обозначение не опирается на авторитетный стандарт, в отличие от российского ГОСТа касательно «Кбайт».

Вариации

Сравнение разных единиц измерения информации. Дискретные величины представлены прямоугольниками, единица «нат» — горизонтальным уровнем. Чёрточки слева — логарифмы натуральных чисел.

Примечания

  1. от 22 сентября 2008 на Wayback Machine (англ.)
  2. С точки зрения физики , величина информации (как и близкая к ней по смыслу энтропия ) безразмерна . На практике, как и при измерении безразмерных углов , пользуются различными практически удобными единицами.
  3. . Дата обращения: 11 июня 2008. 2 февраля 2012 года.

См. также

Источник —

Same as Единицы измерения ёмкости носителей и объёма информации