Interested Article - Единицы измерения ёмкости носителей и объёма информации
- 2020-09-04
- 1
Единицы измерения информации служат для измерения различных характеристик, связанных с информацией.
Чаще всего измерение информации касается измерения ёмкости компьютерной памяти ( запоминающих устройств ) и измерения количества данных, передаваемых по цифровым каналам связи . Реже измеряется количество информации .
Единицы измерения информации
Большой по размеру объём данных может содержать в себе очень малое количество информации. То есть объём данных и количество информации являются разными характеристиками, применяемыми в разных областях, связанных с информацией, но исторически название « количество информации » использовали в значении «объём данных», а для измерения количества информации применяли названия « информационная энтропия » и «ценность информации».
Единицы измерения ёмкости носителей и объёма данных
Применяются для измерения ёмкости носителей информации — запоминающих устройств и для измерения объёмов данных .
Единицы измерения количества информации
Применяются для измерения количества информации в объёме данных . Информационная энтропия
Первичная единица
Первичной характеристикой объёма данных является количество возможных состояний .
Первичной единицей измерения объёма данных является 1 возможное состояние (значение, код).
Вторичные единицы
Вторичной характеристикой объёма данных является разряд .
Ёмкость (объём) одного разряда может быть разной и зависит от основания применённой системы кодирования.
Ёмкости одного разряда в двоичной, троичной и десятичной системах кодирования:
Один двоичный разряд ( бит ) имеет 2 взаимоисключающих возможных состояния (значения, кода).
Один ( трит ) имеет 3 взаимоисключающих возможных состояния (значения, кода).
…
Один десятичный разряд (децит) имеет 10 взаимоисключающих возможных состояний (значений, кодов).
…
Третичные единицы
Третичными характеристиками объёма данных являются различные множества разрядов .
Ёмкость множества разрядов равна количеству возможных состояний этого множества разрядов , которое определяется в комбинаторике , равно количеству размещений с повторениями и вычисляется по формуле:
- возможных состояний (кодов, значений)
где
- — количество возможных состояний одного разряда (основание выбранной системы кодирования),
- — количество разрядов в множестве разрядов .
То есть ёмкость множества разрядов представляет собой показательную функцию от количества разрядов с основанием, равным количеству возможных состояний одного разряда .
Пример:
1 байт состоит из 8-ми ( ) двоичных разрядов ( ) и может принимать:
возможных состояний (значений, кодов).
Логарифмические единицы
Когда некоторые величины, в том числе и объём данных, представляют собой показательные функции , то, во многих случаях, удобнее пользоваться не самими величинами, а логарифмами этих величин.
Объём данных тоже можно представлять логарифмически, как логарифм количества возможных состояний .
Объём информации (объём данных) — может измеряться логарифмически. Это означает, что когда несколько объектов рассматриваются как один, количество возможных состояний перемножается , а количество информации — складывается . Не важно, идёт речь о случайных величинах в математике, регистрах цифровой памяти в технике или в квантовых системах в физике.
Для объёмов двоичных данных удобнее пользоваться двоичными логарифмами.
- возможных состояния , двоичный разряд = 1 бит
- возможных состояний , двоичных разрядов = 1 Байт ( Октет )
- возможных состояния , двоичных разрядов = 1 КилоБайт (КилоОктет)
- возможных состояний , двоичных разрядов = 1 МегаБайт (МегаОктет)
- возможных состояния , двоичных разрядов = 1 ГигаБайт (ГигаОктет)
- возможных состояний , двоичных разрядов = 1 ТераБайт (ТераОктет)
Наименьшее целое число, двоичный логарифм которого целое положительное — это 2. Соответствующая ему единица — бит — является основой исчисления информации в цифровой технике.
Для объёмов троичных данных удобнее пользоваться троичными логарифмами.
- возможных состояния , троичный разряд ( трит)
- возможных состояний , троичных разрядов ( трит ов) = 1 Трайт .
Единица, соответствующая числу 3, трит равна log 2 3≈1,585 бита.
Такая единица как нат (nat), соответствующая натуральному логарифму применяется в инженерных и научных расчётах. В вычислительной технике она практически не применяется, так как основание натуральных логарифмов не является целым числом.
Для объёмов десятичных данных удобнее пользоваться десятичными логарифмами.
- возможных состояний , десятичный разряд = 1 децит
- возможных состояний , десятичных разряда = 1 килодецит .
- возможных состояний , десятичных разрядов = 1 мегадецит .
- возможных состояний , десятичных разрядов = 1 гигадецит .
Единица, соответствующая числу 10, децит равна log 2 10≈3.322 бита.
В проводной технике связи (телеграф и телефон) и радио исторически впервые единица информации получила обозначение бод .
Единицы, производные от бита
В целых количествах двоичных разрядов (битов) количество возможных состояний равно степеням двойки.
Тетрада, полубайт, ниббл
Особое название имеют четыре двоичных разряда (4 бита) — тетрада , полу байт , ниббл , которые вмещают в себя количество информации, содержащейся в одной шестнадцатеричной цифре.
Байт
Следующей по порядку популярной единицей информации является 8 бит, или байт (о терминологических тонкостях ). Именно к байту (а не к биту) непосредственно приводятся все большие объёмы информации, исчисляемые в компьютерных технологиях.
Такие величины как машинное слово и т. п., составляющие несколько байт, в качестве единиц измерения почти никогда не используются.
Килобайт
Для измерения больших ёмкостей запоминающих устройств и больших объёмов информации, имеющих большое количество байтов, служат единицы «килобайт» = [1000] байт и «Кбайт» ( кибибайт , kibibyte) = 1024 байт (о путанице десятичных и двоичных единиц и терминов ). Такой порядок величин имеют, например:
- Сектор диска обычно равен 512 байтам то есть половине Кбайта, хотя для некоторых устройств может быть равен одному или двум кибибайт.
- Классический размер «блока» в файловых системах UNIX равен одному Кбайт (1024 байт).
- «Страница памяти» в процессорах x86 (начиная с модели Intel 80386 ) имеет размер 4096 байт, то есть 4 Кбайт.
Объём информации, получаемой при считывании дискеты «3,5″ высокой плотности» равен 1440 Кбайт (ровно); другие форматы также исчисляются целым числом Кбайт.
Мегабайт
Единицы «мегабайт» = 1000 килобайт = [1 000 000] байт и «мебибайт» (mebibyte) = 1024 Кбайт = 1 048 576 байт применяются для измерения объёмов носителей информации.
Объём адресного пространства процессора Intel 8086 был равен 1 Мбайт.
Оперативную память и ёмкость CD-ROM меряют двоичными единицами (мебибайтами, хотя их так обычно не называют), но для объёма НЖМД десятичные мегабайты были более популярны.
Современные жёсткие диски имеют объёмы, выражаемые в этих единицах минимум шестизначными числами, поэтому для них применяются гигабайты.
Гигабайт
Единицы «гигабайт» = 1000 мегабайт = [1 000 000] килобайт = [1 000 000 000] байт и «Гбайт» ( гибибайт , gibibyte) = 1024 Мбайт = 2 30 байт измеряют объём больших носителей информации, например жёстких дисков . Разница между двоичной и десятичной единицами уже превышает 7 %.
Размер 32-битного адресного пространства равен 4 Гбайт ≈ 4,295 Мбайт. Такой же порядок имеют размер DVD-ROM и современных носителей на флеш-памяти . Размеры жёстких дисков уже достигают сотен и тысяч гигабайт.
Для исчисления ещё больших объёмов информации имеются единицы терабайт и тебибайт (10 12 и 2 40 байт соответственно), петабайт и пебибайт (10 15 и 2 50 байт соответственно) и т. д.
Что такое «байт»?
В принципе, байт определяется для конкретного компьютера как минимальный шаг адресации памяти , который на старых машинах не обязательно был равен 8 битам (а память не обязательно состоит из битов — см., например: троичный компьютер ). В современной традиции, байт часто считают равным восьми битам .
В таких обозначениях как байт (русское) или B (английское) под байтом (B) подразумевается именно 8 бит, хотя сам термин «байт» не вполне корректен с точки зрения теории.
Во французском языке используются обозначения o , Ko , Mo и т. д. (от слова octet) дабы подчеркнуть, что речь идёт именно о 8 битах.
Чему равно «кило»?
Долгое время разнице между множителями 1000 и 1024 старались не придавать большого значения. Во избежание недоразумений следует чётко понимать различие между:
- двоичными кратными единицами, обозначаемыми согласно ГОСТ 8.417-2002 как «Кбайт», «Мбайт», «Гбайт» и т. д. (два в степенях кратных десяти);
- единицами килобайт , мегабайт , гигабайт и т. д., понимаемыми как научные термины (десять в степенях, кратных трём),
эти единицы по определению равны, соответственно, 10 3 , 10 6 , 10 9 байтам и т. д.
В качестве терминов для «Кбайт», «Мбайт», «Гбайт» и т. д. МЭК предлагает «кибибайт», «мебибайт», «гибибайт» и т. д., однако эти термины критикуются за непроизносимость и не встречаются в устной речи.
В различных областях информатики предпочтения в употреблении десятичных и двоичных единиц тоже различны. Причём, хотя со времени стандартизации терминологии и обозначений прошло уже несколько лет, далеко не везде стремятся прояснить точное значение используемых единиц.
В английском языке для «киби»=1024=2 10 иногда используют прописную букву K , дабы подчеркнуть отличие от обозначаемой строчной буквой приставки СИ кило . Однако, такое обозначение не опирается на авторитетный стандарт, в отличие от российского ГОСТа касательно «Кбайт».
Вариации
Примечания
- от 22 сентября 2008 на Wayback Machine (англ.)
- С точки зрения физики , величина информации (как и близкая к ней по смыслу энтропия ) безразмерна . На практике, как и при измерении безразмерных углов , пользуются различными практически удобными единицами.
- ↑ . Дата обращения: 11 июня 2008. 2 февраля 2012 года.
См. также
- 2020-09-04
- 1