Форум/Архив/Правила/2012/11
- 1 year ago
- 0
- 0
Единицы измерения информации служат для измерения различных характеристик, связанных с информацией.
Чаще всего измерение информации касается измерения ёмкости компьютерной памяти ( запоминающих устройств ) и измерения количества данных, передаваемых по цифровым каналам связи . Реже измеряется количество информации .
Большой по размеру объём данных может содержать в себе очень малое количество информации. То есть объём данных и количество информации являются разными характеристиками, применяемыми в разных областях, связанных с информацией, но исторически название « количество информации » использовали в значении «объём данных», а для измерения количества информации применяли названия « информационная энтропия » и «ценность информации».
Применяются для измерения ёмкости носителей информации — запоминающих устройств и для измерения объёмов данных .
Применяются для измерения количества информации в объёме данных . Информационная энтропия
Первичной характеристикой объёма данных является количество возможных состояний .
Первичной единицей измерения объёма данных является 1 возможное состояние (значение, код).
Вторичной характеристикой объёма данных является разряд .
Ёмкость (объём) одного разряда может быть разной и зависит от основания применённой системы кодирования.
Ёмкости одного разряда в двоичной, троичной и десятичной системах кодирования:
Один двоичный разряд ( бит ) имеет 2 взаимоисключающих возможных состояния (значения, кода).
Один ( трит ) имеет 3 взаимоисключающих возможных состояния (значения, кода).
…
Один десятичный разряд (децит) имеет 10 взаимоисключающих возможных состояний (значений, кодов).
…
Третичными характеристиками объёма данных являются различные множества разрядов .
Ёмкость множества разрядов равна количеству возможных состояний этого множества разрядов , которое определяется в комбинаторике , равно количеству размещений с повторениями и вычисляется по формуле:
где
То есть ёмкость множества разрядов представляет собой показательную функцию от количества разрядов с основанием, равным количеству возможных состояний одного разряда .
Пример:
1 байт состоит из 8-ми ( ) двоичных разрядов ( ) и может принимать:
возможных состояний (значений, кодов).
Когда некоторые величины, в том числе и объём данных, представляют собой показательные функции , то, во многих случаях, удобнее пользоваться не самими величинами, а логарифмами этих величин.
Объём данных тоже можно представлять логарифмически, как логарифм количества возможных состояний .
Объём информации (объём данных) — может измеряться логарифмически. Это означает, что когда несколько объектов рассматриваются как один, количество возможных состояний перемножается , а количество информации — складывается . Не важно, идёт речь о случайных величинах в математике, регистрах цифровой памяти в технике или в квантовых системах в физике.
Для объёмов двоичных данных удобнее пользоваться двоичными логарифмами.
Наименьшее целое число, двоичный логарифм которого целое положительное — это 2. Соответствующая ему единица — бит — является основой исчисления информации в цифровой технике.
Для объёмов троичных данных удобнее пользоваться троичными логарифмами.
Единица, соответствующая числу 3, трит равна log 2 3≈1,585 бита.
Такая единица как нат (nat), соответствующая натуральному логарифму применяется в инженерных и научных расчётах. В вычислительной технике она практически не применяется, так как основание натуральных логарифмов не является целым числом.
Для объёмов десятичных данных удобнее пользоваться десятичными логарифмами.
Единица, соответствующая числу 10, децит равна log 2 10≈3.322 бита.
В проводной технике связи (телеграф и телефон) и радио исторически впервые единица информации получила обозначение бод .
В целых количествах двоичных разрядов (битов) количество возможных состояний равно степеням двойки.
Особое название имеют четыре двоичных разряда (4 бита) — тетрада , полу байт , ниббл , которые вмещают в себя количество информации, содержащейся в одной шестнадцатеричной цифре.
Следующей по порядку популярной единицей информации является 8 бит, или байт (о терминологических тонкостях ). Именно к байту (а не к биту) непосредственно приводятся все большие объёмы информации, исчисляемые в компьютерных технологиях.
Такие величины как машинное слово и т. п., составляющие несколько байт, в качестве единиц измерения почти никогда не используются.
Для измерения больших ёмкостей запоминающих устройств и больших объёмов информации, имеющих большое количество байтов, служат единицы «килобайт» = [1000] байт и «Кбайт» ( кибибайт , kibibyte) = 1024 байт (о путанице десятичных и двоичных единиц и терминов ). Такой порядок величин имеют, например:
Объём информации, получаемой при считывании дискеты «3,5″ высокой плотности» равен 1440 Кбайт (ровно); другие форматы также исчисляются целым числом Кбайт.
Единицы «мегабайт» = 1000 килобайт = [1 000 000] байт и «мебибайт» (mebibyte) = 1024 Кбайт = 1 048 576 байт применяются для измерения объёмов носителей информации.
Объём адресного пространства процессора Intel 8086 был равен 1 Мбайт.
Оперативную память и ёмкость CD-ROM меряют двоичными единицами (мебибайтами, хотя их так обычно не называют), но для объёма НЖМД десятичные мегабайты были более популярны.
Современные жёсткие диски имеют объёмы, выражаемые в этих единицах минимум шестизначными числами, поэтому для них применяются гигабайты.
Единицы «гигабайт» = 1000 мегабайт = [1 000 000] килобайт = [1 000 000 000] байт и «Гбайт» ( гибибайт , gibibyte) = 1024 Мбайт = 2 30 байт измеряют объём больших носителей информации, например жёстких дисков . Разница между двоичной и десятичной единицами уже превышает 7 %.
Размер 32-битного адресного пространства равен 4 Гбайт ≈ 4,295 Мбайт. Такой же порядок имеют размер DVD-ROM и современных носителей на флеш-памяти . Размеры жёстких дисков уже достигают сотен и тысяч гигабайт.
Для исчисления ещё больших объёмов информации имеются единицы терабайт и тебибайт (10 12 и 2 40 байт соответственно), петабайт и пебибайт (10 15 и 2 50 байт соответственно) и т. д.
В принципе, байт определяется для конкретного компьютера как минимальный шаг адресации памяти , который на старых машинах не обязательно был равен 8 битам (а память не обязательно состоит из битов — см., например: троичный компьютер ). В современной традиции, байт часто считают равным восьми битам .
В таких обозначениях как байт (русское) или B (английское) под байтом (B) подразумевается именно 8 бит, хотя сам термин «байт» не вполне корректен с точки зрения теории.
Во французском языке используются обозначения o , Ko , Mo и т. д. (от слова octet) дабы подчеркнуть, что речь идёт именно о 8 битах.
Долгое время разнице между множителями 1000 и 1024 старались не придавать большого значения. Во избежание недоразумений следует чётко понимать различие между:
эти единицы по определению равны, соответственно, 10 3 , 10 6 , 10 9 байтам и т. д.
В качестве терминов для «Кбайт», «Мбайт», «Гбайт» и т. д. МЭК предлагает «кибибайт», «мебибайт», «гибибайт» и т. д., однако эти термины критикуются за непроизносимость и не встречаются в устной речи.
В различных областях информатики предпочтения в употреблении десятичных и двоичных единиц тоже различны. Причём, хотя со времени стандартизации терминологии и обозначений прошло уже несколько лет, далеко не везде стремятся прояснить точное значение используемых единиц.
В английском языке для «киби»=1024=2 10 иногда используют прописную букву K , дабы подчеркнуть отличие от обозначаемой строчной буквой приставки СИ кило . Однако, такое обозначение не опирается на авторитетный стандарт, в отличие от российского ГОСТа касательно «Кбайт».