Число двойной точности
- 1 year ago
- 0
- 0
Число́ одина́рной то́чности ( англ. single precision , single ) — широко распространенный компьютерный формат представления вещественных чисел, занимающий в памяти 32 бита (4 байта ). Как правило, под ним понимают формат числа с плавающей запятой стандарта IEEE 754 .
Числа одинарной точности с плавающей запятой эквивалентны по точности числу с 7-8 значащими десятичными цифрами (в среднем 7,6) в диапазоне от до примерно .
В современных компьютерах вычисления с числами с плавающей запятой поддерживаются аппаратным сопроцессором ( FPU — англ. f loating p oint u nit ). Однако в ряде вычислительных архитектур нет аппаратной поддержки чисел с плавающей запятой, и тогда работа с ними осуществляется программно.
Знак | ||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Порядок | Мантисса | |||||||||||||||||||||||||||||||
0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | = 0,15625 |
31 | 24 | 23 | 16 | 15 | 8 | 7 | 0 |
Для вычисления показателя степени из восьмиразрядного поля порядка вычитается смещение порядка, равное 127 10 = 7F 16 = 01111111 2 (то есть, 01111100 2 - 01111111 2 = 124 10 - 127 10 = -3 10 ). Так как в нормализованной двоичной мантиссе целая часть всегда равна единице, то в поле мантиссы записывается только её дробная часть,т.е. фактический размер мантиссы числа с одинарной точностью составляет 24 бита. Для вычисления мантиссы к единице добавляется дробная часть мантиссы из 23-разрядного поля дробной части мантиссы 1,01000000000000000000000 2 . Число равно произведению мантиссы со знаком на двойку в степени порядка = 1,01 2 *2 10 -3 10 = 101 2 *2 10 -5 10 = 5 10 *2 10 -5 10 = 0,15625 10 .
union {
float fl;
uint32_t dw;
} f;
int s = ( f.dw >> 31 ) ? -1 : 1; /* Знак */
int e = ( f.dw >> 23 ) & 0xFF; /* Порядок */
int m = /* Мантисса */
e ?
( f.dw & 0x7FFFFF ) | 0x800000 :
( f.dw & 0x7FFFFF ) << 1;
Результирующая формула расчёта (число одинарной точности) будет
s * (m * 2 ^ -23) * (2 ^(e-127))
.
Конвертирует целочисленное представление числа с одинарной точностью (в виде четырёх байт, младшие в начале) во встроенный тип действительных чисел Python'а.
def dw2float(dw_array):
assert (len(dw_array) == 4)
dw = int.from_bytes(dw_array, byteorder='little',signed=False)
s = -1 if (dw >> 31) == 1 \
else 1 # Знак
e = ( dw >> 23 ) & 0xFF; # Порядок
m = ((dw & 0x7FFFFF ) | 0x800000) if e != 0 \
else ((dw & 0x7FFFFF ) << 1) # Мантисса
m1 = m*(2**(-23)) # Мантисса в float
return s*m1*(2**(e-127))
0.15625
10
в формате float записывается как
3E200000
16
, что эквивалентно четырём байтам: [0x00,0x00,0x20,0x3E]. Вывод программы:
Эти примеры представлены в шестнадцатеричном виде чисел с плавающей запятой. Они включают знаковый бит, порядок и мантиссу.
In[1]: dw2float([0x00,0x00,0x20,0x3E]) Out[1]: 0.15625 In[2]: dw2float([0x00,0x00,0x20,0xBE]) Out[2]: -0.15625
3f80 0000 = 1 c000 0000 = −2 7f7f ffff ≈ 3.40282346639 × 1038 (максимальное одинарной точности) 0000 0001 = 2-149 ≈ 1.40129846432 × 10−45 (Минимальное положительное число одинарной точности — денормализованное) 0080 0000 = 2-126 ≈ 1.17549435082 × 10−38 (Минимальное нормализованное положительное число одинарной точности) 0000 0000 = 0 8000 0000 = −0 7f80 0000 = infinity ff80 0000 = −infinity 3eaa aaab ≈ 1/3
Обычно при переводе числовых констант в формат float делается округление. Например, число 1/3 округляется вверх.
|
В статье
не хватает
ссылок на источники
(см.
рекомендации по поиску
).
|
Для улучшения этой статьи
желательно
:
|