Interested Article - SHA-1

Secure Hash Algorithm 1 — алгоритм криптографического хеширования . Описан в . Для входного сообщения произвольной длины (максимум $2^{64}-1$ бит, что примерно равно 2 эксабайта ) алгоритм генерирует 160-битное (20 байт) хеш-значение, называемое также дайджестом сообщения, которое обычно отображается как шестнадцатеричное число длиной в 40 цифр. Используется во многих криптографических приложениях и протоколах. Также рекомендован в качестве основного для государственных учреждений в США . Принципы, положенные в основу SHA-1, аналогичны тем, которые использовались Рональдом Ривестом при проектировании MD4 .

История

В 1993 году NSA совместно с NIST разработали алгоритм безопасного хеширования (сейчас известный как SHA-0) (опубликован в документе FIPS PUB 180) для стандарта безопасного хеширования. Однако вскоре NSA отозвало данную версию, сославшись на обнаруженную ими ошибку, которая так и не была раскрыта. И заменило его исправленной версией, опубликованной в 1995 году в документе FIPS PUB 180-1. Эта версия и считается тем, что называют SHA-1. Позже, на конференции в 1998 году два французских исследователя представили атаку на алгоритм SHA-0, которая не работала на алгоритме SHA-1. Возможно, это и была ошибка, открытая NSA .

Описание алгоритма

SHA-1 реализует хеш-функцию , построенную на идее функции сжатия. Входами функции сжатия являются блок сообщения длиной 512 бит и выход предыдущего блока сообщения. Выход представляет собой значение всех хеш-блоков до этого момента. Иными словами, хеш-блок $M_{i}$ равен $h_{i}=f(M_{i},h_{i-1})$ . Хеш-значением всего сообщения является выход последнего блока.

Инициализация

Исходное сообщение разбивается на блоки по 512 бит в каждом. Последний блок дополняется до длины, кратной 512 бит. Сначала добавляется 1 (бит), а потом — нули, чтобы длина блока стала равной 512 — 64 = 448 бит. В оставшиеся 64 бита записывается длина исходного сообщения в битах (в big-endian формате). Если последний блок имеет длину более 447, но менее 512 бит, то дополнение выполняется следующим образом: сначала добавляется 1 (бит), затем — нули вплоть до конца 512-битного блока; после этого создается ещё один 512-битный блок, который заполняется вплоть до 448 бит нулями, после чего в оставшиеся 64 бита записывается длина исходного сообщения в битах (в big-endian формате). Дополнение последнего блока осуществляется всегда, даже если сообщение уже имеет нужную длину.

Инициализируются пять 32-битовых переменных.

A = 0x67452301
B = 0xEFCDAB89
C = 0x98BADCFE
D = 0x10325476
E = 0xC3D2E1F0

Определяются четыре нелинейные операции и четыре константы.

$F_{t}(m,l,k)=(m\wedge l)\vee (\neg {m}\wedge k)$	$K_{t}$ = 0x5A827999	0≤t≤19
$F_{t}(m,l,k)=m\oplus l\oplus k$	$K_{t}$ = 0x6ED9EBA1	20≤t≤39
$F_{t}(m,l,k)=(m\wedge l)\vee (m\wedge k)\vee (l\wedge k)$	$K_{t}$ = 0x8F1BBCDC	40≤t≤59
$F_{t}(m,l,k)=m\oplus l\oplus k$	$K_{t}$ = 0xCA62C1D6	60≤t≤79

Главный цикл

Главный цикл итеративно обрабатывает каждый 512-битный блок. В начале каждого цикла вводятся переменные a, b, c, d, e, которые инициализируются значениями A, B, C, D, E, соответственно. Блок сообщения преобразуется из 16 32-битовых слов $M_{i}$ в 80 32-битовых слов $W_{j}$ по следующему правилу:

 $W_{t}=M_{t}$                                       при 0≤t≤15

 $W_{t}$  = ( $W_{t}$ _-3  $\oplus$   $W_{t}$ _-8  $\oplus$   $W_{t}$ _-14  $\oplus$   $W_{t}$ _-16) << 1     при 16≤t≤79

, где «<<» — это циклический сдвиг влево.

для  $t$  от 0 до 79 

	temp = (a<<5) +  $F_{t}$ (b,c,d) + e +  $W_{t}+K_{t}$    

	e = d 

	d = c 

	c = b<<30                                

	b = a 

	a = temp

, где «+» — сложение беззнаковых 32-битных целых чисел с отбрасыванием избытка (33-го бита).

После этого к A, B, C, D, E прибавляются значения a, b, c, d, e, соответственно. Начинается следующая итерация.

Итоговым значением будет объединение пяти 32-битовых слов (A, B, C, D, E) в одно 160-битное хеш-значение.

Псевдокод SHA-1

Псевдокод алгоритма SHA-1 следующий:

 Замечание: Все используемые переменные 32 бита.

Инициализация переменных:
h0 = 0x67452301
h1 = 0xEFCDAB89
h2 = 0x98BADCFE
h3 = 0x10325476
h4 = 0xC3D2E1F0

Предварительная обработка:
Присоединяем бит '1' к сообщению
Присоединяем k битов '0', где k наименьшее число ≥ 0 такое, что длина получившегося сообщения
(в битах) сравнима по модулю  512 с 448 (length mod 512 == 448)
Добавляем длину исходного сообщения (до предварительной обработки) как целое 64-битное
Big-endian число, в битах.

В процессе сообщение разбивается последовательно по 512 бит:
for перебираем все такие части
    разбиваем этот кусок на 16 частей, слов по 32-бита (big-endian) w[i], 0 <= i <= 15

    16 слов по 32-бита дополняются до 80 32-битовых слов:
    for i from 16 to 79
        w[i] = (w[i-3] xor w[i-8] xor w[i-14] xor w[i-16]) циклический сдвиг влево 1

    Инициализация хеш-значений этой части:
    a = h0
    b = h1
    c = h2
    d = h3
    e = h4

    Основной цикл:
    for i from 0 to 79
        if 0 ≤ i ≤ 19 then
            f = (b and c) or ((not b) and d)
            k = 0x5A827999
        else if 20 ≤ i ≤ 39 then
            f = b xor c xor d
            k = 0x6ED9EBA1
        else if 40 ≤ i ≤ 59 then
            f = (b and c) or (b and d) or (c and d)
            k = 0x8F1BBCDC
        else if 60 ≤ i ≤ 79 then
            f = b xor c xor d
            k = 0xCA62C1D6

        temp = (a leftrotate 5) + f + e + k + w[i]
        e = d
        d = c
        c = b leftrotate 30
        b = a
        a = temp

    Добавляем хеш-значение этой части к результату:
    h0 = h0 + a
    h1 = h1 + b 
    h2 = h2 + c
    h3 = h3 + d
    h4 = h4 + e

Итоговое хеш-значение(h0, h1, h2, h3, h4 должны быть преобразованы к big-endian):
digest = hash = h0 append h1 append h2 append h3 append h4

Вместо оригинальной формулировки FIPS PUB 180-1 приведены следующие эквивалентные выражения и могут быть использованы на компьютере f в главном цикле:

(0  ≤ i ≤ 19): f = d xor (b and (c xor d))                (альтернатива 1)
(0  ≤ i ≤ 19): f = (b and c) xor ((not b) and d)          (альтернатива 2)
(0  ≤ i ≤ 19): f = (b and c) + ((not b) and d)            (альтернатива 3)
 
(40 ≤ i ≤ 59): f = (b and c) or (d and (b or c))          (альтернатива 1)
(40 ≤ i ≤ 59): f = (b and c) or (d and (b xor c))         (альтернатива 2)
(40 ≤ i ≤ 59): f = (b and c) + (d and (b xor c))          (альтернатива 3)
(40 ≤ i ≤ 59): f = (b and c) xor (b and d) xor (c and d)  (альтернатива 4)

Примеры

Ниже приведены примеры хешей SHA-1. Для всех сообщений подразумевается использование кодировки UTF-8 .

Хеш панграммы на русском:

SHA-1("В чащах юга жил бы цитрус? Да, но фальшивый экземпляр!")
  = 9e32295f 8225803b b6d5fdfc c0674616 a4413c1b

Хеш панграммы на английском:

SHA-1("The quick brown fox jumps over the lazy dog") 
  = 2fd4e1c6 7a2d28fc ed849ee1 bb76e739 1b93eb12

SHA-1("sha")
  = d8f45903 20e1343a 915b6394 170650a8 f35d6926

Небольшое изменение исходного текста (одна буква в верхнем регистре) приводит к сильному изменению самого хеша. Это происходит вследствие лавинного эффекта .

SHA-1("Sha") 
  = ba79baeb 9f10896a 46ae7471 5271b7f5 86e74640

Даже для пустой строки вычисляется нетривиальное хеш-значение.

SHA-1("") 
  = da39a3ee 5e6b4b0d 3255bfef 95601890 afd80709

Криптоанализ

Криптоанализ хеш-функций направлен на исследование уязвимости для различного вида атак. Основные из них:

нахождение коллизий — ситуация, когда двум различным исходным сообщениям соответствует одно и то же хеш-значение.
нахождение прообраза — исходного сообщения — по его хешу.

При решении методом «грубой силы» :

первая задача требует в среднем 2 ^160/2 = 2 ⁸⁰ операций, если использовать атаку Дней рождения .
вторая требует 2 ¹⁶⁰ операций.

От устойчивости хеш-функции к нахождению коллизий зависит безопасность электронной цифровой подписи с использованием данного хеш-алгоритма. От устойчивости к нахождению прообраза зависит безопасность хранения хешей паролей для целей аутентификации .

В январе 2005 года Винсент Рэймен и Elisabeth Oswald опубликовали сообщение об атаке на усечённую версию SHA-1 (53 раунда вместо 80), которая позволяет находить коллизии меньше, чем за 2 ⁸⁰ операций.

В феврале 2005 года , и (Xiaoyun Wang, Yiqun Lisa Yin, Hongbo Yu) представили атаку на полноценный SHA-1, которая требует менее 2 ⁶⁹ операций.

О методе авторы пишут:

Мы представляем набор стратегий и соответствующих методик, которые могут быть использованы для устранения некоторых важных препятствий в поиске коллизий в SHA-1. Сначала мы ищем близкие к коллизии дифференциальные пути, которые имеют небольшой «вес Хамминга» в «векторе помех», где каждый бит представляет 6-шаговую локальную коллизию. Потом мы соответствующим образом корректируем дифференциальный путь из первого этапа до другого приемлемого дифференциального пути, чтобы избежать неприемлемых последовательных и усеченных коллизий. В конце концов мы преобразуем два одноблоковых близких к коллизии дифференциальных пути в один двухблоковый коллизионный путь с удвоенной вычислительной сложностью.

Оригинальный текст (англ.)

We introduce a set of strategies and corresponding techniques that can be used to remove some major obstacles in collision search for SHA-1. Firstly, we look for a near-collision differential path which has low Hamming weight in the "disturbance vector" where each 1-bit represents a 6-step local collision. Secondly, we suitably adjust the differential path in the first round to another possible differential path so as to avoid impossible consecutive local collisions and truncated local collisions. Thirdly, we transform two one-block near-collision differential paths into a twoblock collision differential path with twice the search complexity.

Также они заявляют:

В частности, наш анализ основан на оригинальной дифференциальной атаке на SHA-0, «near-collision» атаке на SHA-0, мультиблоковой методике, а также методике модификации исходного сообщения, использованных при атаках поиска коллизий на HAVAL -128, MD4 , RIPEMD и MD5 .

Оригинальный текст (англ.)

In particular, our analysis is built upon the original differential attack on SHA-0, the near collision attack on SHA-0, the multi-block collision techniques, as well as the message modification techniques used in the collision search attacks on HAVAL-128, MD4, RIPEMD and MD5.

Статья с описанием алгоритма была опубликована в августе 2005 года на конференции .

В этой же статье авторы опубликовали атаку на усечённый SHA-1 (58 раундов), которая позволяет находить коллизии за 2 ³³ операций.

В августе 2005 года на 2005 эти же специалисты представили улучшенную версию атаки на полноценный SHA-1, с вычислительной сложностью в 2 ⁶³ операций. В декабре 2007 года детали этого улучшения были проверены Мартином Кохраном.

Кристоф де Каньер и Кристиан Рехберг позже представили усовершенствованную версию атаки на SHA-1, за что были удостоены награды за лучшую статью на конференции 2006 . Ими была представлена двухблоковая коллизия на 64-раундовый алгоритм с вычислительной сложностью около 2 ³⁵ операций.

Существует масштабный исследовательский проект, стартовавший в технологическом университете австрийского города Грац , который : «… использует компьютеры, соединенные через Интернет , для проведения исследований в области криптоанализа. Вы можете поучаствовать в проекте, загрузив и запустив бесплатную программу на своем компьютере.»

, глава исследовательского отдела в «лаборатории RSA », предсказывает, что первая атака по нахождению прообраза будет успешно осуществлена в ближайшие 5—10 лет.

Ввиду того, что теоретические атаки на SHA-1 оказались успешными, NIST планирует полностью отказаться от использования SHA-1 в цифровых подписях.

Из-за блочной и итеративной структуры алгоритмов, а также отсутствия специальной обработки в конце хеширования, все хеш-функции семейства SHA уязвимы для атак удлинением сообщения и коллизиям при частичном хешировании сообщения. Эти атаки позволяют подделывать сообщения, подписанные только хешем — $SHA(message||key)$ или $SHA(key||message)$ — путём удлинения сообщения и пересчёту хеша без знания значения ключа. Простейшим исправлением, позволяющим защититься от этих атак, является двойное хеширование — $SHA_{d}(message)=SHA(SHA(0^{b}||message))$ ( $0^{b}$ — блок нулей той же длины, что и блок хеш-функции).

2 ноября 2007 года NIST анонсировало конкурс по разработке нового алгоритма SHA-3 , который продлился до 2012 года .

SHAppening

8 октября 2015 Marc Stevens, Pierre Karpman, и Thomas Peyrin опубликовали атаку на функцию сжатия алгоритма SHA-1, которая требует всего 2 ⁵⁷ вычислений.

Реальный взлом: SHAttered (нахождение коллизий)

23 февраля 2017 года специалисты из Google и CWI объявили о практическом взломе алгоритма, опубликовав 2 PDF -файла с одинаковой контрольной суммой SHA-1. Это потребовало перебора $9\times 10^{18}$ вариантов, что заняло бы 110 лет на 1 GPU .

Сравнение SHA-1 с другими алгоритмами

Сравнение с MD5

И MD5 , и SHA-1 являются, по сути, улучшенными продолжениями MD4 .

Сходства:

Четыре этапа.
Каждое действие прибавляется к ранее полученному результату.
Размер блока обработки, равный 512 бит.
Оба алгоритма выполняют сложение по модулю 2 ³² , они рассчитаны на 32-битную архитектуру.

Различия:

В SHA-1 на четвёртом этапе используется та же функция f, что и на втором этапе.
В MD5 в каждом действии используется уникальная прибавляемая константа. В SHA-1 константы используются повторно для каждой из четырёх групп.
В SHA-1 добавлена пятая переменная.
SHA-1 использует циклический код исправления ошибок.
В MD5 четыре сдвига, используемые на каждом этапе, отличаются от значений, используемых на предыдущих этапах. В SHA на каждом этапе используется постоянное значение сдвига.
В MD5 — четыре различных элементарных логических функции, в SHA-1 — три.
В MD5 длина дайджеста составляет 128 бит, в SHA-1 — 160 бит.
SHA-1 содержит больше раундов (80 вместо 64) и выполняется на 160-битном буфере по сравнению со 128-битным буфером MD5 . Таким образом, SHA-1 должен выполняться приблизительно на 25 % медленнее, чем MD5 на той же аппаратуре.

Брюс Шнайер делает следующий вывод : «SHA-1 — это MD4 с добавлением расширяющего преобразования, дополнительного этапа и улучшенным лавинным эффектом. MD5 — это MD4 с улучшенным битовым хешированием, дополнительным этапом и улучшенным лавинным эффектом.»

Сравнение с ГОСТ Р 34.11-94

Ряд отличительных особенностей ГОСТ Р 34.11-94 :

При обработке блоков используются преобразования по алгоритму ГОСТ 28147—89 ;
Обрабатывается блок длиной 256 бит, и выходное значение тоже имеет длину 256 бит.
Применены меры борьбы против поиска коллизий, основанном на неполноте последнего блока.
Обработка блоков происходит по алгоритму шифрования ГОСТ 28147—89 , который содержит преобразования на S-блоках , что существенно осложняет применение метода дифференциального криптоанализа к поиску коллизий алгоритма ГОСТ Р 34.11-94 . Это существенный плюс по сравнению с SHA-1.
Теоретическая криптостойкость ГОСТ Р 34.11-94 равна 2 ¹²⁸ , что во много раз превосходит 2 ⁸⁰ для SHA-1.

Сравнение с другими SHA

В таблице «промежуточный размер хеша» означает «размер внутренней хеш-суммы» после каждой итерации.

Вариации алгоритма		Размер выходного хеша (бит)	Промежуточный размер хеша (бит)	Размер блока (бит)	Максимальная длина входного сообщения (бит)	Размер слова (бит)	Количество раундов	Используемые операции	Найденные коллизии
SHA-0		160	160	512	2 ⁶⁴ − 1	32	80	+,and, or, xor, rotl	Есть
SHA-1		160	160	512	2 ⁶⁴ − 1	32	80	+,and, or, xor, rotl	2 ⁵² операций
SHA-2	SHA-256/224	256/224	256	512	2 ⁶⁴ − 1	32	64	+,and, or, xor, shr, rotr	Нет
SHA-2	SHA-512/384	512/384	512	1024	2 ¹²⁸ − 1	64	80	+,and, or, xor, shr, rotr	Нет

Использование

Хеш-функции используются в системах контроля версий , системах электронной подписи, а также для построения кодов аутентификации .

SHA-1 является наиболее распространенным из всего семейства и применяется в различных широко распространенных криптографических приложениях и алгоритмах.

SHA-1 используется в следующих приложениях:

S/MIME — дайджесты сообщений.
SSL — дайджесты сообщений.
IPSec — для алгоритма проверки целостности в соединении «точка-точка».
SSH — для проверки целостности переданных данных.
PGP — для создания электронной цифровой подписи.
Git — для идентификации каждого объекта по SHA-1-хешу от хранимой в объекте информации.
Mercurial — для идентификации ревизий
BitTorrent — для проверки целостности загружаемых данных.

SHA-1 является основой блочного шифра SHACAL .

Отказ от использования

Компания Google давно выразила своё недоверие SHA-1, особенно для использования этой функции для подписи сертификатов TLS . Ещё в 2014 году, вскоре после публикации работы Марка Стивенса, группа разработчиков Chrome объявила о постепенном отказе от использования SHA-1.

С 25 апреля 2016 года Яндекс . Почта перестала поддерживать старые почтовые программы, использующие SHA-1 .

Примечания

(англ.) . — Статья китайских исследователей о взломе SHA-1. Архивировано из 23 августа 2011 года.
(англ.) . Дата обращения: 4 октября 2017. 26 июля 2008 года.
(англ.) . — Исследовательский проект технологического университета Граца. 7 ноября 2008 года.
(англ.) . — Официальный комментарий NIST по поводу атак на SHA-1. Архивировано из 13 октября 2012 года.
(англ.) . Архивировано из 13 октября 2012 года. , John Wiley & Sons, 2010. ISBN 978-0-470-47424-2
(англ.) . — Конкурс на разработку SHA-3. Архивировано из 13 октября 2012 года.
. Дата обращения: 9 марта 2017. 10 марта 2017 года.
. yandex.ru. Дата обращения: 7 апреля 2016. 20 апреля 2016 года.

Литература

Шнайер Б. Прикладная криптография. Протоколы, алгоритмы, исходные тексты на языке Си = Applied Cryptography. Protocols, Algorithms and Source Code in C. — М. : Триумф, 2002. — 816 с. — 3000 экз. — ISBN 5-89392-055-4 .
Нильс Фергюсон , Брюс Шнайер . Практическая криптография = Practical Cryptography: Designing and Implementing Secure Cryptographic Systems. — М. : Диалектика, 2004. — 432 с. — 3000 экз. — ISBN 5-8459-0733-0 , ISBN 0-4712-2357-3 .

Ссылки

(англ.)
от 4 марта 2005 на Wayback Machine (англ.)
от 5 мая 2017 на Wayback Machine (англ.)
(англ.)
1 декабря 2012 года. (англ.)
от 26 декабря 2008 на Wayback Machine (англ.)

[1] (англ.) . — Статья китайских исследователей о взломе SHA-1. Архивировано из 23 августа 2011 года.

[2] (англ.) . Дата обращения: 4 октября 2017. 26 июля 2008 года.

[3] (англ.) . — Исследовательский проект технологического университета Граца. 7 ноября 2008 года.

[4] (англ.) . — Официальный комментарий NIST по поводу атак на SHA-1. Архивировано из 13 октября 2012 года.

[5] (англ.) . Архивировано из 13 октября 2012 года. , John Wiley & Sons, 2010. ISBN 978-0-470-47424-2

[6] (англ.) . — Конкурс на разработку SHA-3. Архивировано из 13 октября 2012 года.

[7] . Дата обращения: 9 марта 2017. 10 марта 2017 года.

[8] . yandex.ru. Дата обращения: 7 апреля 2016. 20 апреля 2016 года.

Хеш-функции
Общего назначения	Adler-32 CRC Контрольная сумма Флетчера FNV MurmurHash2 PJW-32 TTH - Дерево хешей Jenkins hash Хеш-сумма
Криптографические	ГОСТ Р 34.11-94 Стрибог BelT BLAKE Blue Midnight Wish CubeHash ECHO Edonkey2k FSB Fugue Grøstl HAVAL Hamsi JH Kupyna LM-хеш Luffa MASH-1 MD2 MD4 MD5 MD6 N-Hash RIPEMD-128 RIPEMD-160 RIPEMD-256 RIPEMD-320 SHA-2 SHA-3 (Keccak) SHABAL SHAvite-3 SIMD SWIFFT Skein Snefru Tiger Whirlpool
Функции формирования ключа	bcrypt PBKDF2 scrypt Argon2 Lyra2
Контрольное число ( сравнение )	Контрольная сумма Алгоритм Верхуффа Алгоритм Дамма Алгоритм Луна Штрих-код Банковских счетов Банковских карт ISIN СНИЛС ОКПО ИНН ОКАТО ISBN ОГРН и ОГРНИП VIN
Применение хешей	Сравнение контрольных чисел Коллизия хеш-функции Протоколы аутентификации Сравнение штрихкодов Криптография Magnet-ссылка Подпись Меркла ed2k URN

История

Описание алгоритма

Инициализация

Главный цикл

Псевдокод SHA-1

Примеры

Криптоанализ

SHAppening

Реальный взлом: SHAttered (нахождение коллизий)

Сравнение SHA-1 с другими алгоритмами

Сравнение с MD5

Сравнение с ГОСТ Р 34.11-94

Сравнение с другими SHA

Использование

Отказ от использования

Примечания

Литература

Ссылки

SHA-1

Sham 69

Shodensha

Same as SHA-1

SPL: Sha Po Lang

SHA-1

SHA-2

SHA-2

SHA-3

SHA

SHA-2

SHA-1

Sha-La-La-La-Lee

SHA-3 (конкурс)

Zumrasha

Cashaa

Mishae

Dynasha

Share-alike

Shahed 129

Shakespeare (язык программирования)

PashaNikoros

Parishan

Parishan

Текст лицензии Creative Commons Attribution-ShareAlike 4.0 International

Текст лицензии Creative Commons Attribution-ShareAlike 4.0 International

Guest Kashapov

Guest Kashapov

Sham 69

Shodensha

Shamiryan

New Shapes

Shadow of Your Love

Rolls-Royce Goshawk

Sharks

Ashampoo AntiSpyWare

1235gosha

Ashampoo Core Tuner

Chicken Shack

Shanghai ATP Masters 1000 2019 — одиночный разряд

Shahed 136

C Sharp

Bitshares