Генератор псевдослучайных чисел
- 1 year ago
- 0
- 0
Генератор псевдослучайных чисел ( ГПСЧ , англ. pseudorandom number generator , PRNG ) — алгоритм , порождающий последовательность чисел , элементы которой почти независимы друг от друга и подчиняются заданному распределению (обычно дискретному равномерному ).
Современная информатика широко использует псевдослучайные числа в самых разных приложениях — от метода Монте-Карло и имитационного моделирования до криптографии . При этом от качества используемых ГПСЧ напрямую зависит качество получаемых результатов. Это обстоятельство подчёркивает известный афоризм математика ORNL : « генерация случайных чисел слишком важна, чтобы оставлять её на волю случая ».
Источники настоящих случайных чисел найти крайне трудно. Физические шумы , такие, как детекторы событий ионизирующей радиации , дробовой шум в резисторе или космическое излучение , могут быть такими источниками. Однако применяются такие устройства в приложениях сетевой безопасности редко. Сложности также вызывают грубые атаки на подобные устройства.
У физических источников случайных чисел существует ряд недостатков:
В то же время случайные числа, получаемые из физического источника, могут использоваться в качестве порождающего элемента (англ. seed) для программных ГПСЧ. Такие комбинированные генераторы применяются в криптографии, лотереях, игровых автоматах.
Джон фон Нейман считал неприемлемым использование физических генераторов случайных чисел в вычислительной технике, так как при возникновении необходимости проверки вычислений повтор предыдущих действий требовал бы воспроизведение случайного числа, в то время как генерация нового случайного числа недопустима. Предварительная запись и хранение сгенерированных случайных чисел предполагало бы возможность их считывания. Механизм считывания данных являлся одним из самых слабых звеньев вычислительных машин 1940-х годов. Джон фон Нейман привёл следующий метод середины квадрата получения десятизначных псевдослучайных чисел:
Например, для 4-значных чисел, начиная с 1234, получаем , где берём средние 4 цифры (дописав ноль в начале, если это необходимо). Затем возводим полученное число в квадрат , и так далее. Недостатком данного метода является ограниченность множества ПСЧ из-за того, что последовательность зацикливается — .
В 1951 году Д. Г. Лемер предложил линейный конгруэнтный метод , суть которого заключается в задании последовательности целых чисел рекурсивной формулой где — целые и удовлетворяют следующим условиям: . Недостатком данного метода является зависимость от , так как , а также то, что ПСЧ зацикливается.
Большинство детерминированных ГПСЧ соответствуют структуре, предложенной П. Лекуером в 1994 году: , где — это конечный набор состояний, — вероятностное распределение в пространстве состояний , используемое для выбора начального состояния (англ. seed), — функция перехода, — пространство выходных значений, . Обычно , а состояние генератора задается рекуррентной формулой для . Выходное значение генератора ; — последовательность псевдослучайных чисел. Так как конечно, то должны существовать некоторые конечные и такие, что . Значит, для всех будут выполняться условия и , потому что функции и детерминированные. Таким образом, получается, что последовательность периодическая. Периодом ГПСЧ называется минимальное положительное .
Наиболее распространены линейный конгруэнтный метод , метод Фибоначчи с запаздываниями , регистр сдвига с линейной обратной связью , регистр сдвига с обобщённой обратной связью .
Из современных ГПСЧ широкое распространение также получил « вихрь Мерсенна », предложенный в 1997 году Мацумото и Нисимурой. Его достоинствами являются колоссальный период (2 19937 −1), равномерное распределение в 623 измерениях (линейный конгруэнтный метод даёт более или менее равномерное распределение максимум в 5 измерениях), быстрая генерация случайных чисел (в 2-3 раза быстрее, чем стандартные ГПСЧ, использующие линейный конгруэнтный метод). Однако существуют алгоритмы, распознающие последовательность, порождаемую вихрем Мерсенна, как неслучайную.
Генератор псевдослучайных чисел включён в состав многих современных процессоров , например, RdRand входит в набор инструкций IA-32.
Разновидностью ГПСЧ являются ГПСБ (PRBG) — генераторы псевдо-случайных бит, а также различных поточных шифров .
Ниже приведен список генераторов, которые исторически отметились в области изучения процесса генерации псевдослучайных чисел, либо благодаря своей исторической значимости, либо благодаря тому, что были инновационной моделью для своих эпох. Более того, несмотря на то, что это ГПСЧ, некоторые из них могут быть применимы в области криптографии.
Алгоритм | Авторы | Ссылки | Описание | |
---|---|---|---|---|
Middle-square / Метод середины квадрата | Джон Фон Нейман | 1946 | ГПСЧ, который считается низкокачественным, но имеет большое историческое значение, поскольку является одним из первых алгоритмов. | |
Lehmer генератор / Линейный конгруэнтный метод | D. H. Lehmer | 1951 | Также известен как метод мультипликативных линейных конгруэнций и имеет большое влияние в этой области исследований. Он также известен как линейный конгруэнтный метод, основа которого со временем усовершенствовалась. | |
Генератор Фибоначчи с запаздыванием | G. J. Mitchell; D. P. Moore | 1958 | Очень влиятельный алгоритм в области изучения процессов генерации случайных чисел, вдохновивший других последующих великих авторов, таких как G. Marsaglia создатель теста на качество случайных чисел под названием "Diehard", например. | |
Регистр сдвига с линейной обратной связью (LFSR) / Генератор Tausworthe | R. C. Tausworthe | 1965 | Генератор, конструкция которого повлияла на многие другие последующие ГПСЧ. Поэтому очень исторически важен. Также известен как генератор Таusworthe. | |
Wichmann & Hill генератор | B. A. Wichmann; D. I. Hill | 1982 | Комбинация из трех небольших LCG, подходящих для 16-битных процессоров. Широко используется во многих программах, например, он использовался в Excel 2003 и некоторых более поздних версиях для функции RAND в Excel и был генератором по умолчанию в языке Python до версии 2.2. | |
Rule 30 | Вольфрам, Стивен | 1983 | Генератор на основе клеточных автоматов. | |
Генератор Blum-Blum-Shub / Алгоритм Блюм — Блюма — Шуба | Блюм, Мануэль ; L. Blum; M. Shub | 1986 | Считается одним из самых безопасных генераторов с криптографической точки зрения, в основном благодаря внедрению в его формулу исследований и концепций, взятых из теории чисел. За этот алгоритм Блюм, Мануэль был удостоен премии Алана Тьюринга 1995 года. | |
Park-Miller генератор | S. K. Park; K. W. Miller | 1988 | Конкретная реализация генератора Лемера, широко используемая, поскольку она включена в C++ в виде функции minstd_rand0, начиная с C++11. | |
ACORN | R. S. Wikramaratna | 1989 | Его название происходит от английского акронима ACORN, который расшифровывается как ″Аддитивное конгруэнтное случайное число″. | |
MIXMAX | G. K. Savvidy; N. G. Ter-Arutyunyan-Savvidy | 1991 | Это генератор, принадлежащий к классу матричных конгруэнтных линейных генераторов, обобщение метода линейных конгруэнций. Логика семейства генераторов MIXMAX основана на результатах эргодической теории и классической механики. | |
Add-with-carry | G. Marsaglia | 1991 | Модификация генераторов Фибоначчи с запаздыванием. | |
Subtract-with-borrow | G. Marsaglia; A. Zaman | 1991 | Алгоритм, полученный на основе генераторов Фибоначчи с запаздыванием. | |
ISAAC | R. J. Jenkins Jr. | 1993 | Генератор криптографически защищенных криптографических данных (CSPRNG), разработанный Робертом Дж. Дженкинсом. | |
Вихрь Мерсенна (Mersenne Twister, MT | M. Matsumoto; T. Nishimura | 1996 | Это, вероятно, самый известный генератор в этом списке, в основном потому, что это алгоритм, реализованный в функции RAND языков программирования Python и R, в дополнение к его сильному присутствию в электронных играх, таких как Pro Evolution Soccer (PES). | |
Xorshift | G. Marsaglia | 2003 | Это очень быстрый подтип генераторов LFSR. Марсалья также предложил в качестве улучшения генератор xorwow, в котором выход генератора xorshift суммируется с последовательностью Вейля. Генератор xorwow является генератором по умолчанию в библиотеке CURAND интерфейса прикладного программирования nVidia CUDA для графических процессоров. | |
Алгоритм Fortuna | Шнайер, Брюс ; Нильс Фергюсон | 2003 | Алгоритм считается криптографически безопасным. CSPRNG, хорошо известный тем, что был внедрен в системы и продукты Apple. | |
Well equidistributed long-period linear (WELL) | F. Panneton; P. L'Ecuyer; M. Matsumoto | 2006 | Алгоритм, известный как дополнение к Mersenne Twister (MT), намеренно стремящийся скрыть его слабые стороны. | |
Усовершенствованная система рандомизации (ARS) | J. Salmon; M. Moraes; R. Dror; D. Shaw | 2011 | Упрощенная версия блочного шифра AES, обеспечивающая очень высокую производительность на системе, поддерживающей AES-NI. | |
Threefry | J. Salmon, M. Moraes, R. Dror and D. Shaw | 2011 | Упрощенная версия блочного шифра Threefish, подходящая для реализации на GPU. | |
J. Salmon, M. Moraes, R. Dror and D. Shaw | 2011 | Упрощение и модификация блочного шифра Threefish с добавлением S-box. | ||
Пермутированный конгруэнциальный генератор (PCG) | M. E. O'Neill | 2014 | Модель, полученная с помощью линейного конгруэнтного метода. | |
Генератор битов случайного цикла (RCB) | R. Cookman | 2016 | RCB описывается как генератор битовых шаблонов, созданный для преодоления некоторых недостатков Вихрь Мерсенна (MT) и ограничения короткого периода/длины бита генераторов сдвигов/модулей. | |
Middle Square Weyl Sequence RNG | B. Widynski | 2017 | Разновидность оригинального метода средних квадратов Джона фон Неймана. | |
Xoroshiro128+ | D. Blackman; S. Vigna | 2018 | Модификация генератора Xorshift Г. Марсальи, одного из самых быстрых генераторов на современных 64-битных процессорах. Родственными генераторами являются xoroshiro128**, xoshiro256+ и xoshiro256***. | |
64-bit MELG (MELG-64) | S. Harase; T. Kimoto | 2018 | Реализация 64-битных линейных генераторов F2 с первичным периодом Мерсенна. | |
Squares RNG | B. Widynski | 2020 | Основанная на счетчике версия Middle Square Weyl Sequence RNG. По конструкции похож на Philox, но работает значительно быстрее. | |
Itamaracá (Ita) | D. H. Pereira | 2021 | Известен как первый алгоритм PRNG, основанный на функции абсолютного значения. Itamaracá также является простой и быстрой моделью, которая генерирует апериодические последовательности случайных чисел. |
Альтернативным решением является создание набора из большого количества случайных чисел и опубликование его в некотором словаре , называемом « одноразовым блокнотом ». Тем не менее, и такие наборы обеспечивают очень ограниченный источник чисел по сравнению с тем количеством, которое требуется приложениям сетевой безопасности. Хотя данные наборы действительно обеспечивают статистическую случайность, они недостаточно безопасны, так как злоумышленник может получить копию словаря.
Никакой детерминированный алгоритм не может генерировать полностью случайные числа, он может только аппроксимировать некоторые их свойства. Как сказал Джон фон Нейман , « всякий, кто питает слабость к арифметическим методам получения случайных чисел, грешен вне всяких сомнений ».
Любой ГПСЧ с ограниченными ресурсами рано или поздно зацикливается — начинает повторять одну и ту же последовательность чисел. Длина циклов ГПСЧ зависит от самого генератора и составляет около , где — размер внутреннего состояния в битах, хотя линейные конгруэнтные и РСЛОС -генераторы обладают максимальными циклами порядка . Если порождаемая последовательность ГПСЧ сходится к слишком коротким циклам, то такой ГПСЧ становится предсказуемым и непригодным для практических приложений.
Большинство простых арифметических генераторов хотя и обладают большой скоростью, но страдают от многих серьёзных недостатков:
В частности, алгоритм RANDU , десятилетиями использовавшийся на мейнфреймах , оказался очень плохим , что вызвало сомнения в достоверности результатов многих исследований, использовавших этот алгоритм.
Наравне с существующей необходимостью генерировать легко воспроизводимые последовательности случайных чисел, также существует необходимость генерировать совершенно непредсказуемые или попросту абсолютно случайные числа. Такие генераторы называются генераторами случайных чисел (ГСЧ — англ. random number generator, RNG ). Так как такие генераторы чаще всего применяются для генерации уникальных симметричных и асимметричных ключей для шифрования, они чаще всего строятся из комбинации криптостойкого ГПСЧ и внешнего источника энтропии (и именно такую комбинацию теперь и принято понимать под ГСЧ).
Почти все крупные производители микрочипов поставляют аппаратные ГСЧ с различными источниками энтропии, используя различные методы для их очистки от неизбежной предсказуемости. Однако на данный момент скорость сбора случайных чисел всеми существующими микрочипами (несколько тысяч бит в секунду) не соответствует быстродействию современных процессоров.
В современных исследованиях осуществляются попытки использования измерения физических свойств объектов (например, температуры ) или даже квантовых флуктуаций вакуума в качестве источника энтропии для ГСЧ.
В персональных компьютерах авторы программных ГСЧ используют гораздо более быстрые источники энтропии, такие, как шум звуковой карты или счётчик тактов процессора . Сбор энтропии являлся наиболее уязвимым местом ГСЧ. Эта проблема до сих пор полностью не разрешена во многих устройствах (например, смарт-картах ), которые таким образом остаются уязвимыми. Многие ГСЧ используют традиционные испытанные, хотя и медленные, методы сбора энтропии вроде измерения реакции пользователя (движение мыши и т. п.), как, например, в PGP и Yarrow , или взаимодействия между потоками , как, например, в Java SecureRandom.
Если в качестве источника энтропии использовать текущее время, то для получения целого числа от 0 до N достаточно вычислить остаток от деления текущего времени в миллисекундах на число N +1. Недостатком этого ГСЧ является то, что в течение одной миллисекунды он выдаёт одно и то же число.
Источник энтропии | ГПСЧ | Достоинства | Недостатки | |
---|---|---|---|---|
/dev/random в UNIX / Linux | Счётчик тактов процессора, однако собирается только во время аппаратных прерываний | РСЛОС , с хешированием выхода через SHA-1 | Есть во всех Unix, надёжный источник энтропии | Очень долго «нагревается», может надолго «застревать», либо работает как ГПСЧ ( /dev/urandom ) |
Yarrow от Брюса Шнайера | Традиционные методы | AES -256 и SHA-1 маленького внутреннего состояния | Гибкий криптостойкий дизайн | Медленный |
Microsoft CryptoAPI | Текущее время, размер жёсткого диска, размер свободной памяти, номер процесса и NETBIOS-имя компьютера | MD5 -хеш внутреннего состояния размером в 128 бит | Встроен в Windows, не «застревает» | Сильно зависит от используемого криптопровайдера (CSP). |
Java SecureRandom | Взаимодействие между потоками | SHA-1 -хеш внутреннего состояния (1024 бит) | Большое внутреннее состояние | Медленный сбор энтропии |
RdRand от intel | Шумы токов | Построение ПСЧ на основе «случайного» битового считывания значений от токов | Очень быстр, не «застревает» | Оригинальная разработка, свойства приведены только по утверждению разработчиков. |
Одним из критериев того, что ГПСЧ криптографически стойкий, является невозможность отличить выходные значения ГПСЧ от независимой равномерно распределенной на промежутке случайной последовательности. Пусть существует семейство ГПСЧ , где мощность множества равно . Как было указано выше, — это конечный набор состояний, — вероятностное распределение в пространстве состояний , используемое для выбора начального состояния (англ. seed), — функция перехода, — пространство выходных значений, . Обычно , а состояние генератора задается рекуррентной формулой для . Выходное значение генератора ; — последовательность псевдослучайных чисел. Предположим, что функции перехода и выхода могут быть вычислены за полиномиальное, степени , время. Пусть — класс статистических тестов , которые пытаются за полиномиальное, степени , время отличить выходные значения ГПСЧ от независимой равномерно распределенной на промежутке случайной последовательности. Семейство ГПСЧ называется хорошим с точки зрения полиномиального времени, если найдется такая, что для всех никакой из тестов не может отличить выходные значения ГПСЧ от независимой равномерно распределенной на промежутке случайной последовательности с вероятностью .
Криптографические приложения используют для генерации случайных чисел детерминированные алгоритмы, следовательно, генерируют последовательность чисел, которая теоретически не может быть статистически случайной. В то же время, если выбрать хороший алгоритм, полученная численная последовательность — псевдослучайных чисел — будет проходить большинство тестов на случайность. Одной из характеристик такой последовательности является большой период повторения.
Примерами известных криптостойких ГПСЧ являются RC4 , ISAAC , SEAL , SNOW , совсем медленный теоретический алгоритм Блюм — Блюма — Шуба , а также счётчики с криптографическими хеш-функциями или криптостойкими блочными шифрами вместо функции вывода .
Также к криптографически стойким шифрам относятся генераторы с несколькими регистрами сдвига , генераторы с нелинейными преобразованиями , мажоритарные генераторы шифрования A5/x .
Происходит шифрование случайных чисел генератора с помощью различных секретных ключей , полученных на каждой стадии. Счётчик с большим периодом используется в качестве входа в шифрующее устройство. При использовании 56-битного ключа DES может использоваться счётчик с периодом .
Псевдослучайная последовательность, полученная по данной схеме, имеет полный период: каждое выходное значение , , … основано на разных значениях счётчика, поэтому . Так как ключ является секретным, то любой секретный ключ не зависит от знания одного или более предыдущих секретных ключей. Для увеличения криптостойкости алгоритма необходимо на каждом шаге шифровать случайное число с ГСЧ — .
ГПСЧ из стандарта ANSI X9.17 используется во многих приложениях финансовой безопасности и PGP . В основе этого ГПСЧ лежит тройной DES . Генератор ANSI X9.17 состоит из следующих частей:
Входными случайными значениями являются и . — выходное значение. Вычисление из без знания не является возможным за разумное время, и, следовательно, следующее псевдослучайное значение , так как для получения дополнительно выполняются три операции шифрования.
Кроме устаревших, хорошо известных РСЛОС-генераторов , широко применявшихся в качестве аппаратных ГПСЧ в XX веке, очень мало известно о современных аппаратных ГПСЧ, так как большинство из них разработано для военных целей или запатентованы и держатся в секрете . Аппаратно реализуемые РСЛОС-генераторы и , были взломаны с помощью алгебраических атак .
В настоящее время известно о применении аппаратных ГПСЧ, реализуемых на основе маломощных шумов в электросхемах.
Генератор случайных номеров для лотерей — аппаратно-программный комплекс, применяющийся в розыгрышах, в которых необходимо угадывать комбинацию из определенного количества чисел. Любое из возможных чисел имеет одинаковую вероятность появления.
Попытки создать генератор случайных чисел относятся к 3500 году до н. э. и связаны с древнеегипетской настольной игрой Сенет . В Сенете два игрока играют за две стороны. Ходы определяются с помощью 4 плоских палочек, что и может считаться генератором случайных чисел того времени. Бросают все четыре палочки сразу. Подсчёт очков происходит следующим образом: 1 палочка упала белой стороной вверх — 1 очко и дополнительный бросок; 2 — 2 очка; 3 — 3 очка, 4 — 4 и дополнительный бросок. Одна из сторон палочки чёрная и, если все четыре палочки падали чёрной стороной вверх — это максимальный результат — 5 очков и дополнительный бросок.
Известный генератор случайных чисел применялся на протяжении многих лет для определения выигрышных номеров британской лотереи.
Основные требования к программному обеспечению и оборудованию, используемому для проведения розыгрышей в Российской Федерации, устанавливаются Федеральным законом от 11.11.2003 № 138-ФЗ «О лотереях»:
В российских государственных лотереях («Гослото „5 из 36“», «Гослото „6 из 36“», «Гослото „6 из 45“», «Гослото „7 из 49“», «Гослото „4 из 20“», «Спортлото „6 из 49“») для определения победителей используются самозаряжающиеся лототроны . Трансляция розыгрышей ведется в прямом эфире.
В российских государственных лотереях («Рапидо», «Кено-Спортлото», «Топ-3», «12/24», «Всё по сто») для определения победителей используется генератор случайных чисел — аппаратно-программный комплекс, и отвечающий рекомендациям ФГУП ВНИИМС . Аппарат формирует непрерывный поток случайных шумов, которые преобразуются в числа. В заданный момент времени из потока выхватываются текущие значения, которые и являются выигрышной лотерейной комбинацией.
В 2015 году бывшему директору по безопасности после выигрыша в 16.5 млн долларов, имевшему доступ к программному обеспечению, используемому при розыгрышах лотерей, в использовании специальных алгоритмов, позволяющих определять выигрышную комбинацию лотереи в течение нескольких дней в году.