Высокая печать
- 1 year ago
- 0
- 0
Высокая доступность ( англ. high availability ) — характеристика технической системы , разработанной для избежания невыполненного обслуживания путём уменьшения или управления сбоями и минимизацией времени плановых простоев. Высокая доступность ожидается от систем жизнеобеспечения , здравоохранения и систем, от которых зависит благополучие общества в целом и экономическое благополучие отдельных организаций .
Высокая доступность вычислений ( англ. highly available computing ) обеспечивается компьютерными системами, которые спроектированы для минимизации времени как запланированных, так и незапланированных простоев .
Высокую доступность можно определить как свойство системы быть защищённой и легко восстанавливаемой от небольших простоев в короткое время и автоматизированными средствами. При таком определении рассматриваются три фактора: категоризация возможных проблем (сбоев), категоризация требований к системе в отношении продолжительности перерывов в работе, технологические решения для автоматической защиты и восстановления после сбоев .
В ходе сбора требований пользователей к системе обычно выясняется, какой уровень им необходим :
От желаемого уровня доступности зависит стоимость реализации и эксплуатации системы. Кроме того, так как доступность определяется с точки зрения пользователя, часто субъективной, в требованиях к системе стоит точно определить, что понимается под высокой доступностью системы .
Для вычисления достигнутого уровня доступности необходимо знать время простоя ( П ) и время обещанной доступности ( Д ), в случае высокой доступности в это время не включается суммарное время запланированных простоев. Тогда уровень доступности можно получить по формуле :
Например, простой системы постоянной доступности в течение 45 минут в январе говорит об уровне доступности 99,9 % («три девятки»).
Доступность можно выразить в виде средних величин :
где MTTF ( англ. mean time to failure ) — средняя наработка до отказа , MTTR ( англ. mean time to repair ) — среднее время до восстановления работоспособности.
Время восстановления после сбоя зависит от многих факторов, таких как сложность системы (чем сложнее система, тем дольше её перезапуск), серьёзность проблемы, доступность обслуживающего персонала, запасного оборудования, недостаточного резервного копирования и т. п. Следует также отметить, что доступность системы измеряется с точки зрения пользователя , а не фиксации факта работы основных узлов .
Другой метрикой доступности, применяемой в отношении больших сетей и составляющих их устройств, является метод, в котором считается число отказов на миллион (DPM, англ. defects per million ) часов работы. Этот метод точнее, чем процентный, позволяет принимать во внимание сбои в работе части сети. В этом случае можно измерять часы безотказной работы сети в целом, суммарное время работы всех устройств или даже суммарное время работы пользователей .