Как проходит тестирование на отказ и восстановление устройства?

Тестирование на отказ и восстановление устройства нужно для проверки исследуемого продукта на устойчивость и способность быстро восстановиться после сбоев. Сбои могут появиться по разным причинам:

  • проблемы со связью, например — произошел отказ сети;
  • возникли критические ошибки в программном обеспечении;
  • исчезло подключение носителей данных.

Основной задачей Failover and Recovery Testing является проверка работы систем восстановления.

Эти системы в случае сбоя должны обеспечить сохранность данных тестируемого продукта.

Особенно важным такое тестирование является для тех систем, которые работают круглосуточно. Например, интернет-магазины с автоматической обработкой заказа, онлайн-банкинг, виртуальные казино. Для них даже кратковременная неработоспособность сайта обернется имиджевыми потерями для бизнеса и снижением прибыли.

Виды тестирования

Методика этого тестирования заключается в искусственном создании разных сбоев, чтобы в дальнейшем подробно изучить реакцию защитных систем. После проведения подобных проверок можно будет выяснить, удалось ли достигнуть нужную скорость и уровень восстановления работы программного обеспечения после появления сбоя.

Реализацию тестов на практике проводят следующими способами:

Баги

  • обесточить компьютер, чтобы смоделировать ситуацию внезапного отключения электричества;
  • моделирование ситуации с потерей связи с сетью — для этого выключают сетевой кабель;
  • смоделировать ситуацию с отказом носителя накопителя данных — для этого обесточивают внешний жесткий диск;
  • симулируют ситуацию, когда в системе появляются неверные данные. Для этого используют специальный тестовый набор или заведомо содержащую ошибки базу данных.

В процессе моделирования ситуации сбоя оценивают не только степень потери данных, но и способность системы записывать все транзакции вместе со статусом их выполнения. Результатом тестирования является информация об уровне повреждения программного обеспечения в результате моделирования нестандартной ситуации, а также отчет с системой процессов, которые не завершились из-за сбоя.