Инженерный журнал: наука и инновацииЭЛЕКТРОННОЕ НАУЧНО-ТЕХНИЧЕСКОЕ ИЗДАНИЕ
свидетельство о регистрации СМИ Эл № ФС77-53688 от 17 апреля 2013 г. ISSN 2308-6033. DOI 10.18698/2308-6033
  • Русский
  • Английский
Статья

Восстановление целевой работы в автоматической сбое- и отказоустойчивой многозадачной распределенной информационно-управляющей системе

Опубликовано: 05.07.2019

Авторы: Лобанов А.В., Ашарина И.В.

Опубликовано в выпуске: #7(91)/2019

DOI: 10.18698/2308-6033-2019-7-1902

Раздел: Авиационная и ракетно-космическая техника | Рубрика: Инновационные технологии в аэрокосмической деятельности

Рассмотрена организация процессов восстановления целевой работы после допустимых сбоев и отказов в автоматической сбое- и отказоустойчивой многозадачной информационно-управляющей распределенной многомашинной системе сетевой структуры, выполняющей набор целевых функций, задаваемых внешними пользователями. Система характеризуется параллельным выполнением множества взаимодействующих целевых задач, исполняемых на отдельных вычислителях, представляющих собой организованные совокупности цифровых вычислительных машин (ЦВМ). Заданный уровень сбое- и отказоустойчивости задачи обеспечивается путем ее репликации — параллельного выполнения копий этой задачи на нескольких ЦВМ, составляющих вычислитель (комплекс), с обменом результатами и выбором из них правильного. Представлены характеристики, принципы построения, особенности рассматриваемых систем и их «философская» сущность с точки зрения сбое- и отказоустойчивости. Определены факторы сложности при проектировании сбое- и отказоустойчивых систем рассматриваемого класса. Принята самая общая модель враждебной неисправности ЦВМ, при которой ее поведение может быть произвольным, неодинаковым по отношению к другим взаимодействующим с ней ЦВМ, и даже подобным злонамеренному. Рассмотрена часть проблемы организации динамической избыточности в разрабатываемой системе, возникающая после того, как в этой системе в некотором комплексе (или некотором множестве F комплексов) со стороны исправных ЦВМ каждого такого комплекса была обнаружена допустимая совокупность неисправностей и каждая такая неисправность была также синхронно и согласованно идентифицирована по месту возникновения и по типу как программный сбой определенной ЦВМ этого комплекса. Эта часть проблемы решается посредством восстановления в идентифицированной в состоянии программного сбоя ЦВМ некоторого комплекса всей необходимой информации, передаваемой в нее из исправных ЦВМ данного комплекса. Определены состав команд, необходимых для такого восстановления, а также действия комплекса в процессе восстановления.


Литература
[1] Лобанов А.В., Ашарина И.В, Гришин В.Ю., Сиренко В.Г. Макетный образец высокоадаптивной распределенной сетецентрической многокомплексной сбое- и отказоустойчивой управляющей системы — актуальная проблема. Наукоемкие технологии в космических исследованиях Земли, 2018, т. 10, № 1, с. 48–55. DOI: 10.24411/2409-5419-2018-10019
[2] Пархоменко П.П., ред. Основы технической диагностики. Кн. 1. Модели объектов, методы и алгоритмы диагноза. Москва, Энергия, 1976, 464 с.
[3] Сильянов Н.В., Ломакина Л.С. Диагностическое обеспечение многофункциональной бортовой вычислительной системы. Материалы XIII Всероссийского совещания по проблемам управления (ВСПУ–2019). Москва, 17–20 июня 2019 г., ИПУ РАН, с. 2874–2878.
[4] Клейман Л.А., Фрейман В.И. Повышение надежности устройств беспроводных систем управления на основе метода анализа тепловых карт. Материалы XIII Всероссийского совещания по проблемам управления (ВСПУ–2019), Москва, 17–20 июня 2019 г., ИПУ РАН, с. 2866–2873.
[5] Каравай М.Ф. Минимизированное вложение произвольных гамильтоновых графов в отказоустойчивый граф и реконфигурация при отказах. I. Одно- отказоустойчивые структуры. Автоматика и телемеханика, 2004, № 12, с. 159–177.
[6] Викторова В.С., Лубков В.Н., Степанянц А.С. Надежностные модели и анализ систем с защитой. Автоматика и телемеханика, 2018, № 7, с. 117–137.
[7] Ведешенков В.А. О путевом методе системного диагностирования цифровых систем со структурой симметричного двудольного графа. Автоматика и телемеханика, 2014, № 9, c. 133–143.
[8] Белов А.С., Скубьев А.В. Теоретический подход по оцениванию и обеспечению живучести распределенных сетей связи в условиях информационного противоборства. Наукоемкие технологии в космических исследованиях Земли, 2018, т. 10, № 2, с. 22–31. DOI: 10.24411/2409-5419-2018-10038
[9] Грузликов А.М., Колесов Н.В. Дискретно-событийная диагностическая модель для распределенной вычислительной системы. Слияние цепей. Автоматика и телемеханика, 2017, № 4, с. 126–134.
[10] Лобанов А.В. Модели замкнутых многомашинных вычислительных систем со сбое- и отказоустойчивостью на основе репликации задач в условиях возникновения враждебных неисправностей. Автоматика и телемеханика, 2009, № 2, с. 171–189.
[11] Генинсон Б.А., Панкова Л.А., Трантенгерц Э.А. Отказоустойчивые методы обеспечения взаимной информационной согласованности в распределенных вычислительных системах. Автоматика и телемеханика, 1989, № 5, с. 3–18.
[12] Лобанов А.В. Взаимное информационное согласование с идентификацией неисправностей в распределенных вычислительных системах. Автоматика и телемеханика, 1992, № 4, с. 137–146.
[13] Лобанов А.В. Взаимное информационное согласование с идентификацией неисправностей на основе глобального синдрома. Автоматика и телемеханика, 1996, № 5, с. 150–159.
[14] Гришин В.Ю., Лобанов А.В., Сиренко В.Г. Взаимное информационное согласование в многомашинных вычислительных системах с обнаружением и идентификацией кратных враждебных неисправностей. Автоматика и телемеханика, 2003, № 4, с. 123–133.
[15] Ашарина И.В., Лобанов А.В., Мищенко И.Г. Взаимное информационное согласование в неполносвязных многомашинных вычислительных системах. Автоматика и телемеханика, 2003, № 5, с. 190–198.
[16] Ашарина И.В., Лобанов А.В. Взаимное информационное согласование в неполносвязных гетерогенных многомашинных вычислительных системах. Автоматика и телемеханика, 2010, № 5, с. 133–146.
[17] Лобанов А.В. Взаимное информационное согласование с обнаружением и идентификацией враждебных неисправностей в неполносвязных многомашинных вычислительных системах. Автоматика и телемеханика, 2003, № 6, с. 175–185.
[18] Лобанов А.В. Алгебраический подход к задаче выделения комплексов при организации сбое- и отказоустойчивых параллельных вычислений в сетях ЦВМ. Открытое образование, 2011, № 2 (86), ч. 2, с. 36–39.
[19] Ашарина И.В. Алгебраический метод определения достаточной среды межкомплексной посылки при организации сбое- и отказоустойчивых параллельных вычислений в сетях ЦВМ. Открытое образование, 2011, № 2 (86), ч. 2, с. 29–32.
[20] Ашарина И.В. Распределенный алгоритм системного взаимного информационного согласования в многокомплексных вычислительных системах. Образовательные ресурсы и технологии, 2014, № 2 (5), с. 45–50.
[21] Ашарина И.В., Лобанов А.В. Выделение комплексов, обеспечивающих достаточные структурные условия системного взаимного информационного согласования в многокомплексных системах. Автоматика и телемеханика, 2014, № 6, с. 115–131.
[22] Ашарина И.В., Лобанов А.В. Выделение структурной среды системного взаимного информационного согласования в многокомплексных системах. Автоматика и телемеханика, 2014, № 8, с. 146–156.
[23] Лобанов А.В. Протокол отказоустойчивого обмена. Приборы и системы управления, 1993, № 7, с. 8–11.
[24] Лобанов А.В., Нахаев С.А. Обеспечение сбое- и отказоустойчивости в протоколе отказоустойчивого обмена. Приборы и системы управления, 1993, № 7, с. 12–13.