Инженерный журнал: наука и инновацииЭЛЕКТРОННОЕ НАУЧНО-ТЕХНИЧЕСКОЕ ИЗДАНИЕ
свидетельство о регистрации СМИ Эл № ФС77-53688 от 17 апреля 2013 г. ISSN 2308-6033. DOI 10.18698/2308-6033
  • Русский
  • Английский
Статья

Проблемы организации вычислений в многомашинных вычислительных системах с программно-управляемой сбое- и отказоустойчивостью. Часть I

Опубликовано: 25.06.2021

Авторы: Ашарина И.В.

Опубликовано в выпуске: #6(114)/2021

DOI: 10.18698/2308-6033-2021-6-2088

Раздел: Авиационная и ракетно-космическая техника | Рубрика: Инновационные технологии в аэрокосмической деятельности

В трех частях работы проведен анализ существующих подходов и методов организации сбое- и отказоустойчивых вычислений в распределенных многомашинных вычислительных системах (РМВС), определен и обоснован перечень задач, подлежащих решению. Приведено понятие отказоустойчивости, предложенное А. Авиженисом, объяснено его отличие от современного понятия, а также его некорректность применительно к современным распределенным многомашинным вычислительным системам. Обоснована необходимость корректировки определения отказоустойчивости, утвержденного государственными стандартами, а также необходимость задания трех входных параметров, которые должны учитываться далее применяемыми методами проектирования РМВС: модели допустимых неисправностей, допустимой кратности неисправностей, возможности работы с последовательностями допустимых неисправностей. Перечислены вопросы, на которые нужно знать ответы для разработки действительно надежной, отказоустойчивой системы. Рассмотрены области применения сбое- и отказоустойчивых систем управления сложными сетевыми и распределенными объектами. Системное, функциональное, тестовое диагностирование обозначены как основа построения необслуживаемых сбое- и отказоустойчивых систем.
Введено понятие самоуправляемой деградации (завершающейся выведением РМВС в состояние безопасного останова при критической степени деградации) как способа увеличения срока активного существования РМВС. Проанализированы вопросы, связанные с диагностированием кратных неисправностей. Приведены основные различия обеспечения отказоустойчивости в системах, имеющих широковещательные каналы связи и каналы связи «точка-к-точке».
Первая часть работы посвящена анализу существующих подходов и методов организации сбое- и отказоустойчивых вычислений в РМВС и определению понятия отказоустойчивости.


Литература
[1] Таненбаум Э., Уэзеролл Д. Компьютерные сети. Санкт-Петербург, Питер, 2016, 955 с.
[2] Авиженис А. Отказоустойчивость — свойство, обеспечивающее постоянную работоспособность цифровых систем. ТИИЭР, 1978, т. 66, № 10, с. 5–25.
[3] Ямбулатов Э.И. Разработка отказоустойчивых распределенных систем управления телекоммуникационными сетями. Автореф. дис. … канд. техн. наук. Ставрополь, 2014, 22 с.
[4] Мельник Э.В., Иванов Д.Я., Гандурин В.А., Клименко А.Б. Методы организации высоконадежных сетецентрических ИУС с распределенным диспетчированием и кластеризацией. Известия ЮФУ. Технические науки. Раздел III. Распределенные информационно-управляющие системы, 2016, № 12, с. 71–84.
[5] Шишов А. Разработка и внедрение АСУ «Кузнецов» с применением сетецентрического подхода и мультиагентных технологий. XII Всероссийское совещание по проблемам управления ВСПУ–2014. Москва, 2014, т. 16, с. 9050–9062.
[6] Федосеев С.А. Сетецентрический подход к задаче управления заказами на промышленном предприятии. XII Всероссийское совещание по проблемам управления ВСПУ–2014. Москва, 2014, с. 7524–7528.
[7] Федосеев С.А., Столбов В.Ю., Пустовойт К.С. Модель группового управления в сетецентрических производственных системах. Управление в технических, эргатических, организационных и сетевых системах (УТЭОСС–2012): мат-лы конф. Санкт-Петербург, Концерн «ЦНИИ «Электроприбор», 2012, с. 1240–1243.
[8] Коробкин В.В., Серогодский А.И. Безопасность функционирования программного обеспечения в управляющих системах на высокорисковых промышленных объектах. VI Всероссийская мультиконференция по проблемам управления: мат-лы конф. в 4 т. Таганрог, 30 сентября — 5 октября 2013 г., ЮФУ. Таганрог, Изд-во ЮФУ, 2013, c. 228–232.
[9] Машошин А.И. Алгоритмы управления интегрированной сетецентрической системой подводного наблюдения. VI Всероссийская мультиконференция по проблемам управления: мат-лы конф. в 4 т. Таганрог, 30 сентября — 5 октября 2013 г., ЮФУ. Таганрог, Изд-во ЮФУ, 2013, с. 112–116.
[10] Пешехонов В.Г., Брага Ю.А., Машошин А.И. Сетецентрический подход к решению проблемы освещения подводной обстановки в Арктике. Известия ЮФУ. Технические науки, 2012, № 3 (128), с. 219–227.
[11] Заборовский В.С., Гук М.Ю., Мулюха В.А., Ильяшенко А.С. Сетецентрический подход к созданию системы удаленного управления робототехническими объектами с борта орбитальной станции. Научно-технические ведомости СПбГПУ. Информатика. Телекоммуникации. Управление, 2013, т. 186, № 6, с. 17–26.
[12] Dado E., Koenders E.A.B., Carvalho D.B.F. Netcentric Virtual Laboratories for Composite Materials. Compos. Their Prop. Hu N., ed. InTech, 2012, рр. 227–244.
[13] Захаров И.В., Забузов В.С., Соколовский А.Н., Эсаулов К.А. Моделирование функционирования живучих бортовых вычислительных систем с учетом их структурно-параметрической деградации. Наукоемкие технологии в космических исследованиях Земли, 2016, вып. S1, с. 60–65.
[14] Димитриев Ю.К. Правила условного локального самоопределения и алгоритм диагностирования мультипроцессорной системы с циркулянтной диагностической структурой на их основе. Автомат. и телемех., 2012, вып. 5, с. 125–140.
[15] Мамедли Э.М., Соболев Н.А. Метод обеспечения отказоустойчивости в резервированных управляющих вычислительных системах. Автомат. и телемех., 2000, вып. 2, с. 172–182.
[16] Харченко В.С. Модели и алгоритмы реконфигурации отказоустойчивых цифровых систем с адаптивной многоярусной мажоритарной структурой. Автомат. и телемех., 2000, вып. 12, с. 162–175.
[17] Елисеев В.В., Игнатущенко В.В., Подшивалова И.Ю. Оценка отказоустойчивости управляющих параллельных вычислительных систем: новый подход. Автомат. и телемех., 2007, вып. 6, с. 166–185.
[18] Ignatushchenko V.V. A principle of dynamic control of parallel computing processes on the basis of static forecasting. Proc. 10 Int. Conf. Parallel Distributed Comput. Svst. (PDCS 97). New Orleans, USA, 1997, рр. 593–597.
[19] Елисеев В.В., Игнатущенко В.В. О проблеме надежного выполнения сложных наборов задач в управляющих параллельных вычислительных системах. Проблемы управления, 2006, № 5, с. 6–18.
[20] Игнатущенко В.В., Подшивалова И.Ю. Динамическое управление параллельными вычислительными процессами на основе статического прогнозирования их выполнения. Автомат. и телемех., 1997, вып. 5, с. 160–173.
[21] Игнатущенко В.В., Подшивалова И.Ю. Динамическое управление надежным выполнением параллельных вычислительных процессов для систем реального времени. Автомат. и телемех., 1999, вып. 6, с. 142–15.
[22] Лобанов А.В. Модели замкнутых многомашинных вычислительных систем со сбое- и отказоустойчивостью на основе репликации задач в условиях возникновения враждебных неисправностей. Автомат. и телемех., 2009, вып. 2, с. 171–189.
[23] Лобанов А.В. Организация сбое- и отказоустойчивых вычислений в полносвязных многомашинных вычислительных системах. Автомат. и телемех., 2000, вып. 12, с. 138–146.
[24] Каравай М.Ф. Применение теории симметрии к анализу и синтезу отказоустойчивых систем. Автомат. и телемех., 1996, вып. 6, с. 159–17.
[25] Лобанов А.В., Сиренко В.Г. Распределенные методы системного диагностирования многомашинных вычислительных систем. Автомат. и телемех., 2000, вып. 8, с. 165–172.
[26] ГОСТ Р ИСО/МЭК 25010–2015. Информационные технологии. Системная и программная инженерия. Требования и оценка качества систем и программного обеспечения (SQuaRE). Модели качества систем и программных продуктов. Москва, Стандартинформ, 2015, 36 с.
[27] ГОСТ Р 56526–2015. Требования надежности и безопасности космических систем, комплексов и автоматических космических аппаратов единичного (мелкосерийного) изготовления с длительными сроками активного существования. Москва, Стандартинформ, 2015, 50 с.
[28] Boyce R., Griffin D. Future trusted autonomous space scenarios. Studies in Systems, Decision and Control, 2018, vol. 117, pp. 355–364.
[29] Li F., Shi P., Wu L. Fault detection for underactuated manipulators modeled by MJS. Studies in Systems, Decision and Control, 2017, vol. 81, pp. 171–193.
[30] Kormushev P., Ahmadzadeh S.R. Robot learning for persistent autonomy. Studies in Systems, Decision and Control, 2015, vol. 42, pp. 3–28.
[31] Artemenko Y.N., Karpenko A.P., Belonozhko P.P. Synthesis of the Program Motion of a Robotic Space Module Acting as the Element of an Assembly and Servicing System for Emerging Orbital Facilities. Studies in Systems, Decision and Control, 2019, vol. 174, pp. 217–227.
[32] Belonozhko P.P. Robotic assembly and servicing space module peculiarities of dynamic study of given system. Studies in Systems, Decision and Control, 2019, vol. 174, pp. 287–29.
[33] Буренин А.Н., Легков К.Е. Вопросы безопасности инфокоммуникационных систем и сетей специального назначения: основные угрозы, способы и средства обеспечения комплексной безопасности сетей. Наукоемкие технологии в космических исследованиях Земли, 2015, т. 7, № 3, с. 46–61.
[34] Pavlov D.A. Method of operation planning information interaction cluster of small satellites remote sensing. Proceedings of the Mozhaisky Military Aerospace Academy. Saint Petersburg, Mozhaisky Military Aerospace Academy, 2015, vol. 649, pp. 37–47.
[35] Фатеев В.Ф., ред. Малые космические аппараты информационного обеспечения. Москва, Радиотехника, 2010, 320 с.
[36] Соллогуб А.В., Скобелев П.О., Симонова Е.В., Царев А.В.,. Степанов М.Е, Жиляев А.А. Интеллектуальная система распределенного управления групповыми операциями кластера малоразмерных космических аппаратов в задачах дистанционного зондирования Земли. Информационно-управляющие системы, 2013, № 1, с. 16–26.
[37] Концепция развития российской космической системы дистанционного зондирования Земли на период до 2025 года. Москва, Федеральное космическое агентство, 2006, 77 с.
[38] Serebrenny V., Shereuzhev M. Dependence of Dynamics of Multi-robot System on Control Architecture. In: Kravets A., ed. Robotics: Industry 4.0 Issues & New Intelligent Control Paradigms. Studies in Systems, Decision and Control, 2020, vol 272. pp. 125–132. Springer, Cham. https://doi.org/10.1007/978-3-030-37841-7_10
[39] Krestovnikov K., Cherskikh E., Ronzhin A. Mathematical model of a swarm robotic system with wireless bi-directional energy transfer. Studies in Systems, Decision and Control, 2020, vol. 272, pp. 13–23. https://doi.org/10.1007/978-3-030-37841-7_2
[40] Kernbach S., Kernbach O. Collective energy homeostasis in a large-scale microrobotic swarm. Robot. Auton. Syst., 2011, vol. 59 (12), pp. 1090–1101.
[41] Lerman K., Galstyan A., Martinoli A., Ijspeert A. A macroscopic analytical model of collaboration in distributed robotic systems. Artif. Life, 2001, vol. 7 (4), pp. 375–393.