Проблемы организации вычислений в многомашинных вычислительных системах с программно-управляемой сбое- и отказоустойчивостью. Часть II
Авторы: Ашарина И.В.
Опубликовано в выпуске: #7(115)/2021
DOI: 10.18698/2308-6033-2021-7-2097
Раздел: Авиационная и ракетно-космическая техника | Рубрика: Инновационные технологии в аэрокосмической деятельности
Проведен анализ существующих подходов и методов организации сбое- и отказоустойчивых вычислений в распределенных многомашинных вычислительных системах (РМВС), определен и обоснован перечень задач, подлежащих решению. Рассмотрены области применения сбое- и отказоустойчивых систем управления сложными сетевыми и распределенными объектами. Вторая часть посвящена проблемам организации сбое- и отказоустойчивости в РМВС, исследовано системное, функциональное, тестовое диагностирование в качестве основы построения необслуживаемых сбое- и отказоустойчивых систем. Введено понятие самоуправляемой деградации (завершающейся выведением РМВС в состояние безопасного останова при критической степени деградации) как способа увеличения срока активного существования РМВС.
Литература
[1] Ашарина И.В. Проблемы организации вычислений в многомашинных вычислительных системах с программно-управляемой сбое- и отказоустойчивостью. Часть I. Инженерный журнал: наука и инновации, 2021, вып. 6. http://dx.doi.org/10.18698/2308-6033-2021-6-2088
[2] Димитриев Ю.К. Локальное самодиагностирование в вычислительных системах с циркулянтной структурой. Автоматика и телемеханика, 2007, вып. 3, с. 187–198.
[3] Тоффоли Т., Марголус Н. Машины клеточных автоматов. Москва, Мир, 1991, 280 с.
[4] Димитриев Ю.К. Правила условного локального самоопределения и алгоритм диагностирования мультипроцессорной системы с циркулянтной диагностической структурой на их основе. Автоматика и телемеханика, 2012, вып. 5, с. 125–140.
[5] Димитриев Ю.К. О концептуальной основе сравнительного анализа и решения задач самодиагностики многопроцессорных систем для разных моделей ненадежного тестирования. Автоматика и телемеханика, 2015, вып. 7, с. 150–164.
[6] Димитриев Ю.К. Необходимые и достаточные условия t-диагностируемости многопроцессорных вычислительных систем для разных моделей ненадежного тестирования, полученные с помощью теоретико-графовой модели системы. Автоматика и телемеханика, 2016, вып. 6, с. 145–158.
[7] Preparata F.P., Metze G., Chien R.J. On connection assignement problem of diagnosable systems. IEEE Trans. El. Comput., 1967, vol. EC-16, no. 12, pp. 848–854.
[8] Пархоменко П.П., Согомонян Е.С. Основы технической диагностики. Оптимизация алгоритмов диагностирования, аппаратурные средства. Москва, Энергия, 1981, 319 с.
[9] Barsi F., Grandoni F., Maestrini P. Theory of diagnosability of digital systems. IEEE Trans. Comput., 1976, vol. C-25, no. 6, pp. 585–593.
[10] Chwa K.Y., Hakimi S.L. Schemes for fault tolerant computing — a comparison of modularly redundant and t-diagnosable systems. Inf. Control., 1981, vol. 49, no. 3, рр. 212–238.
[11] Malek M. A comparison connection assignement for diagnosis of multiprocessor system. Proc. 7th Int. Symp. Comput. Archit., La Baule, USA, May 6–8, 1980. New York, Association for Computing Machinery, 1980, рр. 31–35.
[12] Kavianpour A., Friedman A. A different diagnostic model for multiprocessor systems. Proc. Information processing 80 by IFIP Congress 80. Tokyo, Japan, October 6–9, 1980 and Melbourne, Australia, October 14–17, 1980. North-Holland, IFIP, 1980, рр. 157–162.
[13] Димитриев Ю.К. Правила условного локального самоопределения и алгоритм диагностирования мультипроцессорной системы с циркулянтной диагностической структурой на их основе. Автоматика и телемеханика, 2012, вып. 5, с. 125–140.
[14] Сиренко В.Г. Функциональное диагностирование процессов посылок информации в вычислительных системах при неизвестном исходном значении информации. Часть I. Внешнее диагностирование. Автоматика и телемеханика, 2005, вып. 11, с. 135–154.
[15] Карибский В.В., Пархоменко П.П., Согомонян Е.С. Основы технической диагностики. Модели объектов, методы и алгоритмы диагноза. Москва, Энергия, 1976, 464 с.
[16] Lala J.H., Alger L.S., Gauthier R.J., Dzwonczyk M.J. A fault tolerant processor to meet rigorous failure requirements. Proc. of the 7th AIAA/IEEE Digital Avionics Systems Conf., October 13–16, 1986, Fort Worth, TX, USA. Fort Worth, IEEE, 1986, vol. 1, рр. 555–562.
[17] Мамедли Э.М., Самедов Р.Я., Соболев Н.А. Метод локализации «дружественных» и «враждебных» неисправностей. Автоматика и телемеханика, 1992, вып. 5, с. 126–138.
[18] Лобанов А.В. Обнаружение и идентификация «враждебных» неисправностей путем одновременного сочетания функционального и тестового диагностирования в многомашинных вычислительных системах. Автоматика и телемеханика, 1999, вып. 1, с. 159–165.
[19] Лобанов А.В. Обнаружение и идентификация неисправностей в распределенных управляющих вычислительных системах с программно-управляемой сбое- и отказоустойчивостью. Автоматика и телемеханика, 1998, вып. 1, с. 155–164.
[20] Pease M., Shostak R., Lamport L. Reaching agreement in the presence of faults. J. ACM., 1980, vol. 27, no. 2, рр. 228–234.
[21] Rennels D. Fault-tolerant computing-concepts and examples. IEEE Tr. Comp., 1984, vol. C-32, no. 12, pp. 1116–1129.
[22] Лобанов А.В., Сиренко В.Г. Распределенные методы системного диагностирования многомашинных вычислительных систем. Автоматика и телемеханика, 2000, вып. 8, c. 165–172.
[23] Микеладзе М.А. Развитие основных моделей самодиагностирования сложных технических систем. Автоматика и телемеханика, 1995, вып. 5, c. 3–18.
[24] Kuhl J.G., Reddy S.M. Fault-diagnosis in fully distributed systems. Proc. of the 11th Int. Symp. on Fault-Tolerant Computing. June 24–26 1981, Portland, Maine. New York, IEEE, 1981, pp. 100–105.
[25] Liaw C.C., Maliya Y.K., Su S.Y.H. Self-diagnosis in nonhomogeneous distributed systems. Proc. of the 12th Int. Symp. Fault-Tolerant Computing. June 15–18, 1982, Los Angeles, CA. New York, IEEE, 1982, pp. 223–233.
[26] Генинсон Б.А., Панкова Л.А., Трахтенгерц Э.А. Отказоустойчивые методы взаимной информационной согласованности в распределенных вычислительных системах. Автоматика и телемеханика, 1989, вып. 5, c. 3–18.
[27] Лобанов А.В. Организация сбое- и отказоустойчивых вычислений в полносвязных многомашинных вычислительных системах. Автоматика и телемеханика, 2000, вып. 12, c. 138–146.
[28] Гришин В.Ю., Лобанов А.В., Сиренко В.Г. Функциональное диагностирование в распределенном системном диагностировании многомашинных вычислительных систем. Автоматика и телемеханика, 2002, вып. 1, c. 154–160.
[29] Гришин В.Ю., Лобанов А.В., Сиренко В.Г. Распределенное системное диагностирование враждебных неисправностей в неполносвязных многомашинных вычислительных системах. Автоматика и телемеханика, 2005, вып. 2, c. 148–157.