двигателя. Трехмерная модель содержала 392 608 неизвестных переме-
щений; расчет выполнялся в геометрически нелинейной постановке;
итерационной процесс сходился за 16 итераций; оперативной памя-
ти компьютера было достаточно для размещения всех необходимых
данных модели; рабочая частота процессора 2880 МГц. Результаты
тестирования приведены в таблице.
Таблица
Тестирование Ansys 13 на многоядерном ПК с GPU
Без GPU, с
С GPU Nvidia
Tesla C2070, с
Расчет с использованием 1-го ядра GPU 4009
1848
Расчет с использованием 4-х ядер GPU 1870
1344
Таким образом, применение GPU на рабочих станциях при реше-
нии задач прочности следует признать нецелесообразным на текущем
этапе, принимая во внимание, что модуль GPU по цене соответствует
трем 4. . .6-ядерным ПК. Объясняется это в основном тем, что алго-
ритмы МКЭ редко используют массивно параллельные вычисления и
плохо переносятся на GPU.
Настоящая статья посвящена методам параллельных вычислений
с применением суперэлементного (СЭ) подхода при решении задач
прочности и теплопроводности в деталях и узлах турбомашин. Опи-
сан создаваемый на основе указанных методик программный комплекс
и приведены некоторые результаты тестирования его производитель-
ности.
Способы повышения эффективности вычислений при исполь-
зовании СЭ.
Распараллеливание алгоритмов метода конечных элемен-
тов для кластеров с использованием СЭ основано на идее разбиения
области решения задачи на набор непересекающихся подобластей, в
каждой из которых вводится своя сетка конечных элементов таким
образом, что узлы, попадающие на смежные границы областей, совпа-
дают. Каждая из подобластей образует суперэлемент. Cуперэлементы
могут быть образованы путем поглощения ими других суперэлемен-
тов, в этом случае создается иерархическая структура СЭ.
Распараллеливание алгоритма осуществляется путем распределе-
ния суперэлементов по клиентам вычислительной сети. Объем дан-
ных, передаваемых между клиентами в процессе решения задачи ста-
тического анализа конструкций, имеет порядок
n
2
e
,
где
n
e
—
число
внешних степеней свободы СЭ (образованных внешними узлами).
Необходимо разбивать исходную область решения задачи на СЭ
таким образом, чтобы минимизировать суммарный объем передава-
146
ISSN 1812-3368. Вестник МГТУ им. Н.Э. Баумана. Сер. “Естественные науки”. 2012