Анализ времени выполнения запроса в параллельном
колоночном
хранилище…
5
Наиболее распространенной системой классификации параллель-
ных систем БД является система, предложенная Майклом Сто-
унбрейкером (Michael Stonebraker) [16]:
SE (Shared-Everything) архитектура с разделяемыми памятью и
дисками;
SD (Shared-Disks) архитектура с разделяемыми дисками;
SN (Shared-Nothing) архитектура без совместного использова-
ния ресурсов.
Обработка запроса к хранилищу данных в ПКБД.
Процесс
выполнения запроса к хранилищу данных, в частности к хранилищу
со звездообразной схемой, может включать следующие шаги:
1) выделение множества кортежей в таблице фактов с использо-
ванием предикатов ограничений над одной или несколькими табли-
цами измерений;
2) выполнение некоторого агрегирования значений фактов, часто
с группировкой по атрибутам таблицы измерений.
Таким образом, требуется выполнять соединения таблицы фактов
и таблиц измерений для каждого предиката и каждой агрегатной
группировки [17]. В качестве специфичного для колоночных БД пла-
на запроса авторы работ [10, 15] предлагают метод, названный ими
методом скрытых соединений, который можно использовать в систе-
мах БД с хранением данных по столбцам для соединений таблиц БД
со звездообразной схемой
по атрибутам
внешний-ключ/первичный-
ключ
. Это соединение с отложенной материализацией, но в нем ми-
нимизируется число значений, которые требуется извлекать не в по-
рядке следования позиций.
При использовании названного метода соединения выполняются
в три этапа. Сначала каждый предикат применяется к соответствую-
щей таблице измерений для извлечения списка ключей записей, удо-
влетворяющих данному предикату.
Рис. 3.
Первый этап скрытого соединения