ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012
31
УДК 004.9
Ю.А. Григорьев, Е.Ю. Ермаков
СРАВНЕНИЕ ПРОЦЕССОВ ОБРАБОТКИ ЗАПРОСА
К ОДНОЙ ТАБЛИЦЕ В ПАРАЛЛЕЛЬНОЙ СТРОЧНОЙ
И КОЛОНОЧНОЙ СИСТЕМЕ БАЗ ДАННЫХ
Приведены результаты сравнения процессов обработки запросов
в строчной и колоночной СУБД. Показано преобразование Лапласа —
Стилтьеса (ПЛС) времени обработки запроса с планом π
A
(
σ
F
(
R
))
в этих СУБД. Приведены также результаты сравнения среднего
времени выполнения запроса с указанным планом.
E-mail:
Ключевые слова
:
параллельные строчные и колоночные базы данных,
преобразование Лапласа — Стилтьеса, сравнение строчных и коло-
ночных систем баз данных
Введение.
К настоящему времени во многих организациях
накоплены колоссальные объемы данных, на основе которых можно
решать самые разнообразные аналитические и управленческие задачи
в любой сфере деятельности. Проблемы хранения и обработки анали-
тической информации становятся все более актуальными и привле-
кают внимание специалистов, работающих в области информацион-
ных технологий. Именно на решение этих задач направлены техноло-
гии, объединяющиеся под общим названием хранилища данных и
бизнес-анализа. По оценке Gartner, хранилища в ближайшей перспек-
тиве останутся одними из ключевых компонентов автоматизирован-
ных информационных систем предприятий [1].
Несмотря на то, что классические реляционные хранилища обес-
печивают наилучшее сочетание простоты, устойчивости, гибкости,
производительности, масштабируемости и совместимости, их показа-
тели по каждому из этих пунктов не обязательно выше, чем у анало-
гичных систем, ориентированных на какую-то одну особенность. Со-
гласно Майклу Стоунбрейкеру, пионеру исследований в области
больших баз данных [2], такая идея «безразмерности», когда тради-
ционная архитектура СУБД, изначально разработанная и оптимизи-
рованная для обработки бизнес-данных, используется для поддержки
приложений, требующих обработки больших объемов данных, боль-
ше не применима к рынку баз данных. Мир коммерческих СУБД бу-
дет дробиться на набор независимых, специализированных средств
управления базами данных [3].
Одним из основных и самых перспективных архитектурных ре-
шений для специализированных СУБД в области хранилищ данных
является колоночное хранение данных: большой потенциал колоноч-
ных систем подтверждают аналитические исследования и прогнозы
аналитиков [1, 3—5]. Например, в работе [5] показано 200-кратное