Использование графовых баз данных в целях оптимизации анализа
…
1
УДК 004.652.5
Использование графовых баз данных
в целях оптимизации анализа биллинговой
информации
© М.В. Бартенев, И.Э. Вишняков
МГТУ им. Н.Э. Баумана, Москва, 105005, Россия
Сформулированы основные задачи обработки биллинговой информации и рас-
смотрена возможность оптимизации их решения с использованием графовых баз
данных, поскольку они обеспечивают наиболее естественное представление и до-
полнительные средства эффективной реализации алгоритмов анализа связей в
социальных сетях. Выпо
л
нен краткий обзор графовых систем управления базами
данных Sones, Neo4J и DEX и предоставляемых ими средств, а также сравнитель-
ное тестирование их производительности и реляционной системы управления ба-
зами данных Microsoft SQL Server 2012 на поставленных задачах анализа инфор-
мации. Сделан вывод о применимости той или иной базы данных в зависимости от
объема обрабатываемых данных.
Ключевые слова
: NoSQL, графовые базы данных, анализ биллинговой информации.
Введение.
С 1980-х годов реляционные системы управления ба-
зами данных (СУБД) стали занимать доминирующее положение сре-
ди средств хранения данных. Несмотря на то что реляционные
хранилища обеспечивают наилучшее сочетание простоты, устойчи-
вости, гибкости, производительности, масштабируемости и совме-
стимости, их показатели по каждому из этих пунктов не обязательно
выше, чем у аналогичных систем, ориентированных на какую-то од-
ну особенность. Однако универсальность реляционных СУБД пере-
вешивала какие-либо другие недостатки.
Сегодня ситуация несколько иная. Появившиеся в последние го-
ды так называемые NoSQL (Not only SQL, не только SQL) хранилища
реализуют модели данных, имеющие существенные отличия от тра-
диционной реляционной модели. Основная их цель — расширить
возможности баз данных (БД) в тех областях, где реляционная мо-
дель и SQL недостаточно гибки, и не вытеснять их там, где они
справляются со своими задачами. Создатели таких БД среди множе-
ства преимуществ использования NoSQL-решений называют высо-
кую производительность при использовании специфических моделей
данных и легкость работы с ними.
Одним из наиболее популярных и актуальных подвидов нереля-
ционных хранилищ являются графовые БД [1]. Как ясно из названия,