Использование графовых баз данных в целях оптимизации анализа биллинговой информации - page 7

Использование графовых баз данных в целях оптимизации анализа
7
Таблица 4
10 000 000 вершин и 90 000 000 ребер
Тестовая БД
Время, с
Размер Бб,
МБ
импорта
данных
поиска соседей
вершины до макси-
мального уровня
поиска пересечения
множеств соседей
для двух вершин
Sones
Н/д
Н/д
Н/д
Н/д
Neo4J
12 270
Н/д
Н/д
13 215
DEX
2045
73
143
18 103
SQL Server 7392
612
1398
26 209
Несмотря на то что данные в Sones полностью содержатся в опе-
ративной памяти и никакие операции чтения/записи с жесткого диска
не совершаются, импорт данных в нее все равно занял больше всего
времени. При операциях импорта на небольших объемах данных (те-
стовые наборы 1 и 2) наилучшую производительность показала
Neo4J, но она резко снизилась на больших графах. На тестовых гра-
фах 3 и 4 бесспорным лидером оказалась графовая БД DEX. Послед-
ний граф загрузить в БД Sones вообще не удалось в связи с отсут-
ствием большого количества оперативной памяти.
При выполнении аналитических операций на маленьких графах
все испытуемые БД показали адекватные результаты, но на больших
объемах данных производительность Neo4J, как отмечалось, очень
заметно снизилась, и дождаться выполнения операции не удалось.
DEX GraphDB показывает достойные результаты во всех тестах (см.
также [1]).
Заключение.
В статье проведено исследование трех графовых БД
с целью определения возможности их использования для оптимизации
анализа биллинговой информации. Из полученных результатов можно
сделать вывод о том, что все они вполне жизнеспособны и показывают
неплохие результаты, особенно на небольших объемах данных. Одна-
ко графовой БД Sones вряд ли найдется применение в реальном мире,
поскольку она хранится только в оперативной памяти и при этом про-
игрывает по производительности всем остальным БД. Neo4J может
быть использована в качестве хранилища для обработки небольших
подграфов, объемом до 1,5 млн объектов, поскольку с такими графами
она работает очень быстро. Кроме того, Neo4J, являясь наиболее по-
пулярной графовой БД, обладает огромным набором различных API
для разных языков программирования и множеством дополнительных
функций, что делает ее наиболее простой в работе.
БД DEX является единственным из рассмотренных продуктов,
способным действительно быстро обрабатывать большие графы.
Время выполнения в ней линейно зависит от количества загружен-
1,2,3,4,5,6 8
Powered by FlippingBook