С.В. Вельц
4
Кратко опишем принцип функционирования каждой из указан-
ных компонент.
Робот (краулер)
. Робот
(краулер) выполняет следующие функ-
ции: во-первых, реализует протоколы общения с социальными сетя-
ми (например, RESTful API); во-вторых, многие сайты имеют огра-
ничения на количество запросов в единицу времени, поэтому робот
использует несколько серверов с разными IP адресами для обхода
этих ограничений; в-третьих, при получении информации происхо-
дит извлечение признаков и приведение сообщения к стандартному
виду, пригодному для сохранения в БД (преобразуют JSON или XML
в вектора признаков).
Вероятностная модель на основе динамической байесовской
сети.
Байесовская сеть ― это графическая вероятностная модель,
представляющая собой ациклический ориентированный граф (DAG),
где вершины соответствуют случайным величинам, а ребра показы-
вают условную зависимость случайных величин между собой. Дина-
мическая байесовская сеть (DBN) ― байесовская сеть для меняюще-
гося во времени процесса, полученная связыванием байесовских
сетей для каждого отдельного момента времени между собой за счет
учета условной зависимости случайных величин в разные моменты
времени.
Структура модели показана на рис. 2.
Рис. 2.
Структура динамической байесовской сети
Множество вершин
DBN
V
разбивается на
слои
(непересекающиеся
подмножества), соответствующие моментам времени
1,...
t = ,T
:
2
1
T
DBN
V =V V
V
(3)
Внутри одного слоя ребер нет. Ребра идут от слоя
1
t
V
к
слою
.
t
V
Ребро существует в одном из двух случаев: между верши-