Таблица 1
Число
компонентов
смеси (
i
)
p
i
μ
i
σ
i
−
log
L
2
0,7859
0,2141
405,5742
428,3946
26,1263
55,1202
623,4226
3
0,0079
0,8659
0,1262
284
404,4091
459,9493
1,4750
∙
10
−
47
26,5587
39,4351
511,1917
4
0,0079
0,8889
0,0794
0,0238
284
403,9636
462,8248
5206295
1,4750
∙
10
−
47
25,7193
13,0430
9,8475
509,3467
5
0,0079
0,5822
0,2212
0,1649
0,0238
284
390,8118
421,8813
454,7080
520,6316
1,4750
∙
10
−
47
19,8015
7,4503
15,5392
9,8532
506,8277
6
0,0079
0,1492
0,3034
0,3421
0,1737
0,0237
284
365,8511
391,9288
419,6912
453,7003
520,6399
1,4750
∙
10
−
47
10,9004
7,1807
8,4154
16,0128
9,8515
503,5646
не изменяется при увеличении числа компонентов больше 6. При при-
менении алгоритма ARD EM оптимальное число компонентов равно 2.
Далее проведем аппроксимацию смесями распределений Пуассона.
Результаты показаны на рис. 5 и приведены в табл. 2.
Логарифм правдоподобия практически не изменяется при доба-
влении компонентов смеси, когда их число больше 5, причем при
добавлении нового компонента смеси, например шестого, параметры
распределений становятся неразделимы (
λ
3
и
λ
4
).
При сравнении результатов аппроксимации опытной плотности
распределения числа пакетов в единицу времени плотностями сме-
сей нормальных и пуассоновских распределений предпочтительным
является выбор смеси распределений Пуассона. Главным преимуще-
ством является возможность статистического разделения на кластеры.
В случае смеси нормальных распределений, как следует из рис. 4 и
табл. 1, компоненты смеси практически неразделимы. В случае сме-
си пуассоновских распределений при правильном определении числа
компонентов возможно осуществить кластеризацию для последующей
обработки, в частности для построения матрицы переходных вероят-
ностей скрытой марковской цепи, управляющей процессом поступ-
ления трафика. Определение числа компонентов проводится согласно
алгоритму ARD EM, а также по изменению значений правдоподобия.
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012
147