Таблица 1
Число
компонентов
смеси (
i
)
p
i
μ
i
σ
i
log
L
2
0,7859
0,2141
405,5742
428,3946
26,1263
55,1202
623,4226
3
0,0079
0,8659
0,1262
284
404,4091
459,9493
1,4750
10
47
26,5587
39,4351
511,1917
4
0,0079
0,8889
0,0794
0,0238
284
403,9636
462,8248
5206295
1,4750
10
47
25,7193
13,0430
9,8475
509,3467
5
0,0079
0,5822
0,2212
0,1649
0,0238
284
390,8118
421,8813
454,7080
520,6316
1,4750
10
47
19,8015
7,4503
15,5392
9,8532
506,8277
6
0,0079
0,1492
0,3034
0,3421
0,1737
0,0237
284
365,8511
391,9288
419,6912
453,7003
520,6399
1,4750
10
47
10,9004
7,1807
8,4154
16,0128
9,8515
503,5646
не изменяется при увеличении числа компонентов больше 6. При при-
менении алгоритма ARD EM оптимальное число компонентов равно 2.
Далее проведем аппроксимацию смесями распределений Пуассона.
Результаты показаны на рис. 5 и приведены в табл. 2.
Логарифм правдоподобия практически не изменяется при доба-
влении компонентов смеси, когда их число больше 5, причем при
добавлении нового компонента смеси, например шестого, параметры
распределений становятся неразделимы (
λ
3
и
λ
4
).
При сравнении результатов аппроксимации опытной плотности
распределения числа пакетов в единицу времени плотностями сме-
сей нормальных и пуассоновских распределений предпочтительным
является выбор смеси распределений Пуассона. Главным преимуще-
ством является возможность статистического разделения на кластеры.
В случае смеси нормальных распределений, как следует из рис. 4 и
табл. 1, компоненты смеси практически неразделимы. В случае сме-
си пуассоновских распределений при правильном определении числа
компонентов возможно осуществить кластеризацию для последующей
обработки, в частности для построения матрицы переходных вероят-
ностей скрытой марковской цепи, управляющей процессом поступ-
ления трафика. Определение числа компонентов проводится согласно
алгоритму ARD EM, а также по изменению значений правдоподобия.
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012
147
1...,5,6,7,8,9,10,11,12,13,14 16,17,18,19,20