ISSN 1812-3368. Вестник МГТУ им. Н.Э. Баумана. Сер. «Естественные науки». 2012
161
В общем случае если периоды трех производных подпоследова-
тельностей равны
М
1
,
М
2
и
М
3
соответственно, скрытый период всей
анализируемой последовательности ДНК
М
3
НОК
(
М
1
,
М
2
и
М
3
),
где НОК — наименьшее общее кратное. Таким образом, при фор-
мальной обработке оценка размера алфавита паттерна периодичности
будет не менее чем 3
М
1
М
2
М
3
,
если числа
М
1
М
2
и
М
3
попарно вза-
имно простые. Но в этом случае без учета внутренней декомпозиции
размер алфавита случайного паттерна не превышает числа
М
1
+
М
2
+
+
М
3
,
т. е. в несколько раз меньше формальной оценки.
Примеры декомпозиции случайных паттернов скрытой пе-
риодичности.
Первичная декомпозиция паттерна скрытой профиль-
ной периодичности выполнена для более чем 12 000 CDS из генома
человека (база данных KEGG [5]), кодирующих белки с исследован-
ными физико-химическими свойствами. В результате компьютерной
обработки были получены формальные оценки паттерна периодич-
ности для каждой CDS и трех ее производных подпоследовательно-
стей, соответствующих позициям триплетов нуклеотидов. Согласно
спектрально-статистическому подходу, возможность такой декомпо-
зиции обусловлена наличием 3-регулярности (систематическое чере-
дование пиков через 2 нукл.) в характеристических спектрах этих
CDS. Более детальную декомпозицию случайных паттернов перио-
дичности рассмотрим на конкретных примерах CDS из базы данных
KEGG, используя спектрально-статистический подход [2, 4].
Проведем декомпозицию CDS гена аполипопротеина A-II чело-
века. Согласно спектрально-статистическому подходу [2, 4], спектр
D
1
отклонения от однородности (рис. 1,
а
)
выявляет неоднородность
этой последовательности. Ее характеристический спектр
Н
(
рис. 1,
б
)
указывает на формальную оценку размера случайного паттерна
скрытой профильности в 9 нукл. Однако спектр отклонения от
3-
профильности позволяет снизить эту оценку до 3 нукл., что не про-
тиворечит характеристическому спектру, поскольку амплитуда пика
на 9 нукл. (рис. 1,
в
,
г
)
незначительно отличается от других пиков на
тестируемых периодах, кратных 3. В трех производных подпоследо-
вательностях этого CDS (рис. 2,
а
в
)
выявляется их однородность,
т. е. скрытая периодичность в 1 нукл.
Оценки профильных матриц паттернов периодичности, состоя-
щих из одного столбца, для трех подпоследовательностей, соответ-
ствующих первой, второй и третьей позициям триплетов, приведены
на рис. 2,
г
.
Фактически эти три столбца образуют матрицу случайно-
го паттерна 3-профильной периодичности CDS. Графическая визуа-
лизация столбцов этой матрицы показана на рис. 2,
д
,
где можно ви-
деть сходство графического представления случайных букв в первой
и третьей позициях паттерна периодичности анализируемых CDS.