ISSN 1812-3368. Вестник МГТУ им. Н.Э. Баумана. Сер. «Естественные науки». 2012
158
УДК 577.2:519.23
В. А. К у т ы р к и н , М. Б. Ч а л е й
ДЕКОМПОЗИЦИЯ СТРУКТУРЫ ПАТТЕРНА
СКРЫТОЙ ПРОФИЛЬНОЙ ПЕРИОДИЧНОСТИ
В ПОСЛЕДОВАТЕЛЬНОСТЯХ ДНК
Рассмотрены методы декомпозиции случайных паттернов перио-
дичности кодирующих последовательностей ДНК, в которых
наблюдается скрытая профильная периодичность. Наблюдаемое
в таких последовательностях явление 3-регулярности, обуслов-
ленное триплетным генетическим кодом, позволило значительно
повысить эффективность процесса декомпозиции.
E-mail:
Ключевые слова
:
скрытая профильная периодичность, спектрально-
статистический подход, кодирующие районы ДНК, декомпозиция пат-
терна периодичности.
Понятие скрытой профильной периодичности (профильности) в
последовательностях ДНК введено в работе [1]. Для распознавания
наличия профильности в ДНК был разработан специальный спек-
трально-статистический подход [2, 4]. Согласно этому подходу, по-
следовательность ДНК рассматривается как реализация случайной
строки, составленной из независимых случайных букв, каждая из ко-
торых задается вероятностным распределением четырех букв алфа-
вита ДНК, соответствующих четырем нуклеотидам (нукл.):
A
—
аде-
нин,
T
—
тимин,
G
—
гуанин,
C
—
цитозин. Такую случайную стро-
ку называют периодичной, если ее можно представить в виде
последовательного повторения некоторой подстроки, называемой
паттерном периодичности. Если вся строка периодична, ее называют
случайным тандемным повтором, определяемым таким паттерном.
В этом случае паттерн, состоящий из строки случайных букв, опре-
деляет мультиполиномиальную схему из
N
независимых испытаний,
где
N
—
длина случайного тандемного повтора и его реализаций (по-
следовательностей ДНК). Если паттерн схематически представлен в
виде строки
1
, ...,
L
P C C
,
где
1
, ...,
L
C C
—
случайные буквы, слу-
чайный тандемный повтор имеет вид
1
...
...
,
M
P P C C
где
0
M L
.
При этом паттерн в виде заданной строки случайных букв определяет
профиль мультиполиномиальной схемы из
N
независимых испыта-
ний. Таким образом, мультиполиномиальная схема получена соот-
ветствующим сцеплением полиномиальных схем, каждая из которых
определяется одной из случайных букв в составе паттерна.
МОДЕЛИРОВАНИЕ В БИОЛОГИИ