К.Л. Тассов, Д.Е. Бекасов
12
лизирующихся только на отслеживании объекта (позволяют адапти-
роваться к изменению цели, но не справляются с исчезновениями
объекта) или только на покадровом поиске объекта (естественно
справляется с исчезновением (полным перекрытием), но не позволяет
отслеживать изменения, происходящие с целью), TLD использует обе
идеи и скрепляет их стадией обучения, на которой с помощью специ-
альной экспертной системы происходит корректировка ошибок от-
слеживания и поиска.
TLD
состоит из трекера, анализирующего движение цели от кадра
к кадру (и не справляющегося с ситуацией полного перекрытия) и
детектора, независимо сканирующего каждый кадр последовательно-
сти (и не справляющегося с изменением состояния цели). При этом
детектор может совершать ошибки двух типов: ложные срабатывания
и ложные отказы. Обучающий компонент отслеживает состояние и
трекера, и детектора и генерирует обучающую выборку для умень-
шения числа ошибок последнего. При этом обучающий компонент
предполагает возможность одновременного выхода из строя и треке-
ра, и детектора. В процессе обучения детектор обучается определять
более широкий диапазон вариаций представления цели и четче раз-
делять цель с задним фоном.
Особый интерес представляет предлагаемый обучающий компо-
нент (P-N Learning). Основная идея состоит в использовании двух
экспертов: P-эксперта, определяющего только ложные отказы, и N-
эксперта — ложные срабатывания. Несмотря на то что сами эксперты
допускают ошибки, их независимое использование компенсирует их
ошибки.
Детектор включает в себя бинарный классификатор, сканирующее
окно и модель цели, состоящую из обучающей выборки примеров
представления цели. Каждый элемент выборки обрабатывается неза-
висимо от других. При наличии
N
узлов в регулярной сетке сканиро-
вания получается 2
N
комбинаций для данного кадра. При этом может
быть ситуация, когда одной цели соответствует сразу несколько ме-
стоположений, что невозможно, так как нарушается связность движе-
ния. В этом случае возникает «ложное срабатывание». Именно связ-
ность движения является одним из главных параметров для определе-
ния ошибок детектора. P-эксперт использует временную связность и
предполагает, что цель движется по траектории. Он применяет резуль-
таты работы трекера для оценки перемещения цели и, если детектор
отбраковывает наиболее вероятное (с точки зрения трекера) местопо-
ложение цели, генерирует соответствующую обучающую выборку.
Она генерируется из текущей цели с помощью перемещений, масшта-
бирований и поворотов (около 100 экземпляров). N-эксперт использу-
ет пространственную связность цели и предполагает, что цель может