Анализ алгоритмов обучения коллаборативных рекомендательных систем - page 5

Анализ алгоритмов обучения коллаборативных рекомендательных систем

Для компенсирования эффекта переобучения добавляется пара-

метр регуляризации. Иными словами, накладывается штраф за слиш-

ком большие значения обучаемых переменных. Например, можно

просто добавить в функцию ошибки сумму квадратов всех факторов

и предикторов. В результате функция ошибки выглядит как

( )

(

)

(

)

* * *

, ,

arg min

b p g

i a

a i

i a

i i

a a

b q p

b b q p

b q

∑ − − − −

+ ∑ + ∑ + +

(2)

где

— параметр регуляризации.

Если взять у функции ошибки в формуле (2) частные производ-

ные по каждой из оптимизируемых переменных, получим простые

правила для градиентного (стохастического) спуска:

(

)

(

)

(

)

(

)

λ ,

i a

a j

i a i j

a j

i j

i a i j

i j

b b e b

q q

e p q

p p e p p

= + −

= +

−

= =

−

для всех

, где

i, a

–

ṙ

i, a

— ошибка на данном тестовом примере,

— скорость обучения. Эта модель называется SVD++.

Рассмотрим пример использования описанного выше алгоритма

для следующего случая:

• количество пользователей

= 50;

• количество категорий предпочтения (товар, категории статей,

жанр литературы и т.д.)

= 10;

• степень сингулярного разложения

= 2;

• матрица рейтингов создается с помощью генератора случайных

чисел, которые могут принимать следующие значения:

▫ 0 — категория предпочтений не просматривалась;

▫ 1 — категория предпочтений просматривалась, но не вызвала

ответной реакции пользователя;

▫ 2 — категория предпочтений просматривалась и вызвала ответ-

ную реакцию пользователя.

В результате выполнения алгоритма получаются следующие ре-

зультаты для всех пользователей по всем категориям:

• вектор базовых предикатов пользователей (

);

• вектор базовых предикатов категорий (

);

• матрица векторов факторов категорий (

a, j

);

• матрица векторов факторов пользователей (

i, j

);

• средний рейтинг по базе

(μ)

SEO Version

Warning.

You are currently viewing the SEO version of !text.
It has a number of design and functionality limitations.

We recommend viewing the Flash version or the basic HTML version of this publication.

1,2,3,4 6,7,8