Биология - Slope One - Коллаборативная фильтрация по предметам на основании статистики покупок

19 мая 2011


Оглавление:
1. Slope One
2. Фильтрация по схожести предметов и переобучение
3. Коллаборативная фильтрация по предметам на основании статистики покупок
4. Коллаборативная фильтрация Slope One для предметов с оценками
5. Рекомендательные системы, использующие Slope One



Далеко не всегда у пользователей есть возможность выставлять оценки предметам. То есть для коллаборативной фильтрации могут быть доступны всего лишь двоичные данные. В таких случаях Slope One и другие алгоритмы, зависящие от оценок предметов, неэффективны.

Примером алгоритма коллаборативной фильтрации по предметам, работающего с двоичными данными, является запатентованный алгоритм Item-to-Item использующийся в онлайн-магазине Amazon. Этот алгоритм рассчитывает подобие предметов как косинус между векторами покупок в матрице пользователей и предметов:

\mbox{similarity} = \cos = \frac{\vec{A} \cdot \vec{B} }{  \Vert \vec{A} \Vert * \Vert \vec{B} \Vert }

Этот алгоритм, возможно, даже проще чем Slope One. Рассмотрим его работу на примере:

Статистика покупок
Покупатель Предмет 1 Предмет 2 Предмет 3
Джон Купил Не покупал Купил
Марк Не покупал Купил Купил
Люси Не покупала Купила Не покупала

В этом случае косинус между «Предмет 1» и «Предмет 2» рассчитывается так:

\frac{\cdot }{  \Vert\Vert * \Vert\Vert }= 0,


между «Предмет 1» и «Предмет 3»:

\frac{\cdot }{  \Vert\Vert * \Vert\Vert }= \frac{1}{\sqrt{2}} \approx 0.71 ,


и между «Предмет 2» и «Предмет 3»:

\frac{\cdot}{  \Vert\Vert * \Vert\Vert }= \frac{1}{2} = 0.5 .


Таким образом, пользователь, находящийся на странице описания «Предмета 1», получит «Предмет 3» в качестве рекомендации; на странице «Предмета 2» — «Предмет 3» и на странице «Предмета 3» — «Предмет 1». В данном алгоритме используется один коэффициент на каждую пару предметов, на основании которого и создаются рекомендации. То есть для n предметов потребуется рассчитать и сохранить n/2 косинусов.



Просмотров: 12370


<<< Birds of a Feather (информатика)
User-generated content >>>