26 июня 2015 3338

Ди-Ай-Эс-Си-О. Яндекс представил рекомендательную технологию Диско


Представили диско за 40 лет до Яндекса

Сегодня многие сервисы активно внедряют системы персональных рекомендаций, которые экономят пользователю время и помогают сделать оптимальный выбор. Яндекс также озаботился разработкой такой системы, получившей название Диско. Новая технология используется в уже знакомых сервисах компании — в МузыкеРадиоМаркете и Видео.

Как сообщают в Яндексе, технология была названа в честь жанра диско. Музыкальная тематика неслучайна — именно на Яндекс.Музыке впервые появились персональные рекомендации. Кроме того, слово «диско» созвучно английскому discovery в значении «открытие нового», что оптимально описывает суть технологии.

Поиск предпочтений

Технология работает по сложному алгоритму. Прежде чем дать какой-либо совет, необходимо узнать о вкусах конкретного пользователя. В этом Яндекс.Диско помогают несколько источников — поисковые запросы, данные технологии Крипта (пол, примерный возраст, род занятий), а также сведения от сервиса, для которого составляются рекомендации. Например, в Маркете есть информация о том, какие товары просматривал человек, а в Музыке и Радио — какие треки он слушал. Само собой, все данные обезличены.

Сигналы о предпочтениях пользователя могут быть положительными и отрицательными. Например, в Яндекс.Радио и Яндекс.Музыке композиции, которые пришлись не по душе, можно пропускать или отмечать оценкой «не нравится». Это отрицательный сигнал — он говорит о том, что в дальнейшем человеку такую музыку рекомендовать не надо.

Кроме того, сигналы могут отличаться по весу. И оценка «мне нравится», и факт прослушивания трека от начала до конца являются положительными сигналами, но у первого вес будет больше.

Составление рекомендаций

Составляя рекомендации, Диско использует три разных подхода.

Первый подход опирается на информацию об объектах и связях между ними. Например, про любой музыкальный трек известно, на каком альбоме он вышел, кто его исполняет и к какому жанру он относится. Проанализировав связи, можно посоветовать пользователю похожую музыку. Скажем, если человек часто слушает рок, ему можно предложить другие треки этого жанра.

В основе второго подхода лежит информация о связях между людьми. Благодаря Крипте известны пол, примерный возраст и предположительный род занятий каждого пользователя. Установлено, что людей, у которых эти характеристики совпадают, часто интересуют похожие исполнители. Даже если человек пользуется сервисом впервые и ещё не успел ничего послушать, можно проверить, что смотрят, слушают люди со схожими характеристиками — и предложить ему такую же музыку.

Третий подход использует данные о взаимодействиях пользователей с объектами. Взаимодействием можно считать, например, факт просмотра видеоролика или оценку «нравится», поставленную музыкальному треку. Опираясь на известные взаимодействия, можно предсказать, как пользователи отреагируют на те или иные объекты — например, какую оценку они поставят фильму, который пока не видели.


У каждого из подходов есть свои достоинства. Первый подход позволяет посоветовать человеку редкие объекты, которыми мало кто интересуется — например, малоизвестную музыкальную группу. Второй подход даёт возможность составлять рекомендации для людей, которые оказались на сервисе впервые. Третий подход позволяет найти нетривиальные закономерности: скажем, может выясниться, что люди, которые интересуются надувными бассейнами и фитнес-трекерами, чаще других покупают кофеварки.

Обработка рекомендаций

Все рекомендации от различных моделей обрабатывает метод машинного обучения Матрикснет. Его задача — составить сочетание рекомендаций, которое бы идеально соответствовало интересам пользователя в данный момент.

Решая эту задачу, Матрикснет учитывает множество факторов. Например, фактор разнообразия — людям, у которых в плейлистах соседствуют треки разных жанров и исполнителей, стоит советовать более разнообразную музыку, чем тем, кто привык включать альбом и слушать его от начала до конца. Или фактор популярности — кто-то предпочитает слушать музыку, которую часто крутят радиостанции, а кто-то любит редкие треки, которые известны только узкому кругу меломанов.

Результат работы Матрикснета — финальный список рекомендаций. Его пользователь и видит на сервисе — например, на главной странице Яндекс.Музыки или в разделе «Популярные товары» на Яндекс.Маркете.