Kion запустил рекомендации

Иллюстрация сгенерирована нейросетью Шедеврум
Главная метрика любого онлайн-кинотеатра — это вовлеченность. У вас может быть база в десятки миллионов пользователей, но какой в ней смысл, если в среднем они проводят на платформе не так уж много времени? Удержать подписчика, который посмотрел пару сериалов и больше не заходил на сервис, сложно. И что самое ужасное для бизнеса — он может таки отменить подписку. Можно, конечно, залезть в бандлы/пакеты, можно запустить продажи подписки на год с безумной скидкой, но результат предсказуем. Даже состоятельные парни рано или поздно задумываются: а чего это каждый месяц приходит SMS о списании? Не пора ли отключить эту подписку просто для того, чтобы не приходило это оповещение?

Собственно, именно поэтому священный грааль любого видео-сервиса — рекомендации. Считается, что в совершенстве этим овладели лишь два игрока — YouTube и Netflix. Да, у них разный контент, у одного UGC, у другого упор на съемки оригинального и своего, но в основе лежат данные о пользователях, которые они собирали не просто годами — десятилетиями. Секрет рекомендаций этих платформ прост: если вы посмотрели какие-то десять единиц контента, то система собирает группу пользователей, которые смотрели те же самые десять единиц контента. После этого в этой группе выявляются совпадения по другим единицам контента. Затем получившийся список очищается от тех единиц, которые уже смотрел сам пользователь. И вот — практически идеальный список рекомендаций готов.

Такой объем данных о смотрении, повторимся, есть только у нескольких старожилов. Остальным приходится придумывать велосипед. Сегодня о таком велосипеде рассказал Kion. Мы не будем повторять маркетинговые мантры об AI-сервисе, нейросети и прочей чепухе. Система рекомендаций — это алгоритм, все, что нужно алгоритму — это данные. По большому счету, и мартышку можно научить делать всякие трюки, но это не означает, что у нее появится интеллект.

Как работают рекомендации Kion? Пишут, что алгоритм работает в два захода. В первый отбираются фильмы, которые гипотетически могут понравятся пользователю. Учитывается жанр, ключевые слова и разметка в описании единицы контента, а так же «то, что люди чаще всего смотрят вместе с той или иной картиной». На втором этапе определяется релевантность контента, собранного в список на первом этапе, тому контенту, который пользователь добавил в первую выборку.

В качестве примера приводится кейс: если вы добавили в выборку Сумерки и Интерстеллар, то вам порекомендуют Три тысячи лет желаний. И это очень странная рекомендация. Ну то есть если предположить, что запрос интерпретируется как «покажи мне что-то очень длинное, душное, занудное, желательно с какой-то чертовщиной, но красиво снятое», то да, Три тысячи лет желаний подойдут. Но в реальности смотреть этот ужасно нудный и затянутый фильм мы не рекомендуем никому. С другой стороны, фильма «Приключения вампиров в черной дыре» еще не сняли. Наверное. На порнохабе не проверяли.