Получи случайную криптовалюту за регистрацию!

​​В NY Times большая статья на основе присланного из ByteDance | POLLACKOW PLUS

​​В NY Times большая статья на основе присланного из ByteDance внутреннего документа с описанием работы рекомендательного алгоритма TikTok. Документ называется TikTok Algo 101. И если вычленить из статьи самое главное, то тезисно мы имеем следующее описание алгоритма.

• Алгоритм TikTok решает четыре основные задачи: 用户 价值, 用户 价值 (长期), 作者 价值 и 平台 价值, которые компания переводит как «ценность для пользователя», «долгосрочная ценность для пользователя», «ценность для создателя» и «платформенная ценность».
• Система рекомендаций учитывает такие факторы, как лайки и комментарии, а также видеоинформацию, такую как подписи, звуки и хэштеги.
• Основной таргет приложения – постоянный прирост ежедневных активных пользователей. Для этого ByteDance оптимизировала и увязала друг с другом два показателя: «удержание пользователя» и «потраченное им время». Приложение хочет (сюрприз-сюрприз!), чтобы вы оставались там как можно дольше.
• С каждым видео, которое смотрит пользователь, позволяет алгоритму определить его музыкальные вкусы, его физическое влечение, депрессию, пристрастие к наркотикам и другую конфиденциальную информацию.
• Время просмотра - не единственный фактор, который учитывает TikTok. В документе показано приблизительное уравнение оценки видео, в котором прогноз, основанный на машинном обучении, и фактическое поведение пользователя суммируются для каждого из трех видов данных: лайков, комментариев и времени воспроизведения, а также указание на то, что видео просмотрено полностью:

Plike X Vlike + Pcomment X Vcomment + Eplaytime X Vplaytime + Pplay X Vplay

• Рекомендательная система выставляет оценки всем видео на основе этого уравнения и возвращает пользователям видео с наивысшими оценкам. Уравнение в документе сильно упрощено. Фактически используемое уравнение намного сложнее, но логика остается той же самой.
• Если пользователю нравится определенный жанр видео, но приложение продолжает предлагать ему такие же, ему быстро надоест, и он закроет приложение. В этом случае общая ценность, создаваемая пользователем, просматривающим одни и те же видео, ниже, чем ценность просмотра каждого отдельного видео, потому что повторяемость приводит к скуке.
• Преимущество соцсети перед конкурентами заключается в сочетании машинного обучения с фантастическими объемами данных, высокой заинтересованностью пользователей и настройкой, при которой пользователи могут потреблять контент, рекомендованный алгоритмами. Не это не какая-то алгоритмическая магия, как все думают.