Алгоритм ленты новостей Facebook

Опубликовано: 8 Июля, 2021

Вы когда-нибудь замечали, как новостные ленты множества сайтов и приложений социальных сетей сильно отличаются от одного человека к другому? Кажется, что каждый канал был адаптирован для конкретного человека, чтобы доставлять контент, который был спрогнозирован , чтобы обеспечить идеальную платформу для пользователей. Ключевое слово «Прогноз» здесь позволяет сделать вывод о том, что, вероятно, за точным уникальным расположением публикаций на мега-социальных платформах, таких как Facebook, Instagram и Twitter, стоит машинное обучение. Этот вывод в наши дни, когда машинное обучение является обычным жаргоном, обязательно будет правильным. Фактически, Facebook был первой платформой, которая перешла от хронологической стены к каналу, основанному на алгоритмах. Другие каналы социальных сетей сейчас следуют тенденции, которую впервые заложил Facebook.

Итак, давайте рассмотрим пример этого законодателя моды и исследуем алгоритм, лежащий в основе ленты новостей Facebook .

Алгоритм новостной ленты за годы претерпел несколько изменений. Раньше, еще в 2015 году, в основе ленты Facebook лежал алгоритм Edge Rank . Для определения порядка постов использовался ранговый подход, определяемый тремя параметрами: Affinity Score, Edge Weight и Time Decay, обсуждаемые в статье за ссылкой ниже.

Теперь алгоритм новостной ленты был переработан в подход машинного обучения, который учитывает более 10000 весов. В настоящее время алгоритм ориентирован на сообщения, которые, как предполагается, будут способствовать «активному взаимодействию» . Этот термин означает, что алгоритм прогнозирует оценки, присваивая больший вес параметрам, которые делают сообщение личным и достойным обсуждения.

Четыре части этого алгоритма вместе с некоторыми из этих параметров, как описано Адамом Моссери (когда-то руководителем ленты новостей Facebook, а теперь - руководителем Instagram), следующие:

Инвентарь:
Сюда входят все сообщения в очереди, которые еще не были просмотрены конечным пользователем. Эти сообщения включают рекламный контент, сообщения со страниц, на которые вы подписаны, а также материалы от друзей. Тысячи таких постов должны соревноваться друг с другом каждый день, чтобы подняться в глазах алгоритмического арбитра. В конце концов, только несколько сотен из них попадают в новостную ленту пользователя после того, как алгоритм принял решение с учетом параметров.

Сигналы:
На этом этапе все внимание уделяется содержанию. Каждый пост анализируется на основе доступных данных, таких как:

  • Количество лайков, комментариев, репостов и реакций
  • Тип публикации (видео, изображения, письменный контент)
  • Владелец поста
  • Время и день публикации
  • Скорость интернет-соединения
  • Тип используемого устройства
  • Заблокированный контент
  • Помечено как спам
  • Время, потраченное на публикацию
  • 50 лучших взаимодействий
  • Включение видео (включение звука, переход в полноэкранный режим или HD)

Вышеуказанные сигналы генерируются пользователями и имеют вес. Например, публикация сообщения (личного / общедоступного) имеет больший вес, чем лайк или реакция на него. Точно так же контент от семьи и друзей обычно имеет больший вес, чем контент со страниц, на которые вы переходите, в зависимости от собранной информации.

Прогнозы:
Вышеописанные данные затем используются для принятия обоснованных решений. Алгоритм пытается делать прогнозы на основе доступной информации, чтобы определить, что пользователи предпочитают видеть в своей ленте, что они могут скрывать, насколько вероятно, что они будут активно взаимодействовать с ней или игнорировать ее. Например, сообщение от друга, который ранее получал комментарий от пользователя к аналогичному сообщению в прошлом, скорее всего, будет интересовать пользователя контентом с просматриваемой страницы, которая ранее получила лайк от того же пользователя. Если видеоконтент привлекает больше внимания, чем письменные материалы или изображения, такие сообщения, по прогнозам, будут предпочтительнее для пользователя.

Подсчет очков:
Эти прогнозируемые сообщения в отдельных сценариях вместе с весами используются для получения оценки релевантности. Затем сообщения упорядочиваются на основе этого результата в порядке убывания. Эти сообщения затем доставляются в установленной последовательности в ленту новостей.
Таким образом, алгоритм новостной ленты описывается как подход «ранжирование для организации».

Другие алгоритмы новостной ленты также построены на аналогичных принципах. Однако алгоритм Facebook является самым сложным из всех существующих сегодня алгоритмов ленты новостей. Загадка, лежащая в основе детальной работы этого сложного алгоритма, заключается в том, что препятствует простоте доверия к работе Facebook и исследователей за кулисами. Тем не менее, он постоянно развивается и преодолевает барьеры ИИ, чтобы предоставить платформу, предназначенную для соединения людей.