Как работает алгоритм Твиттера в 2023

Илон Маск выполнил свое обещание и выложил алгоритм Twitter в открытый доступ, а точнее код залили на GitHub, где его и проанализировали энтузиасты. Какую пользу из этого можем извлечь мы, контент-креаторы из других соцсетей? А очень даже конкретную, другие соцсети скрывают работу своих алгоритмов, но мы-то понимаем, что на всех площадках это плюс-минус похожая история. Я собрала в публикации ряд наиболее значимых моментов из алгоритма ранжирования Twitter👇🏼

Часть 1. Как работает алгоритм Twitter

Twitter зарабатывает деньги на том, что показывает нам рекламу. Чем больше рекламы мы смотрим, тем больше денег зарабатывает Twitter. Поэтому главная задача алгоритма — показать такой контент, который заставит нас проводить в приложении все больше и больше времени.

Для этого алгоритм пытается угадать:

  • Какой тип контента конкретный пользователь скорее всего оценит?
  • Что популярно у пользователей с похожими предпочтениями?

Алгоритм делает это в 3 шага:

  1. Он угадывает, какие из 100 миллионов твитов на платформе наиболее вероятно вам понравятся.
  2. Он присваивает каждому твиту "оценку вероятности взаимодействия" и ранжирует их от лучшего к худшему. Самые лучшие твиты — это те, с которыми вы, вероятно, провзаимодействуете.
  3. Очищает список твитов, удаляя дезинформацию, заблокированные аккаунты и т.д. и показывает твиты с наивысшей оценкой первыми, вставляя рекламу после каждых 2-3 твитов.

И то, что Twitter показывает нам после этих 3 шагов и называется "лентой Twitter".

Понимание того, как он выбирает, ранжирует и фильтрует твиты, может помочь создавать высоко ранжируемый контент, который увидят миллионы пользователей.

алгоритм Твиттера, алгоритмы работы соцсетей

Как алгоритм находит соответствующие твиты, ранжирует и фильтрует их?! 

Источники кандидатов (Выбор твитов)

Twitter использует три типа данных:

  • Граф подписчиков, указывающий, кто следит за вами
  • Данные об активности, такие как лайки, ретвиты и ответы
  • Данные пользователя, такие как скрытие, отписка и жалобы на спам

На основе этих данных Twitter пытается выбрать лучшие 1500 твитов из множества сотен миллионов: 50% вашей ленты или 750 твитов формируются из контента людей на которых вы подписаны. 

Внутри сети используется сложная логистическая регрессионная модель, которая тщательно отбирает самые важные и актуальные сообщения от пользователей, на которых вы подписаны. Это происходит через реальный граф. Он предсказывает вероятность взаимодействия двух пользователей. Чем выше оценка, тем вероятнее, что они будут видны в вашей ленте. Лучшие твиты проходят на следующий уровень.

Следующие около 50% вашей ленты или 750 твитов формируются из твитов людей на которых вы не подписаны.

Как мы можем определить, будет ли определенный твит для вас актуальным, если вы не подписаны на автора? Twitter использует 2 подхода:

  • Социальный граф. Эти твиты в настоящее время составляют примерно 15% твитов на главной странице.

При этом учитываются 2 вещи: с какими твитами недавно взаимодействовали люди, на которых я подписан? Кому нравятся похожие твиты и что они недавно лайкнули?

Затем твиты, полученные в результате этого, ранжируются с использованием логистической регрессионной модели - GraphJet, графового обработчика, который поддерживает граф взаимодействий в реальном времени между пользователями и твитами.

  • Вложенные пространства, которые работают на основе сходства контента. Какие твиты и пользователи похожи на ваши интересы?

Одним из наиболее полезных вложенных пространств в Twitter являются SimClusters. SimClusters алгоритм использует ваш контент, чтобы категоризировать вас вместе с другими похожими пользователями и создавать кластеры. И таким образом ваш контент показывается другим людям еще не подписанным на вас. 

Существует 145 тысяч сообществ, которые обновляются каждые три недели. Пользователи и твиты представлены в пространстве сообществ и могут принадлежать нескольким сообществам. Сообщества могут варьироваться от нескольких тысяч пользователей для индивидуальных групп друзей до сотен миллионов пользователей для новостей или поп-культуры.

Люди внутри тематического кластера чаще видят посты друг друга. По этой причине логичной выглядит рекомендация специалистов по соцсетям придерживаться в блоге конкретной выбранной темы, узкой ниши, так нас проще распределять по кластерам и показывать интересующимся людям внутри кластера.

как устроены кластеры внутри Твиттера

Система ранжирования

💡 Мы знаем очевидные вещи, что на охваты влияют лайки, ретвиты, ответы, изображения, видео, переходы в профиль, Twitter Blue - синяя галочка, репутация аккаунта, новые слова, неизвестный язык, ссылки, дезинформация, хэштеги, тип текста и т. Д.

Эти переменные положительно и отрицательно влияют на ранжирование вашего твита и в конечном итоге определяют, будет ли ваш твит выбран среди топ-1500 твитов или нет.

Переменнаяположительное ранжированиеВес
Лайкиположительное ранжирование30x
Ретвитыположительное ранжирование20x
Ответы положительное ранжирование1x
Изображение и видеоположительное ранжирование2x
Twitter Blueположительное ранжирование2x
Хорошая репутация аккаунта (рассчитывается на основе соотношения подписчиков, использования, верификации, был ли бан)положительное ранжирование 
Новые слова или неизвестный языкотрицательное ранжирование0,01x
Ссылки (если у вас низкая активность)отрицательное ранжирование 
Дезинформацияотрицательное ранжирование 
Несколько хэштеговотрицательное ранжирование 
Тип текстаотрицательное ранжирование 
Взаимодействие с аккаунтами низкого качества и темами из черного спискаотрицательное ранжирование 
Запрос "показывать реже" для вашего твита/вас, блокировка/скрытие вас, жалобыотрицательное ранжирование 

После этого в ленте каждого пользователя, исходя из действий, которые они, вероятно, совершат с этим твитом, твиты подаются в порядке, который наиболее вероятно максимизирует удержание внимание подписчика.

Алгоритм вычисляет с какой вероятностью пользователь совершит действие и присваивает каждому действию вес:

Поставить лайк вашему твитуположительное ранжированиевес 0,5
Ретвитнуть ваш твитположительное ранжирование1
Перейти в ваш твит и оставить ответ/лайк или находиться там более 2 минутположительное ранжирование11
Посетить ваш профиль и поставить лайк/ответить на твитположительное ранжирование12
Ответить на ваш твитположительное ранжирование27
Ответить на ваш твит и вы взаимодействуете с этим ответомположительное ранжирование75
Запросить "показывать реже" для вашего твита/вас, заблокировать или скрыть васотрицательное ранжирование-74
Пожаловаться на ваш твитотрицательное ранжирование-369

Это означает, что:

Когда кто-то кликает на мой твит и находится там более двух минут, это имеет вес в 22 раза больше, чем если бы человек просто поставил лайк моему твиту.

Если люди переходят в мой профиль через мой твит и ставят лайк или отвечают на твит, это в 24 раза больше, чем просто лайк.

Когда отвечают на мой твит, это в 54 раза больше, чем лайк.

Если отвечают на мой твит, и я отвечаю на этот комментарий, это в 150 раз больше, чем лайк.

Однако, если кто-то жалуется на мой твит, это в 738 раз сильнее воздействует, что означает, что мне, по сути, "пришел конец".

алгоритм работы социальных сетей

Фильтрация и эвристика

После ранжирования твитов используются фильтры и эвристика для создания сбалансированной и разнообразной ленты:

Фильтрация видимости: из ленты убираются твиты от заблокированных или скрытых аккаунтов. Снижается видимость твитов, которые получили от вас негативную обратную связь.

Разнообразие авторов: алгоритм отслеживает количество показываемых твитов от одного и того же человека подряд.

Баланс контента: смешанный набор твитов от людей, на которых вы подписаны, и других пользователей.

Беседы: добавьте контекст к ответным твитам, связав их с исходным твитом.

Система также встраивает дополнительный контент, такой как реклама, рекомендации на подписку и подсказки для новых пользователей, создавая пользовательский опыт.

Ответы на популярные вопросы 

Изображения и видео

Добавление изображений и видео усиливает эффект в 2 раза.

Это означает, что если вы хотите, чтобы ваши твиты достигали более широкой аудитории, важно включать визуальный контент. Но не добавляйте просто любое изображение или видео, убедитесь, что оно высокого качества и соответствует тематике твита.

Имеет ли значение соотношение подписок к подписчикам?

🔺На охват вашего аккаунта отрицательно влияет, если количество пользователей, на которых вы подписаны, превышает 60% от количества ваших подписчиков.

Например, если у вас есть 1000 подписчиков и вы подписаны на 800 человек, попробуйте отписаться от 200 аккаунтов, чтобы улучшить свой охват.

Но, помните, что массовая отписка также может привести к тому, что ваш аккаунт будет скрыт, поэтому не отписывайтесь от всех сразу.

Имеет ли значение наличие Twitter Blue - синей галочки?

Да, Twitter Blue положительно влияет на ваши охваты. Плюс в этом статусе лучше ранжирование в ответах и поиске, скрывается половина рекламы в ленте, есть возможность публикации более длинные видео высокого качества (1080p), редактирование твитов, появляются папки для сохранения, а также предоставляется ранний доступ к новым функциям.

Как попасть на вкладку "Для вас"?

Увеличьте свои шансы попасть на вкладку "Для вас", учитывая следующие факторы:

  • Содержание твитов, что лучше лайкают и ретвитят
  • Напишите твиты, которые побуждают пользователей нажимать, отвечать и взаимодействовать с вашим контентом более 2 минут
  • Создайте привлекательный профиль, который заставляет людей кликать
  • Хорошая репутация аккаунта
  • Обратить внимание на соотношения подписчиков, верификации и того, были ли ранее блокировки

Итоговый балл по шкале от 0 до 100 - это балл "tweepcred", который представляет репутацию пользователя в Twitter. Этот балл используется для определения того, каким пользователям рекомендуется подписаться или какой контент должен быть выделен.

Ваше "влияние" в Twitter и, соответственно, вероятность просмотра ваших твитов в значительной степени определяются качеством пользователей, с которыми вы взаимодействуете.

Качество контента

В настоящее время, если ваш балл "tweepcred" меньше 65, максимальное количество твитов, которые будут учитываться алгоритмом ранжирования, ограничено 3.

Если ваш балл меньше 65, ваши треды не будут учитываться.

Однако, если ваш балл "tweepcred" больше 65, это ограничение снимается, что означает, что вы можете публиковать столько твитов, сколько хотите, и алгоритм учтет все из них.

Также важно, чтобы ваш контент не был отмечен как "низкого качества", чтобы ваш "tweepcred" был достаточно высоким для учета.

Взаимодействие с аккаунтами низкого качества

🔺Как оказалось, взаимодействие с аккаунтами низкого качества наказуемо.

Репутация аккаунта рассчитывается на основе соотношения подписчиков к подпискам, возраста аккаунта, использования устройства, если вы были ограничены или заблокированы, и если у вас есть верификация.

Если вы взаимодействуете с аккаунтами низкого качества с плохим соотношением подписчиков к подпискам и они отмечены как спам/NSFW/боты/токсичные, вам будет нанесено наказание.

Актуальность твитов со временем

Твиты имеют время жизни в 360 минут, это означает, что оценка актуальности твита уменьшается на 50% каждые 6 часов. Общая скорость снижения оценки актуальности старых твитов установлена на уровне 0,003.

Ссылки

🔺Ссылки приводят к отрицательному ранжированию. За внешние ссылки алгоритм может пометить вас как спам (если у вас низкая активность).

Исходящие ссылки на неинформационные или медийные сайты ухудшают ранжирование.

И публикация только URL-адресов или только изображений (без текста) также снижает ваш рейтинг

Отключения и отписки

Отключения, отписки (не так плохо, как остальное), блокировки, жалобы на спам, жалобы на злоупотребления приводят к отрицательному ранжированию.

Жалоба на твит снижает ранжирование в 700 раз.

Новые слова или неизвестный язык

Неизвестные языки получают низкое ранжирование.Выдуманные слова или орфографические ошибки получают 0,01, что является очень плохим.

Несколько хэштегов

Добавление большого количества хэштегов снижает ранг вашего поста.

Тип текста

🔺Оценка статического качества текста, вычисляется в файле TweetTextScorer.java в модуле Ingester. Она основывается на факторах, таких как оскорбительность, энтропия содержания, "шумность" текста, длина и читабельность - все это так же влияет на ваш охват и вовлеченность.

Часть 2: Что нужно сделать для максимизации охвата

Получите Twitter Blue

Если вы являетесь подписчиком Twitter Blue, то нравитесь алгоритму в 4 раза больше, если находитесь в одной сети с автором твита, и в 2 раза, если вы НЕ находитесь в одной сети. Здесь речь про кластеры о которых можно почитать ранее в этой статье.

Поддерживайте высокое соотношение подписчиков к подпискам

Этот метод снижает ранг страницы пользователей, у которых мало подписчиков, но много исходящих подписок. Он вычисляет коэффициент деления на основе соотношения подписок к подписчикам и уменьшает ранг страницы пользователя, разделив его на этот коэффициент.

Удерживайте свой "Tweepcred" выше 65

"Tweepcred" - это оценка, присваиваемая пользователям на основе количества и качества их взаимодействий с другими пользователями, возраста аккаунта, количества подписчиков и использования устройства, что определяет, должно ли быть выделено более 3 ваших твита (включая треды) или нет. Здоровое взаимодействие может помочь поддерживать его на высоком уровне, а жалобы на спам, блокировки и отключения могут сильно навредить. 

Специализируйтесь и станьте доверенным голосом в одной нише

Становитесь популярными в конкретном сообществе, взаимодействуя с известными аккаунтами в этой нише. По мере того, как все больше пользователей из этого сообщества повзаимодействуют с вашим контентом, он станет более связанным с этой нишей. Расфокус на нескольких темах, как мы видим, не поможет быстро набрать охваты.

Больше взаимодейсвия с твитами в первые 6 часов поле публикации

Твиты имеют полувремя жизни в 360 минут, поэтому оценка актуальности твита уменьшается на 50% каждые 6 часов. С течением времени старые твиты становятся менее актуальными (и показываются другим людям в меньшей степени). Взаимодействие и ответы на комментарии в этот период помогут повысить вовлеченность и охваты. 

Добавляйте изображения и видео

В текущей модели ранжирования (Earlybird) твиты с изображениями и видео нравятся алгоритму в 2 раза больше. Однако это старая модель, которую Twitter планирует полностью перестроить, поэтому в будущем могут произойти изменения. 

Избегайте блокировок и жалоб

Это плохо. Очень плохо. Такие вещи снижают ваш "балл репутации" в Twitter. Блокировки, отключения, жалобы на злоупотребления, жалобы на спам и отписки могут сильно негативно сказаться на вашем "балле tweepscore". 

Создайте причину для вовлечения пользователей

После ранжирования в топ-1500 твитов вероятность того, что ваш твит достигнет ленты кого-то, в значительной степени зависит от факторов, таких как время, проведенное на твите, посещение профиля и ответы. Контент, который побуждает пользователей к таким действиям, может значительно увеличить ваш охват.

Отвечайте на каждый ответ ваших подписчиков

Если лайк на ваш твит дает этому твиту 1 балл, то ваше взаимодействие с ответом на ваш твит дает вам 150 баллов. 

Не добавляйте ссылки, если вы не уверены, что они вызовут взаимодействие

Внешние ссылки могут ранжировать вас как спам, и публикация только URL-адресов может значительно снизить ваш ранг, если ваш твит не получает хороший отклик от читателей в первые несколько часов.

Резюмируем

Пишите грамотные публикации, реже добавляйте ссылки на сторонние ресуры, не злоупотребляйте хештегами, отпишитесь от аккаунтов, которые не читаете, особенно от аккаунтов с сомнительной репутацией, отмеченных как спам/NSFW/боты/токсичные.

Избегайте негативных и сверхнегативных факторов: неизвестный язык, новые выдуманные слова, грамматические ошибки, дезинформация, посты на темы из черного списка и т.д. и будет вам хорошее ранжирование от алгоритма Твиттера.

 

Первоисточник: https://tweethunter.io/blog/twitter-algorithm-full-analysis#part-2-what-you-should-do-to-maximize-reach

Вам также может понравиться: