Обнаружение основных узлов в социальной сети - алгоритм VoteRank

Опубликовано: 1 Декабря, 2021

Обнаружение важных узлов в социальной сети - интересная проблема. Его можно использовать для поиска наиболее влиятельных узлов в сети y с использованием различных показателей, таких как их расположение в сети, их топологические характеристики, такие как степень и веса ребер. Один из самых известных алгоритмов для этого - рейтинг страницы Google.

Этот алгоритм характеризует страницы как узлы, подсчитывая количество и качество ссылок на страницу, чтобы определить приблизительную оценку важности веб-сайта. Основное предположение состоит в том, что более важные веб-сайты, вероятно, будут получать больше ссылок с других веб-сайтов. Это один из самых популярных алгоритмов поиска влиятельных / популярных страниц / изображений / узлов и всего, что индексирует Google. Таким образом, сортировка и ее приложения являются преобладающими, и основная работа в этой области основана на ключе, используемом для сортировки. В онлайн-мире мы не определили ни одной уникальной серебряной стрелки в качестве ключа для этой цели. Причина в том, что не все ситуации одинаковы, и не все показатели можно безопасно определить без ущерба для конфиденциальности людей.

Предложение Zhang et al (2016) заключалось в создании алгоритма, основанного на мнении соседей, с использованием системы голосования. Традиционные алгоритмы, такие как K-shells и Degree Centrality, и другие эвристические методы, такие как Hill Climbing, страдают от возможности того, что некоторые распространители расположены настолько близко друг к другу, что они перекрывают сферу влияния. Он основан на том факте, что все узлы голосуют в распределителе на каждом ходу, и право голоса соседей выбранного распределителя будет уменьшаться в последующем ходу. Также избиратели, проголосовавшие за действующего лидера, имеют пониженную избирательную способность.

Чтобы понять, что происходит, давайте рассмотрим основные концепции.

Социальная сеть как график

Очевидно, что социальную сеть можно изобразить в виде графа. Люди могут действовать как узлы, а их соединения - как ребра. Эти ребра могут быть взвешенными или невзвешенными, где вес может представлять силу соединения и может быть направленным или ненаправленным в зависимости от того, является ли соединение односторонним или двухсторонним.

Как мы можем оценить рейтинг?

Это действительно отличный вопрос! Поскольку мы не можем поместить алгоритм прямо на платформу и протестировать, давайте воспользуемся физическим моделированием. Теперь, благодаря обширным исследованиям в этой области, исследователи заявили, что это действительно возможно смоделировать. Нам нужно позаимствовать некоторые идеи из биологии! Susceptible Infected and Recovered (SIR) - это модель распространения эпидемии, и авторы использовали ее в качестве основы для моделирования в различных сетях реального мира.

Звучит хорошо, с чего начать?

Вам нужно узнать о графах, поиске графов, представлении, кратчайших путях и иметь интерес к решению математических дифференциальных уравнений. Чтобы подробно изучить концепции Graphs, мы рекомендуем пройти через GeeksForGeeks Graphs, а для части кода вы можете обратиться к Networkx в Python3.

Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.

Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.