Точность и отзывчивость при поиске информации

Опубликовано: 23 Июля, 2021

Информационные системы можно измерить двумя метриками: точностью и отзывчивостью. Когда пользователь решает искать информацию по теме, всю базу данных и получаемые результаты можно разделить на 4 категории:

  1. Соответствующий и полученный
  2. Актуально и не получено
  3. Несоответствие и получено
  4. Нерелевантно и не получено

Релевантные элементы - это те документы, которые помогают пользователю ответить на его вопрос. Нерелевантные элементы - это элементы, которые не предоставляют действительно полезной информации. Для каждого элемента есть две возможности: он может быть получен или не получен по запросу пользователя. Точность определяется как отношение количества релевантных и извлеченных документов (количества извлеченных элементов, которые действительно полезны для пользователя и соответствуют его поисковой потребности) к общему количеству извлеченных документов по запросу.

Отзыв определяется как отношение количества извлеченных и релевантных документов (количество извлеченных элементов, которые имеют отношение к пользователю и соответствуют его потребностям) к количеству возможных релевантных документов (количество соответствующих документов в базе данных). аспект накладных расходов на поиск информации для пользователя, связанного с конкретным поиском. Если точность поиска составляет 85 процентов, тогда 15 (100-85) процентов усилий пользователя составляют накладные расходы на просмотр нерелевантных элементов.

Напоминание измеряет, в какой степени система, обрабатывающая конкретный запрос, способна извлекать релевантные элементы, в которых заинтересован пользователь. Отзыв - очень полезная концепция, но из-за знаменателя не рассчитывается в операционных системах. Если системе известен полный набор релевантных элементов в базе данных, отзыв можно сделать вычисляемым.