Что такое H-Index?

Опубликовано: 31 Марта, 2022

Что такое H-индекс? «H» обозначает индекс Хирша, как он был предложен Дж. Э. Хиршем в 2005 году. Х-индекс определяется как показатель уровня автора, который пытается измерить как продуктивность, так и влияние цитируемости публикации ученого или ученого. .

Следует учитывать два параметра:

  1. Количество - Количество работ
  2. Качество - количество цитирований

По сути, индекс Хирша - это наибольшее число, при котором несколько публикаций имеют, по крайней мере, одинаковое количество цитирований. Как полезный указатель для характеристики научной работы исследователя.

Расчет H-индекса -

Например, предположим, что исследователь опубликовал всего 10 статей.

Исследовательская работа Кол-во цитат
1 50
2 40
3 33
4 23
5 12
6 11
7 8
8 5
9 1
10 0

H-index is always <= total numbers of papers published

Для удобства расположим количество цитирований в порядке убывания.

H-index не может быть 10, потому что должно быть не менее 10 научных работ, которые имеют 10 или более 10 цитирований. Сходным образом,

H-index не может быть 9,
H-index не может быть 8,
Индекс Хирша равен 7, так как 7 научных работ имеют 7 или более 7 цитирований.

Пример :

Ввод: Цитаты = [7, 6, 5, 4, 3]
Выход: 4
Пояснение: Всего 5 статей. 
              Поскольку у исследователя есть 4 статьи с минимум 4 цитированием в каждой. 
              а в оставшейся одной статье меньше 4 цитирований. 
              Итак, индекс Хирша равен 4.

Approach for finding the H – index :

  1. Sort the citation array in ascending order or descending order.
  2. Iterate from the lowest paper to the highest paper.
  3. The remaining papers (result) is the count of papers that satisfy the condition for H-index.
# calculating H-Index
def H_index(citations):
      
    # sorting in ascending order
    citations.sort()
      
    # iterating over the list
    for i, cited in enumerate(citations):
          
        # finding current result
        result = len(citations) - i
          
        # if result is less than or equal
        # to cited then return result
        if result <= cited:
            return result
           
    return 0
  
# creating the citations
citation = [50, 40, 33, 23, 12, 11, 8, 5, 1, 0]
  
# calling the function
print(H_index(citation))

Выход

 7

Сложность времени: O (nlogn + n)
Космическая сложность: O (1)

Ограничения H - Index:

  1. Различные области исследователей могут иметь разное поведение цитирования.
  2. Мы не можем сравнивать двух исследователей, имеющих разные области и огромный разрыв в исследовательском опыте. Опытный исследователь будет иметь более высокий индекс Хирша по сравнению с менее опытным исследователем.
  3. Значение H-индекса зависит от используемой базы данных и может отличаться для разных платформ.

Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.

Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.