Что такое H-Index?
Что такое H-индекс? «H» обозначает индекс Хирша, как он был предложен Дж. Э. Хиршем в 2005 году. Х-индекс определяется как показатель уровня автора, который пытается измерить как продуктивность, так и влияние цитируемости публикации ученого или ученого. .
Следует учитывать два параметра:
- Количество - Количество работ
- Качество - количество цитирований
По сути, индекс Хирша - это наибольшее число, при котором несколько публикаций имеют, по крайней мере, одинаковое количество цитирований. Как полезный указатель для характеристики научной работы исследователя.
Расчет H-индекса -
Например, предположим, что исследователь опубликовал всего 10 статей.
Исследовательская работа | Кол-во цитат |
1 | 50 |
2 | 40 |
3 | 33 |
4 | 23 |
5 | 12 |
6 | 11 |
7 | 8 |
8 | 5 |
9 | 1 |
10 | 0 |
H-index is always <= total numbers of papers published
Для удобства расположим количество цитирований в порядке убывания.
H-index не может быть 10, потому что должно быть не менее 10 научных работ, которые имеют 10 или более 10 цитирований. Сходным образом,
H-index не может быть 9,
H-index не может быть 8,
Индекс Хирша равен 7, так как 7 научных работ имеют 7 или более 7 цитирований.
Пример :
Ввод: Цитаты = [7, 6, 5, 4, 3] Выход: 4 Пояснение: Всего 5 статей. Поскольку у исследователя есть 4 статьи с минимум 4 цитированием в каждой. а в оставшейся одной статье меньше 4 цитирований. Итак, индекс Хирша равен 4.
Approach for finding the H – index :
- Sort the citation array in ascending order or descending order.
- Iterate from the lowest paper to the highest paper.
- The remaining papers (result) is the count of papers that satisfy the condition for H-index.
# calculating H-Index def H_index(citations): # sorting in ascending order citations.sort() # iterating over the list for i, cited in enumerate (citations): # finding current result result = len (citations) - i # if result is less than or equal # to cited then return result if result < = cited: return result return 0 # creating the citations citation = [ 50 , 40 , 33 , 23 , 12 , 11 , 8 , 5 , 1 , 0 ] # calling the function print (H_index(citation)) |
Выход
7
Сложность времени: O (nlogn + n)
Космическая сложность: O (1)
Ограничения H - Index:
- Различные области исследователей могут иметь разное поведение цитирования.
- Мы не можем сравнивать двух исследователей, имеющих разные области и огромный разрыв в исследовательском опыте. Опытный исследователь будет иметь более высокий индекс Хирша по сравнению с менее опытным исследователем.
- Значение H-индекса зависит от используемой базы данных и может отличаться для разных платформ.
Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.
Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.