Что такое H-Index?
Что такое H-индекс? «H» обозначает индекс Хирша, как он был предложен Дж. Э. Хиршем в 2005 году. Х-индекс определяется как показатель уровня автора, который пытается измерить как продуктивность, так и влияние цитируемости публикации ученого или ученого. .
Следует учитывать два параметра:
- Количество - Количество работ
- Качество - количество цитирований
По сути, индекс Хирша - это наибольшее число, при котором несколько публикаций имеют, по крайней мере, одинаковое количество цитирований. Как полезный указатель для характеристики научной работы исследователя.
Расчет H-индекса -
Например, предположим, что исследователь опубликовал всего 10 статей.
| Исследовательская работа | Кол-во цитат |
| 1 | 50 |
| 2 | 40 |
| 3 | 33 |
| 4 | 23 |
| 5 | 12 |
| 6 | 11 |
| 7 | 8 |
| 8 | 5 |
| 9 | 1 |
| 10 | 0 |
H-index is always <= total numbers of papers published
Для удобства расположим количество цитирований в порядке убывания.
H-index не может быть 10, потому что должно быть не менее 10 научных работ, которые имеют 10 или более 10 цитирований. Сходным образом,
H-index не может быть 9,
H-index не может быть 8,
Индекс Хирша равен 7, так как 7 научных работ имеют 7 или более 7 цитирований.
Пример :
Ввод: Цитаты = [7, 6, 5, 4, 3]
Выход: 4
Пояснение: Всего 5 статей.
Поскольку у исследователя есть 4 статьи с минимум 4 цитированием в каждой.
а в оставшейся одной статье меньше 4 цитирований.
Итак, индекс Хирша равен 4.
Approach for finding the H – index :
- Sort the citation array in ascending order or descending order.
- Iterate from the lowest paper to the highest paper.
- The remaining papers (result) is the count of papers that satisfy the condition for H-index.
# calculating H-Indexdef H_index(citations): # sorting in ascending order citations.sort() # iterating over the list for i, cited in enumerate(citations): # finding current result result = len(citations) - i # if result is less than or equal # to cited then return result if result <= cited: return result return 0 # creating the citationscitation = [50, 40, 33, 23, 12, 11, 8, 5, 1, 0] # calling the functionprint(H_index(citation)) |
Выход
7
Сложность времени: O (nlogn + n)
Космическая сложность: O (1)
Ограничения H - Index:
- Различные области исследователей могут иметь разное поведение цитирования.
- Мы не можем сравнивать двух исследователей, имеющих разные области и огромный разрыв в исследовательском опыте. Опытный исследователь будет иметь более высокий индекс Хирша по сравнению с менее опытным исследователем.
- Значение H-индекса зависит от используемой базы данных и может отличаться для разных платформ.
Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.
Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.