275. H 指数 II Medium
给你一个整数数组 citations
,其中 citations[i]
表示研究者的第 i 篇论文被引用的次数,citations
已经按照 非降序排列 。计算并返回该研究者的 h
指数。
h 指数的定义:h 代表“高引用次数”(high citations),一名科研人员的 h 指数是指他(她)的 (n 篇论文中)至少 有 h 篇论文分别被引用了至少 h 次。
请你设计并实现对数时间复杂度的算法解决此问题。
示例 1:
输入:citations = [0,1,3,5,6]
输出:3
解释:给定数组表示研究者总共有 5 篇论文,每篇论文相应的被引用了 0, 1, 3, 5, 6 次。
由于研究者有3篇论文每篇 至少 被引用了 3 次,其余两篇论文每篇被引用 不多于 3 次,所以她的 h 指数是 3 。
示例 2:
输入:citations = [1,2,100]
输出:2
解题思路
输入: 一个数组 citations
代表研究者的每篇论文被引用的次数
输出: 返回高引用次数 h
本题属于二分边界查找问题。
我们需要找到一个最大的数 h, 代表这个研究员至少有 h 篇论文至少被引用了 h 次
我们可以用二分查找来缩小范围, 我们假设 h = len(citations) - mid
假如
citations[mid] >= len(citations) - mid
,说明从mid
开始之后的所有论文引用数量都是大于len(citations) - mid
,那么最大的 h 可能在 mid 左侧,继续向左寻找答案right = mid - 1
反之,说明
mid
这个位置的论文引用数比剩余论文数量还要少,不满足h
的定义,h
肯定在mid
右侧,继续向右找答案left = mid + 1
最后我们可以确定
left
所在的位置就是最大的那个h
所在的索引,我们通过len(citations) - left
可以得到最大的h
也就是总共有多少论文是大于等于h
假设只有一个论文,那么
left == right == mid == 0
,我们还是要判断下citations[mid] >= len(citations) - mid
,所以我们可以得出终止条件是left > right
代码实现
class Solution:
def hIndex(self, citations: List[int]) -> int:
n = len(citations) # 获取论文引用数组的长度
left, right = 0, n - 1 # 初始化二分查找的左右指针
while left <= right: # 当左指针小于等于右指针时继续循环
mid = (left + right) // 2 # 计算中间位置
# 如果中间位置的引用次数 >= 剩余论文数量(n - mid)
# 说明h指数可能在左侧(包括mid),右指针左移
if citations[mid] >= n - mid:
right = mid - 1
# 否则,h指数在右侧,左指针右移
else:
left = mid + 1
# 最终left会停在满足条件的边界,n - left就是h指数
# 因为n - left表示至少有n - left篇论文的引用次数≥n - left
return n - left
/**
* @param {number[]} citations
* @return {number}
*/
var hIndex = function(citations) {
let left = 0;
let right = citations.length - 1;
while (left <= right) {
const mid = Math.floor((left + right) / 2);
if (citations[mid] >= citations.length - mid) {
right = mid - 1;
} else {
left = mid + 1
}
}
return citations.length - left;
};
复杂度分析
时间复杂度:O(log n)
空间复杂度:O(1)