现在有这样一个问题, 求解 h-index. h-index 是一种衡量一个人论文水平的参数, 其定义为 h篇文章引用超过h. 该参数越大表明一个人的学术水平越高, 但不同行业差别巨大. 一般看来生物领域偏高。
下面考虑下面一个算法问题, 已知一个列表 citel, 记录着每篇论文的引用数, 无先后顺序. 例如 [3, 10, 5, 1, 7]. 输出为该列表的h-index : 3 (最大3篇超过引用3)
函数原型如下
int hindex(const vector<int> citel);
难度在于时间复杂度最低为多少, 如何优化该算法. 下面给出一个O(n log(n))的方法抛砖引玉
def hindex(citel):
citel.sort()#排序算法 最耗时的部分
h=1 if citel[-1]>0 else 0
small=citel[-1]
for i in citel[-2::-1]:
if i==small and i >h:
h+=1
elif i>h:
h+=1
small=i
else:
break
return h