一、实习 & 项目
Q:KM算法中的权重?动态变化?
A:str / 接驾时长
Q:自注意力机制?
二、概率题
Q:30次都不点击的概率是0.936,问10次中至少点击一次的概率?
A:1-(1-0.936)^(1/3)
三、算法题
不含重复字符的最小子串长度
def test(s):
lest = 0
window = set()
res = 0
for right, c in enumerate(s):
if c in window:
while s[left] != c:
window.remove(s[left])
left += 1
else:
window.add(c)
res = max(res, right - left + 1)
return res
一、问项目:实习相关 约40min
Q:如何评估仿真系统的准确性?
A:校准
二、深度相关问题
Q:平台补贴场景(是否购买二分类),多个特征,如何限制能够使补贴金额这一维特征增加而使点击购买的概率输出增加?
A:多模型特征concat / 正则化限制 / 深浅层模型
Q:模型初始化方法?怎么做的?
A:随机初始化 / ImageNet等预训练参数
Q:batch normalization?背后的原理?
A:对单个神经元 / Z-score标准化 / 与LN的区别
三、算法题
搜索旋转排序数组
def search(list, target):
left, right = 0, len(list)-1
while left <= right:
middle = (left + right) // 2
x = list[middle]
if x == target:
return middle
if x >= list[left]:
if x > target and target >= list[left]:
right = middle -1
else:
left = middle + 1
else:
if x < target and target < list[right]:
left = middle + 1
else:
right = middle - 1
return -1 #