面试岗位: 网络安全算法工程师(深圳)
一面:2022年6月27号
-
面试时间20分钟,1:55—2:15,严格20分钟
-
首先是自我介绍
-
然后问了个密数据项目
-
我只介绍了背景、motivation,简单的过程,简单的效果。
-
问题:
-
数据是怎么标注的?
-
训练时,按进程抓包
-
测试时,在网关抓包
-
隧道流量和非隧道流量是怎么识别的?
-
流量强特征
-
机器学习
-
然后让介绍逆向项目
-
问我,为什么项目经历是到去年5月份的?
-
答:主要在写论文、发论文。应该要回答期间跟了一些小项目
-
反问:网络安全算法工程师是做逆向等传统安全吗?
二面:7月1日
-
TPLINK约定是2点钟开始,但是在两点之前都没有发会议链接,后面在14:02分刷新签到页面后才出现链接。后面还调试了2分钟设备
-
首先来了一道智力题:
-
给定三个连续的大于6的整数,其中有两个是质数,证明第三个数被6整除。
-
答:首先三个连续的数字,必然有一个数是偶数,又因为有两个质数。所以只能是中间的那个数是偶数,两边是奇数。接下来只要证明这个偶数还能被3整除。我在这个地方卡了很久,后面在面试官提示下,被三整数的数的周期是3。任意三个连续的自然数,必然有一个数是能被三整除的。那么这三个数,中间那个数可以同时被2和3整数,自然就能被6整除。
-
为什么连续三个整数必有一个数被三整数?
-
假设这三个整数是x-1,x,x+1,假设x-1 % 3=r1;那么x%3=r1+1, x+1%3=r1+2。其中余数只能是0,1,2。这三个余数都不相等,那么只能三个余数分配这三个余数,必然有一个余数为0的。
-
然后就是问项目经历
-
介绍了密流数据的项目介绍背景、模型、动机、效果(这次讲还算满意)
-
问:加密网络流量识别的技术有哪些?
-
答:(我觉得这部分答的不好,主要是分类没有分好,得看看权威数据是怎么分的)
-
基于握手明文,例如sni,ip,证书;
-
基于包长序列特征:
-
统计特征
-
深度学习端到端学习得到的特征
-
基于网络行为特点的:例如扫描之类的
-
有看到都是加密流量识别的,有没有DPI的相关经验。
-
答:有,那个特征自动挖掘项目。
-
简单介绍一下特征自动挖掘项目
-
介绍了华为的项目
-
问:随机森林是怎么优化的?
-
输入特征的优化
-
使用Treelite优化将训练好的随机森林模型转换为c代码
-
免除无关库的加载
-
int的优化
-
内存使用:5GB,速度2.4万条/秒
-
问:用的啥cpu测试的?
三面:7月8日
-
TPLINK 三面原本是7月7日上午的,因为昨天上午有事,需要带儿子去防疫站打疫苗,所以申请换到了今天。
-
三面持续了30分钟,似乎是个主管面,因为主管没有问具体的技术,主要是更高层次的方向类问题。
-
首先问题凌睿工作室的项目负责人的经历。
-
凌睿工作室是干啥的
-
有技术的爱好的同学,组织起来一起接项目外包,一起参加竞赛
-
任职期间做了啥
-
1. 对于老师接的外包项目,找到满足相应技术特长的同学参加项目
-
2. 对于自找的一些外包项目,主要是学长学姐推荐介绍的项目
-
3. 全国信息安全大赛、大学生创新创业大赛组织比赛
-
有参加过工作室的外包项目吗?
-
任职期间:作为项目经理跟了四川省人民医院图书馆的web主页建设项目
-
非任职期间:验证码项目等
-
如何保证项目质量:
-
1. 对于有明确指标的,可以很好的控制
-
2. 对于应用类项目,主要是老师去接项目,在一些关键的节点(开始、中期、结题)会参与项目控制,然后需要定期向老师汇报进度。
-
(答的不好,应该看看如何做项目质量控制)
-
项目计划:设置好关键时间节点,在相应的时间节点完成相应目标;周期性同步进度;对于不能完成的任务,撰写好难度说明书,为啥难、难点在哪。
-
业务质量:
-
有相应的功能、技术指标,完成;
-
自测测试
-
用户预使用测试
-
代码质量:代码版本控制,git。
-
介绍如何采集流量?就是流量信息挖掘平台项目介绍
-
怎么自动化采集的,有那些技术点?
-
自动化采集:框架===》发送控制命令===》模板
-
按进程抓包:windows 是通过WFP实现的, Linux是通过iptables实现的,IOS是通过周期采样lsof命令结果实现的。
-
这些技术难度似乎没有很高,怎么看待这种项目
-
首先是有一定的技术难度的,比如window WFP驱动的编写,这是第一次写驱动,有一定的难度。
-
其实,这个项目是基础性的项目,对后续的机器学习模型训练很重要,可以节省很多的人力物力。
-
有什么生活爱好?
-
读研以来,哪些方面相比本科有了增长。
-
反问环节(网络突然变差了,下次面试得用5G热点)
-
加密网络流量技术能用在贵公司的什么场景?(我觉得问的不好,因为网络的原因,表达观点的不好)
-
主管主要是从高层次说,这只是一个技术手段,可以不限制。
-
(此时我应该附和的,大方向是使用机器学习手段解决网络安全问题,加密网络流量分类也只是一个案例分析的)
座谈会:7月13日
SSP Offer: 7月14日下午,级别是+9.
#TPLINK提前批#