9月8号一面的,当时觉得表现的还行也挂了哈哈,有点失去斗志了,还是去提升提升自己多准备点赛道了~ 面了50多分钟,一位面试官,自动驾驶部分的 问题一:介绍一下研究生的一些专业课 问题二:针对一段实习的提问,详细介绍了做的东西之后,相关衍生了两三个小问题,我的实习是做的销量预测,面试官比较关注特征挖掘那部分,比如换成其他产品的销量预测怎么再去挖掘特征 问题三:针对另一段实习的提问,问了看板搭建那部分
时间:2022年7月1日 面试职位:大数据开发工程师(留用实习生) 如题,留用实习生也就是平时说的暑期实习生,有转正机会的实习生 面试流程,自我介绍,什么时候能入职,学校的事情都已经忙完了吗, 我简单的说了一下情况然后第一问题: ①怎么平衡学校的课程,论文的研究工作,和找工作的时间安排 ②说一说自己的实习经历 ③看到我写电商数仓的项目,介绍一下电商数仓的项目。 前面的问题都回答的还好,但是这
TimeLine:一面20221115(已挂) BG:北邮本硕,管理类专业,两段实习经历:字节数据分析师、美团商业分析师 写在前面的话:北京移动的面试环节紧凑,面试时间5-6分钟,问的问题都比较常规 一面 1. 毕业时间在什么时候? 2. 在北京移动公司是否有直系亲属? 3. 对于北京户口是否有刚需? 4. 你的年薪预期是多少? 5. 有没有投北京移动的其他岗位? 6. 是否愿意接受调剂到市场/综
开局自我介绍,然后她也介绍了一下部门工作;问了一下数据库和数据仓库的区别,我说是回答八股文还是回答自己的经历;然后她让我结合自己的经历说了一下;接着问我对数仓分层了解的多少,对维度建模了解多少,对数仓的模型(星形,雪花,星座)之类的了解的多吗?之后问我对数仓的每个方向的具体分层有什么认识吗?我都没听明白这个问题,只好老老实实回答了一句这些东西并不是我负责的,接着她说结合我自己的理解谈一谈.....
1) 我使用以下命令设置一个专用以太坊网络 2) 创建了一个帐户 3)然后,使用miner.start()命令启动矿工。 过了一段时间,以太被自动添加到我的帐户中,但我的私人网络中没有任何挂起的事务。那么我的矿工们从哪里得到乙醚呢? 尽管我没有在我的网络中实例化任何事务,但一旦启动miner,我就可以看到日志中记录了一些事务。 日志如下: 我的创世区块代码如下: 由于我的网络是隔离的,并且只有一个
1. 英文文本挖掘预处理特点 英文文本的预处理方法和中文的有部分区别。首先,英文文本挖掘预处理一般可以不做分词(特殊需求除外),而中文预处理分词是必不可少的一步。第二点,大部分英文文本都是uft-8的编码,这样在大多数时候处理的时候不用考虑编码转换的问题,而中文文本处理必须要处理unicode的编码问题。这两部分我们在中文文本挖掘预处理里已经讲了。 而英文文本的预处理也有自己特殊的地方,第三点就是
1. 中文文本挖掘预处理特点 首先我们看看中文文本挖掘预处理和英文文本挖掘预处理相比的一些特殊点。 首先,中文文本是没有像英文的单词空格那样隔开的,因此不能直接像英文一样可以直接用最简单的空格和标点符号完成分词。所以一般我们需要用分词算法来完成分词,在文本挖掘的分词原理中,我们已经讲到了中文的分词原理,这里就不多说。 第二,中文的编码不是utf8,而是unicode。这样会导致在分词的时候,和英文
现代分词都是基于统计的分词,而统计的样本内容来自于一些标准的语料库。假如有一个句子:“小明来到荔湾区”,我们期望语料库统计后分词的结果是:"小明/来到/荔湾/区",而不是“小明/来到/荔/湾区”。那么如何做到这一点呢? 从统计的角度,我们期望"小明/来到/荔湾/区"这个分词后句子出现的概率要比“小明/来到/荔/湾区”大。如果用数学的语言来说说,如果有一个句子S,它有m种分词选项如下:$$A_{11
参考资料:http://www.cs.ucsb.edu/~xyan/papers/gSpan.pdf http://www.cs.ucsb.edu/~xyan/papers/gSpan-short.pdf http://www.jos.org.cn/1000-9825/18/2469.pdf http://blog.csdn.net/coolypf/article/details/8263176更
介绍 与GSP一样,PrefixSpan算法也是序列模式分析算法的一种,不过与前者不同的是PrefixSpan算法不产生任何的侯选集,在这点上可以说已经比GSP好很多了。PrefixSpan算法可以挖掘出满足阈值的所有序列模式,可以说是非常经典的算法。序列的格式就是上文中提到过的类似于<a, b, (de)>这种的。 算法原理 PrefixSpan算法的原理是采用后缀序列转前缀序列的方式来构造频繁
我的数据挖掘算法代码:https://github.com/linyiqun/DataMiningAlgorithm 介绍 Apriori算法是一个经典的数据挖掘算法,Apriori的单词的意思是"先验的",说明这个算法是具有先验性质的,就是说要通过上一次的结果推导出下一次的结果,这个如何体现将会在下面的分析中会慢慢的体现出来。Apriori算法的用处是挖掘频繁项集的,频繁项集粗俗的理解就是找出经
#### 程序题: 一百个任务需要被10个人(A,B,C,D,F…J) 执行 1. 不考虑人在线的情况,sout语句表示任务被执行”1任务被A执行“,来执行一百个任务 难点:任务分配的随机化,以及数字转字符的操作。 2. 每个人都有在线和非在线的状态,每个任务都只能被在线的员工所执行。 给定员工boolean的初始状态,然后任务如果被非在线的员工分配,则顺序给下一个员工。 后知后觉:应该把所有在线
10/9更新:竟然没挂,约面了 ------------------------------------------------------------------------------- 更新:官网上显示专业面已完成,不知道挂没挂 ------------------------------------------------------------------------------- 如题
记录一下面试遇到的一些题目,有的我自己写了答案,有的没写,这只是目前我能想起来的所有问题,希望可以给大家一点参考,如果我写的答案有不对的也请大家指教! 1.BN和LN的区别 2.什么情况下会发生梯度爆炸,如何解决(我们初始化的w是很大的数,w大到乘以激活函数的导数都大于1,那么连乘后,可能会导致求导的结果很大,形成梯度爆炸。 梯度截断:首先设置梯度阈值:clip_gradient,在后向传播中求出
1.自我介绍 2.讲一下对SRE的理解和认识(问了偏向日常故障排查还是代码集成提高生产效率) 3.ARP协议详细说说,它广播的范围是多大 4.tcp/udp讲讲,如果tcp通过80端口发送的包没有收到该怎么办 5.DNS协议讲讲,如果本地找不到的话会怎么去找 6.openvswitch在哪里用,怎么用 7.lvs负载均衡工作模式,其中DR怎么工作,通过负载均衡器源ip,目的ip,源mac,目的ma