上来先自我介绍然后让自己挑一个项目介绍。后续面试官问了很多问题 1 特征工程如何做 2 特征筛选都有哪些介绍一下 3 随机森林原理 4 支持向量机介绍一下 5 深度学习框架会哪些介绍一下 6 transformer介绍 7 attention机制都有哪些介绍一下 8 lstm原理以及相比于rnn的优势 9 时间序列预测都有哪些方法 10 介绍一下arima算法 11 数据库都会哪些 12 深度学习
1.自我介绍 2.数据采集相关,怎么把kafka中的数据采集到mysql中? 忘了 3.hive,两张表的重复数据,怎么去重? 回答distinct,group by ,开窗取第一条, 开窗函数是哪个? 没回答上来 4.udf函数写过吗,flink消费kafka中的数据写过代码吗,需要看代码? 5.使用java干过那些代码? 面试时长:10分钟,面试效果,差 不足:对于简历上的内容,回答支支吾吾,
1. 你觉得数据分析师应该具有哪些能力? * 首先是硬实力,SQL、Excel、PPT等分析数据和展示数据的工具需要会 * 其次是软实力,当我们通过数据分析获得到洞见后,需要向别人展示,说服别人接受我们的建议 2. 你过去使用过哪些图表来直观的表达你的观点?聊聊你在案例大赛的经历就可以。 * 使用频次最高的是柱状图和折线图,可以表现事物随时间的波动趋势 * 其次是散点图,可以用两个维度给事物排名
自我介绍环节 一般在2-3分钟左右,建议一定要提前写好,并且熟读,面试时才能说得流畅,有逻辑。 HR面环节 1.为什么选择我们公司? 2.你觉得你沟通能力怎么样,举个例子呢? 3.学习成绩,这个是一定会问到的。 4.职业发展规划 5.问你如何克服困难,你印象最深的一件事是什么?等等 专业面环节 专业问题针对性就比较强,比如合成和分析岗位,会对实验操作技能有一定的要求。但如果你所做课题面试岗
本文向大家介绍PHP的serialize序列化数据以及JSON格式化数据分析,包括了PHP的serialize序列化数据以及JSON格式化数据分析的使用技巧和注意事项,需要的朋友参考一下 PHP的serialize是将变量序列化,返回一个具有变量类型和结构的字符串表达式,而JSON则是一种更轻、更友好的用于接口(AJAX、REST等)数据交换的格式。 其实两者都是以一种字符串的方式来体现一种数据结
面试高频题1: 题目:介绍一下k-means,你的数据如何处理,模型的输出是什么? 答案解析: 介绍kmeans: 第一步:数据归一化、离群点处理后,随机选择k个聚类质心 第二步:所有数据点关联划分到离自己最近的质心,形成k个簇; 第三步:重新计算每个簇的质心; 重复第二步、第三步,直到簇不发生变化或达到最大迭代次数; 数据如何处理: 为了防止均值和方差大的维度将对数据的聚类产生决定性影响,所以在
面试高频题1: 题目:处理噪声数据方法 答案解析: 1、分箱 分箱方法是一种简单常用的预处理方法,通过考察相邻数据来确定最终值。所谓“分箱”,实际上就是按照属性值划分的子区间,如果一个属性值处于某个子区间范围内,就称把该属性值放进这个子区间所代表的“箱子”内。把待处理的数据(某列属性值)按照一定的规则放进一些箱子中,考察每一个箱子中的数据,采用某种方法分别对各个箱子中的数据进行处理。在采用分箱技术
我是大数据欧老师,曾在互联网某大厂任大数据负责人,从业大数据领域近 10 年,全网粉丝 5000+,从很多候选人的面试和咨询中复盘了大数据工程师的面试全流程,如果你有求职大数据工程师的计划,欢迎找我聊一聊! 直接拿走去复习!!! Hive 知识点(上)- HSQL 语法 什么是窗口函数? ROW_NUMBER() / RANK() / LAG() / LEAD() 的含义? RANK() 和 DE
我是大数据欧老师,曾在互联网某大厂任大数据负责人,从业大数据领域近 10 年,全网粉丝 5000+,从很多候选人的面试和咨询中复盘了大数据工程师的面试全流程,如果你有求职大数据工程师的计划,欢迎找我聊一聊! 直接拿走去复习!!! Spark 知识点(上)- 原理题 RDD 的概念?RDD 的常见算子? Spark 和其他框架的比较?和 Hadoop 的比较?Spark Streaming 和 Fl
本文向大家介绍Python根据成绩分析系统浅析,包括了Python根据成绩分析系统浅析的使用技巧和注意事项,需要的朋友参考一下 案例:该数据集的是一个关于每个学生成绩的数据集,接下来我们对该数据集进行分析,判断学生是否适合继续深造 数据集特征展示 1.导入包 2.导入并查看数据集 3.查看每个特征的相关性 结论:1.最有可能影响是否读硕士的特征是GRE,CGPA,TOEFL成绩 2.影响相对较小的
本文向大家介绍Python实现的北京积分落户数据分析示例,包括了Python实现的北京积分落户数据分析示例的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了Python实现的北京积分落户数据分析。分享给大家供大家参考,具体如下: 北京积分落户状况 获取数据(爬虫/文件下载)—> 分析 (维度—指标) 从公司维度分析不同公司对落户人数指标的影响 , 即什么公司落户人数最多也更容易落户 从年龄维
paginate 分页 laravel 的分页用起来非常简单,只需要对 query 调用 paginate 函数,把返回的对象扔给前端 blade 文件,在 blade 文件调用函数 render 函数或者 link 函数,就可以得到 上一页、下一页 等等分页特效。 实际上,我们可以简单地把分页服务看作一个前端资源,render 函数或者 link 函数的结果就是分页前端代码。 如果你还对 lar
今年参与了美团商分&运营,字节运营&数分的笔面试,准备期间发现牛客时间都比较早,参考有限,于是!新鲜出炉的经验贴来啦!!有需要的uu自行收藏哦! 面经系列更新完毕后可能会写一些总结,有相关需求和问题的uu可以评论告诉我,力所能及的分享一些经验,下面就是干货了: 笔试:基础行测,找规律,文字理解等等,无编程题 🌈一面 🍀时间:35分钟 1、为什么转专业?(本科工科、研究生商科) 2、从两段实习经
面试内容: 1,自我介绍。 2,研究生的方向和毕设题目。 3,主要的技术栈(会使用哪些编程工具,数据库),回答了只会Python+一丁点Java,后面就专注问Python内容了。 4, 实习的工作内容。 5,看CV中有机器学习的项目,讲讲逻辑回归,属于判别式or生成式?决策树中的减支。 看CV中有数据清洗的项目,讲讲数据清洗,缺失值处理的内容。 6,学过计算机的哪些基础课程? 7,Python中的
笔试:笔试题目是上个星期六发邮件过来的 没有监控 主要是统计学都一些模型 没学过额 什么AB模型 然后就是一些信用卡的一些关联了不知道是金融还是啥的知识 有很多种题型 选择题 填空题 解答题等等 最后面是sql语句两道题 主要是没监控所以用了人工智能去写 几乎是满分吧 但是明天面试就有点慌 因为我不是很懂这个相关知识 如果只考数据分析就好了吧 希望好运 ………………………… 面试: 今天一面