一面45min 实习数据开发 但是研究数据挖掘 有什么区别联系 实习技术栈中哪个比较熟 spark和mapreduce区别 flink和spark区别 flink窗口、状态 统计一个小时内用户点击量 端到端exactly once 水位线 savepoint checkpoint 数据量很大 只给一台机器怎么处理 热点数据怎么存 怎么判断热点数据 Java 堆内存说一下 两个线程对一个变量进行++
做个记录 基本上问项目,根据简历项目和实习的技术点衍生去问的 写面经攒人品~ 1.自我介绍 2.数据仓库的分层,以及为什么要做数据仓库 3.数据仓库的血缘关系 4.拉链表的实现 5.hive的压缩格式和存储格式 6.星型模型和雪花模型优缺点 7.spark和hadoop的区别 8.spark数据倾斜发生原因及解决方案 9.spark的新特性AQE和DPP 10.kafaka的特性 11.kafak
一面 30min 电话面试 非常温柔,也很有水平的面试官,主要是挖简历。 结束的时候还和我说了我的简历中可以优化的地方。体验很好。 二面 1h 视频面试 先挖简历 大概15min 问了许多机器学习和建模的知识,比如SVM、聚类一些基础模型的步骤 过拟合产生的原因以及如何解决 大概30min 根据我的本科专业背景问了一个开放问题 15min 之后闲聊了几分钟 是部门交叉面试,这位面试官是算法部门的,
dede_taglist|TAG标签列表表: 字段 类型 整理 属性 Null 默认 额外 tid int(10) UNSIGNED 是 0 TAGID aid int(10) UNSIGNED 是 0 文章ID arcrank smallint(6) 是 0 typeid smallint(5) UNSIGNED 是 0 栏目ID tag varchar(12) utf8_general_ci
dede_member_space|会员空间资料: 字段 类型 整理 属性 Null 默认 额外 mid mediumint(8) UNSIGNED 是 0 会员ID pagesize smallint(5) UNSIGNED 是 10 每页文档数 matt smallint(6) 是 0 spacename varchar(50) utf8_general_ci 是 空间名 spacelogo
面了大概一个小时,我自己生病了挺不舒服的,面完就睡了,所以面经有些地方可能记得不太全 1.自我介绍,边介绍边问 tableau中如何反转矩阵(行列交换),问这个是因为我写了我会tableau 我在介绍AB test和因果推断的时候,面试官说我们用不上这些,我们主要是做模型和算法 对实习中的ETL开发任务问了一下,然后问了一下Hive SQL熟练度 实习中是如何处理大规模的稀疏矩阵的 实习项目中的评
岗位JD看起来不像是数据科学家,而像算法工程师 一面: 深挖项目 介绍一下Bert模型 树形模型是如何计算每个特征的重要性的 对项目里用到的遗传算法深挖,问我是如何改进遗传算法的 特征选择中,前向选择和反向选择实现起来有什么区别,哪个效果更好 如何构建多模态模型 在多模态任务中,如果视觉模型的输出张量比语言模型的输出张量短很多,该进行什么操作 介绍一下transformer transformer
我想使用qaf-cucumber来利用QAF功能,同时仍然使用JUnit的Cucumber。主要是,我需要QAF的数据提供者功能,允许外部化场景示例。csv,以便在几个场景和功能中使用它们。 Junit:4.12 cucumber:5.0.0-RC2 QAF:2.1.15 qaf-cucumber: 2.1.15-beta-3(最新版本,因为还没有发布) 当使用场景上方的QAF标记来指定场景的位置
我在gli的kotlin港,现在卡住了 现在,有很多属性 因此,我希望将它作为类,以便利用它附带的。 但不幸的是和不兼容..(请参见此问题) 因为kotlin社区看起来非常活跃和支持,我想知道你是否有更好的想法…
我正在将Neo4J嵌入式数据库与OGM一起使用,并通过OGM SessionFactory在目录中创建数据库服务: 这很好,但现在我想用Neo4J浏览器工具浏览创建的数据库。当我阅读时,我必须通过Bolt公开我的数据库才能访问它。 在Neo4J Embedded留档中,他们使用GraphDatabase aseService并简单地指定一个额外的螺栓驱动程序来公开数据库: 但不幸的是,在使用OGM
在将typescript与单文件组件一起使用时,我很难从Vue应用程序外部调整数据。 我有一个声明了新Vue的,但是将其分配给一个变量并不能给我该变量可用。所以在Main.ts不工作 我尝试在我的file,我知道我可以用但它没有在中声明的变量。vue文件,仅当我在文件,我看到了它们,但组件模板无法呈现它们。 主要的ts: 应用程序。vue脚本: 当我看到JavaScript实现时,我可以从控制台通
我有个问题。我制作了一个使用spring-data的应用程序,并使用spring-data-rest将其公开为REST服务。一切都很顺利,直到我想有一个定制的实现。我用一个附加的方法创建了一个CustomSomethingRepository和一个SomethingRepositoryImpl。Spring data repository接口扩展了CustomSomethingRepository
我怎么能在这个代码中 检查子(userId)是否设置为ON/OFF,如果为ON,则运行代码 如果关闭,则显示一个特定的活动。
我需要编写一个连接到FTP服务器的应用程序。此FTP服务器不允许被动模式连接。我可以使用Filezilla连接到FTP服务器。 我开发了一个C#WCF服务,它使用FTPWebRequest类连接到此FTP服务器。以下是FTPWebRequest对象的基本设置: 当我从Visual Studio(Ctrl F5)运行WCF服务时,它连接到FTP服务器并下载所需的文件,没有任何问题 但是,当我在本地I
当我跑步时 我得到这个错误 get _ new _ connection conn = database . connect(* * conn _ params)Django . db . utils . operational错误:无法打开数据库文件 my settings.py: