当前位置：首页 > 专题 >

《大数据测试》专题

当数据集较大时，Jena文本查询性能显著降低
我正在从一个2.37GB的RDF数据集进行查询，其中包含大约1700万个三元组，并且还维护了该数据集的lucence索引。我尝试了jena-text模块的文本查询，它是在存储的lucene索引的基础上进行搜索的。但是它的性能相当慢，对于一个非常慢的搜索查询需要4秒或更多的时间。然而，当我使用luncene索引查看器'luke'。索引似乎没有问题，当我从索引中搜索特定的术语时，搜索它需要几毫秒的时
从塔伦德迪向塔伦德大数据输出就业岗位
我是talend ETL工具的新手。我已经在talend DI（数据集成）工具中创建了工作流，现在我想使用hadoop切换/实现相同的工作，因为我正在使用talend大数据工具。谁能解释一下我是如何做到这一点的。Talend DI to Talend大数据集成。
RecyclerView快速滚动拇指高度对于大型数据集太小
我正在使用默认的快速滚动，我遵循了本指南来支持它。
字节 Data 大数据开发工程师1 2 3 4面已挂
1面（1h）8.2 项目介绍 MapReduce提交作业流程 MapReduce和spark的区别 HDFS架构 HDFS写流程 groupByKey和reduceBykey的区别算法题（实现一个类，插值（已存在就false，不存在就插入），删除值（不存在这个值就返回false，存在就删除），随机获取已存储的值，三个功能时间复杂度为O(1)） 2面（45min）8.10 项目介绍数仓理解 ja
贝壳大数据开发一二面+HR面面经已发意向
9.4 下午面完全部 9.9 已意向一面 40min warm-up 自我介绍？介绍数仓分层架构？写SQL temp表 user_id，order_date 求出每位用户的第一次下单信息？如何优化SQL？利用 Hive 按照日期分区的特点进行优化，写SQL。留存率是如何计算的？写一下？再写一个如何计算7日内留存率？基础知识说一下数据倾斜的概念？说一下MapReduce Map端会
奇瑞汽车-雄狮科技大数据开发一面（15分钟）
面试官是个小姐姐，很温柔自我介绍了解大数据组件吗不了解了解数据仓库吗不了解简单讲一下项目 rabbitMQ 在项目中怎么用的了解kafka吗不了解 springboot 打包方式 jar包、war包怎么部署Linux 没部署过说一下慢sql排查以及优化手段慢查询日志，explain，索引
北京蔚来大数据开发实习一面、二面（回忆版）
个人情况简述：本硕双非，acm银牌群友（cpp实习生）内推投递因为是之前面的，时间也有1个多月了，可能记不太清一些细节了一面（总时长90分钟）聊简历项目，一个离线大数据处理项目，flume+hadoop+hive+spark+azkaban，两个后端项目项目扣细节，主要问设计思路，比如数仓各层的设计、flume和kafka之间如何结合使用，spark的算子等项目一共问了40多分钟接下
杭州广立微大数据开发，1面+2面+hr面已offer
23.9.21 广立微共计半小时在阿里做的项目介绍一下充电场站项目。。。用户画像项目详细介绍 java大数据去重的方法 python数据清洗用的什么方法你们阿里的数据中台中表是以什么格式存储的模型的评级标准是什么样的 python直接取一行数据 hive窗口函数，一个省一个市，取人口最多的两个城市 hive的行转列和列转行用什么函数 lead和lag是干什么的 mysql不同的关键字的
10.22 大数据工程师阿里国际百度面经（带答案）
数据库底层索引的优劣势？数据库底层索引的优势和劣势主要取决于具体的索引类型和使用场景：优势：提升查询性能：索引可以加快数据库的查询速度，通过跳过不需要的数据块，减少了磁盘I/O操作。加速排序：索引可以帮助数据库对查询结果进行排序，从而提高排序的效率。支持唯一性约束：索引可以保证某一列或多列的唯一性，保证数据的完整性。提高并发性能：索引可以减少数据的锁竞争，提高数据库的并发性能。支持数
某终端外包——大数据开发（最压力拉满的一集）
面试内容一面（乙方）： 1、聊一下熟悉的数据库，关系型，非关系型都说一下？ 2、介绍一下clickhouse，为什么用它？ 3、说一下简历上项目，数仓的分层架构，每一层的作用？ 4、入库做数据清洗吗？还是后续在数仓中过滤？说一下实际的做法 5、数据同步是怎么做的？你在项目中的角色？（说了kafka） 6、你这个是离线的数仓吗？你觉得什么需要做数仓？ 7、为什么用flinkcdc？ 8、spark
腾讯实习一面-PCG大数据平台-运营开发面经
前面的IEG秒挂后2天被这个部门捞了，这几天准备了下算法，但是项目有点懈怠了时间：3月11日 14：40 ，时长45分钟全程拷打Java项目，掺了一些业务相关的八股拷打查询优化细节：因为项目亮点手贱，写了用Redis缓存优化前时间、优化后时间。结果疯狂拷打怎么得出的优化时间其实是编的数据😭😭，引以为鉴！！ ⭕查询时间是怎么测出来的？肉眼对比效果 + 查询前时间对比查询后时间 ❌
字节跳动大数据开发工程师一面面经（社招）
1、自我介绍 2、跳槽理由 3、介绍团队 4、自己感觉做的最好的项目(扣的很细，聊了很久) 5、遇到过的技术问题 6、数据倾斜如何解决 7、缓慢变化维怎么解决 8、周期变化事实数据，比如七天累计订单表应该放哪一层？为什么？ 9、什么数仓才算一个好的数仓 10、雪花模型跟星型模型区别 11、写sql题 12、反问面了三家淘天、字节、pdd，都offer了，这个草稿也是当时写的一直忘发了，后面有空
奇安信|大数据面经|这公司现在还能去么？😂
模型开发的流程，需求调研过程中有哪些人员参加，调研过程，你会输出什么文档？如何保障数据质量（准确性）？ spark有什么优缺点？在使用过程如何规避缺点？ spark内存模型？ spark和MR为什么会进行shuffle，如何减少shuffle？小文件治理的方式？主题域建设的流程？大表join大表的优化（10亿与1千万数据关联）？为什么存在ods穿透？为什么离职，旧公司工作强度如何？这
SQL Server 2008数据库误删数据如何进行数据恢复
本文向大家介绍SQL Server 2008数据库误删数据如何进行数据恢复，包括了SQL Server 2008数据库误删数据如何进行数据恢复的使用技巧和注意事项，需要的朋友参考一下有个朋友很着急地打电话给我，他用delete语句误删除了SQL Server 2008数据库中两个表中的所有记录，而这个数据库之前没有任何备份。让我帮他解决一下，不然他要赔偿客户很多钱。 SQL Server中误删除
Access数据库：如何从数据库/表导入查询SQL数据
我已经建立了一个Access数据库，现在我正试图从SQL数据库将数据导入Access数据库表。Access数据库表现在是空的，我正试图从SQL数据库导入数据，只有一个键值。例如，我只想导入符合以下条件的数据。我已经设置了到表的ODBC链接。我一直在寻找这样做的方法，但没有找到任何好的方法。使现代化找到了答案，对于任何需要知道如何做到这一点的人，以下是步骤。

首页

96

97

98

99

100

尾页

最新发布

某一面虾皮 NLP 一面美的寒假实习llm面经蚂蚁大模型算法面经，say something I don't know 百度 llm算法一面凉经

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

前端 - vu3+vite 使用vue-pdf-embed预览pdf，组件渲染空白，页面无报错，是什么原因？java - @Async("asyncTaskExecutor") 没有并发处理问题？python - 如何查看：pypi中想要看是否哪些包最受欢迎的库？前端 - 可以安装在内网使用的安卓模拟器？前端调用API之后更新状态逻辑：是触发store的方法进行拉取更新是吗，还是说直接修改store进行更新？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

StarFramework Transparency Zigbee2mqtt ngMigration Assistant Fuzzylime sysu-thesis OWASP AJAX Crawling Tool Js2coffee

文档资料

小米数据处理和分析服务（EMR）使用指南 iOS 核心动画高级技巧蘋果 Swift 官方教學 v2.0 Effective C++ 中文版跟我学 Spring MVC