问题：

Scala Spark仅读取特定列下的最后一行

秦学林

2023-03-14

我如何修改下面的代码来只获取表中的最后一行，特别是key列下的值？原因是，这是一个巨大的表，我需要最后一行，特别是键值，才能知道它加载了多少。我不在乎还有什么其他内容。

第1行：

val df = spark.sqlContext.read.format("datasource").option("project", "character").option("apiKey", "xx").option("type", "tables").option("batchSize", "10000").option("database", "humans").option("table", "healthGamma").option("inferSchema", "true").option("inferSchemaLimit", "1").load()

第2行：

df.createTempView("tables")

第3行：

spark.sqlContext.sql("select * from tables").repartition(1).write.option("header","true").parquet("lifes_remaining")

共有1个答案

诸葛煜

2023-03-14

您可以在这样的数据框架中使用orderBy，希望它有帮助：

df.orderBy($"value".desc).show(1)

类似资料：

Python-仅读取特定行

问题内容：我正在使用for循环读取文件，但是我只想读取特定的行，例如26号和30号行。是否有任何内置功能可实现此目的？问题答案：如果要读取的文件很大，并且你不想一次读取内存中的整个文件：注意，对于nth行。在Python 2.6或更高版本中：
OpenCSV读取特定列

我在使用OPENCSV并尝试从一行中读取特定列时遇到了小问题。我有一个看起来像这样的csv文件现在我只想读取第2列和第3列（名称和名称2）。我的代码看起来像这样我已经尝试手动将“i”变量设置为1和2。但是我得到了日志中显示的4个相同的结果。缺少什么？谢谢！
jackson自定义反序列化器仅获取列表xml中的最后一个值

我有以下xml 我正在使用自定义jackson反序列化程序获取值，pojo看起来像类根{私有字符串日期；反序列化程序代码如下所示问题是，当我调试时，我总是从xml中获取条目的最后一个值。所以节点（在反序列化器中）的值是{“date”：“112004”，“entries”：{“entry”：{“id”：“3”，“status”：“N/A”}}}}，我不知道为什么它不被视为列表。我确实为列表添加
使用python读取csv中的特定列

我有一个csv文件，如下所示： ... 我怎样才能在python中只读取列“AAA、DDD、FFF、GGG”并跳过标题？我想要的输出是一个元组列表，如下所示：[（1,4,3,20），（2,5,2,23），（4,6,1,22）]。我正在考虑稍后将这些数据写入SQLdatabase。我参考了这篇文章：用csv模块从csv文件中读取特定的列？。但是我不认为这对我有什么帮助。因为我的. csv很大，有一
使用python读取csv中的特定列

问题内容：我有一个csv文件，看起来像这样： … 如何只读取python中的“ AAA，DDD，FFF，GGG”列并跳过标题？我想要的输出是一个看起来像这样的元组列表：[（1,4,3,20），（2,5,2,23），（4,6,1,22）]。我正在考虑稍后将这些数据写入SQLdatabase。我提到了这篇文章：使用csv模块从csv文件中读取特定的列？。但是我认为这对我的情况没有帮助。由于我的.c
CSV读取特定行

问题内容：我有一个包含100行的CSV文件。如何读取特定行？我想读第9行或第23行等？问题答案：您可以使用来过滤文件，如下所示：

Scala Spark仅读取特定列下的最后一行

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档