当前位置：首页 > 知识库问答 >

问题：

添加包含按行值排序的列名数组的新列

通宾白

2023-03-14

给定一个包含几列的dataFrame，我试图创建一个新列，其中包含根据这些列的行值按递减顺序排序的这些列名称的数组。

| a | b | c | newcol|
|---|---|---|-------|
| 1 | 4 | 3 |[b,c,a]|
| 4 | 1 | 3 |[a,c,b]|
---------------------

列的名称存储在var名称中：数组[字符串]

我应该采取什么方法？

共有3个答案

仲孙华奥

2023-03-14

试试这样：

val sorted_column_names = udf((column_map: Map[String, Int]) => 
    column_map.toSeq.sortBy(- _._2).map(_._1)
)
df.withColumn("column_map", map(lit("a"), $"a", lit("b"), $"b", lit("c"), $"c")
    .withColumn("newcol", sorted_column_names($"column_map"))

蒋默

2023-03-14

类似这样的东西可以是使用数据集的方法：

case class Element(name: String, value: Int)
case class Columns(a: Int, b: Int, c: Int, elements: Array[String])

def function1()(implicit spark: SparkSession) = {
    import spark.implicits._
    val df0: DataFrame =
      spark.createDataFrame(spark.sparkContext
        .parallelize(Seq(Row(1, 2, 3), Row(4, 1, 3))),
        StructType(Seq(StructField("a", IntegerType, false),
          StructField("b", IntegerType, false),
            StructField("c", IntegerType, false))))

    val df1 = df0
      .flatMap(row => Seq(Columns(row.getAs[Int]("a"),
        row.getAs[Int]("b"),
        row.getAs[Int]("c"),
        Array(Element("a", row.getAs[Int]("a")),
        Element("b", row.getAs[Int]("b")),
        Element("c", row.getAs[Int]("c"))).sortBy(-_.value).map(_.name))))

    df1
  }

 def main(args: Array[String]) : Unit = {
        implicit val spark = SparkSession.builder().master("local[1]").getOrCreate()
        function1().show()
 }

给予：

+---+---+---+---------+
|  a|  b|  c| elements|
+---+---+---+---------+
|  1|  2|  3|[a, b, c]|
|  4|  1|  3|[b, c, a]|
+---+---+---+---------+

万英武

2023-03-14

在这里，使用UDF是实现自定义任务的最简单方法。

val df = spark.createDataFrame(Seq((1,4,3), (4,1,3))).toDF("a", "b", "c")

val names=df.schema.fieldNames
val sortNames = udf((v: Seq[Int]) => {v.zip(names).sortBy(_._1).map(_._2)})
df.withColumn("newcol", sortNames(array(names.map(col): _*))).show

类似资料：

按列/行排序的值

问题内容：它有点难以解释。跳到示例可能会更容易。一个表有一个ID和四列，每列允许为空。有x行数。（通常小于4）并且在整个列中最多只能使用4个不同的值。我希望返回最多4行，其中结果集中的每一行基本上都是一列值，其中该值是从顶部保留Col编号开始从右向左选择的。如果另一行的值不是列唯一，则将其移至下一个可用列。例子：如果我有：我想回来和给和给谢谢！当存在非唯一列并且值之间存在空
Java：按不带数组的列对2D数组进行排序。排序（）

我试图建立一个方法，将排序一个二维数组的双打按列。基于所提供的规范，此方法也不应该采用长度不等的行的粗糙数组。我正在使用双[][]mdarray={{3.0, 4.0, 1.0, 8.0}，{13.0, 2.0, 12.0, 9.0}测试这个使用打印方法时，应将其显示为 3.0, 2.0, 1.0, 8.0， 13.0, 4.0, 12.0, 9.0, 使用单独的打印方法输出结果时，数组似乎没有
排序多维数组：对列包含子字符串进行优先排序，然后按第二列排序

问题内容：我目前正在创建一种排序方法，该方法由mysql查询的值组成。这是数组的简要视图：我已经成功地基于数字id值进行了正常的排序，但是我想按“国家/地区”字段的内容对数组进行排序（如果在这种情况下包含设置的字符串和国家/地区代码），然后通过id字段。以下代码段是我的第一个想法，但我不知道如何将其合并到工作功能中：你会怎么做？谢谢！不幸的是，我真的一无所获。这是我目前拥有的东西，
按列值的计数对Dataframe进行排序

我有一个pandas数据帧（df），我需要根据列值的计数对其进行排序。列的值是字符串。例如，目标列的值为橙色、苹果色、香蕉色和桃色。单个计数（df['fruit'].value_counts（））为：香蕉2678 桃2250 橙色1765 苹果1691 结果我需要根据这些计数对初始数据帧（包括所有列等）进行排序。因此，在前2678行中，水果列中的值应为香蕉等
对随机值100x100数组进行排序，其中奇数索引行按升序排列，偶数行按降序排列

我对这件事还不熟悉，很困惑。
按升序排列数组

我在学校的任务是创建一个程序，以升序排列数组的值。它几乎就在那里，但每当我输入“44 55 66 22 33 11 77 99 88 66”或它输出的任何数字 -858993460,11,22,33,44,55,66,66,77,88,或开头为负数第一个数字到底怎么了？我是不是缺了什么？我对C++很陌生，我不太明白这里的问题。如果有什么建议我可以用请告诉他们。 }

相关问答

数据表：如何基于包含列名的分组唯一行值更改列值将行值添加为数据框中的新列按散列Perl的值散列排序 Can阵列。对已添加到数组中的枚举进行排序。？使用Numpy按列和排序数组，不包括每列的最大和

相关文章

MySQL按数组值排序按列排序python数组/ recarray Python-按列对NumPy中的数组排序在PHP中按子数组的值对数组进行排序按第二项对元组列表进行排序（整数值）

相关阅读

数据结构-队列2-基数排序 Oracle表添加列 2024华为OD机试 - 整型数组按个位值排 JAVA代码 JavaScript算法-删除排序数组中的重复项基数排序和堆排序

相关工具

数字键盘添加“完成”按钮列表刷新 SBJSON HTTP 首列固定的列表横向Scrollview添加图片数据库自动更新及自动赋值工具

相关文档

十大经典排序算法面向程序员的数据挖掘指南 Rexx 重构的扩展执行程序中文教程疯狂的程序员 Node.js 包教不包会