问题：

更改现有数据表的架构

缪征

2023-03-14

val customSchema=StructType(
      Array(
        StructField("data_typ", StringType, nullable=false),
        StructField("data_typ", IntegerType, nullable=false),
        StructField("proc_date", IntegerType, nullable=false),
        StructField("cyc_dt", DateType, nullable=false),
        ));

val readDF=
+------------+--------------------+-----------+--------------------+
|DatatypeCode|         Description|monthColNam|     timeStampColNam|
+------------+--------------------+-----------+--------------------+
|       03099|Volumetric/Expand...|     201867|2018-05-31 18:25:...|
|       03307|  Elapsed Day Factor|     201867|2018-05-31 18:25:...|
+------------+--------------------+-----------+--------------------+

val rows= readDF.rdd
val readDF1 = sparkSession.createDataFrame(rows,customSchema)

val newdf=
    +------------+--------------------+-----------+--------------------+
    |data_typ_cd |       data_typ_desc|proc_dt    |     cyc_dt         |
    +------------+--------------------+-----------+--------------------+
    |       03099|Volumetric/Expand...|     201867|2018-05-31 18:25:...|
    |       03307|  Elapsed Day Factor|     201867|2018-05-31 18:25:...|
    +------------+--------------------+-----------+--------------------+

任何帮助都将成为徒弟

共有1个答案

常培

2023-03-14

您可以执行类似的操作，将数据类型从一个更改为另一个。

我创建了一个类似于您的数据frame，如下所示：

import sparkSession.sqlContext.implicits._
import org.apache.spark.sql.types._

var df = Seq(("03099","Volumetric/Expand...", "201867", "2018-05-31 18:25:00"),("03307","Elapsed Day Factor", "201867", "2018-05-31 18:25:00"))
  .toDF("DatatypeCode","data_typ", "proc_date", "cyc_dt")

df.printSchema()
df.show()

这给出了以下输出：

root
 |-- DatatypeCode: string (nullable = true)
 |-- data_typ: string (nullable = true)
 |-- proc_date: string (nullable = true)
 |-- cyc_dt: string (nullable = true)

+------------+--------------------+---------+-------------------+
|DatatypeCode|            data_typ|proc_date|             cyc_dt|
+------------+--------------------+---------+-------------------+
|       03099|Volumetric/Expand...|   201867|2018-05-31 18:25:00|
|       03307|  Elapsed Day Factor|   201867|2018-05-31 18:25:00|
+------------+--------------------+---------+-------------------+

df = df.withColumnRenamed("DatatypeCode", "data_type_code")

df = df.withColumn("proc_date_new", df("proc_date").cast(IntegerType)).drop("proc_date")

df = df.withColumn("cyc_dt_new", df("cyc_dt").cast(DateType)).drop("cyc_dt")

df.printSchema()

root
 |-- data_type_code: string (nullable = true)
 |-- data_typ: string (nullable = true)
 |-- proc_date_new: integer (nullable = true)
 |-- cyc_dt_new: date (nullable = true)

类似资料：

Cassandra表架构更改

我使用Datastax Cassandra3.0，同时使用cqlsh模式在cassandra中创建表，正在更改列名，列名按字母顺序排列。请看下面。这是创建表时的结构。 ...每月一次的瓦尔查尔， ...分配int, ...evdate日期， ...paymentterms int, ...percentageofpayment int, ...变体int, ...paymenttermsumma
更改Spring Boot使用的数据库架构

问题内容：如何指定Spring Boot使用的数据库架构？我正在使用默认的hibernate（=默认）和postgres（但我希望一个通用的解决方案）。我知道如何指定JDBC URL：但是不幸的是，postgresql不允许在JDBC URL中指定架构。我知道这里有hibernate属性hibernate.default_schema，所以我希望以下属性之一可以工作：但是不幸的是，他们似乎都
跟踪数据库架构更改的机制

问题内容：按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实，参考或专业知识的支持，但是这个问题可能会引起辩论，争论，民意调查或扩展讨论。如果您认为此问题可以解决并且可以重新提出，请访问帮助中心以获取指导。 8年前关闭。跟踪和/或自动执行数据库架构更改的最佳方法是什么？我们的团队使用Subversion进行版本控制，我们已经能够以这种方式自动执行一些任务（将构建推送到暂存服务器
更改Spring Boot使用的数据库架构

如何指定Spring Boot使用的数据库模式？我使用默认的hibernate（=默认）和postgres（但我希望有一个通用的解决方案）。我知道如何指定JDBC URL：但不幸的是，postgresql不允许在JDBCURL中指定模式。我知道有hibernate属性，因此我希望以下属性之一能够正常工作：但不幸的是，它们似乎都没有任何结果。
JFreeChart更改现有条形图中的数据

问题内容：我想循环更改条形图数据，但我不知道该怎么做。我的代码：问题答案：更新模型，随后将显示侦听视图。动画更新，而不会阻塞事件调度线程，使用; 根据需要调用。经测试：
更改表的SQL Server性能更改列更改数据类型

问题内容：我们需要将某些列的数据类型从int更改为bigint。不幸的是，其中一些表很大，大约有7-10百万行（但不宽）。 Alter表alter列将永远保留在这些表上。有没有更快的方法来实现这一目标？问题答案：巧合的是，大约3个小时前，我不得不做一些非常相似的事情。该表是3500万行，它相当宽，并且花了很多时间才能做到这一点：这就是我最终得到的结果：这次，这些陈述几乎是即时的。（在速度

更改现有数据表的架构

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档