当前位置: 首页 > 知识库问答 >
问题:

加载文件时无法推断架构

蒋文光
2023-03-14

下面的代码是在pyspark shell中运行时的工作文件,但在spark submit master Thread中执行时失败。

我在这里怎么了?

   from datetime import date, timedelta
   import pandas as pd
   import os, sys
    startd = '20140101'
    endd=str(sys.argv[1])
    currd=str(sys.argv[2])
    spark = SparkSession.builder.getOrCreate()
    base = "s3://metadata_v1/DATE="
    dstart = pd.to_datetime(startd).date()
    dend = pd.to_datetime(endd).date()

    s3 = []
    days = [dstart + timedelta(days=x) for x in range((dend - dstart).days + 1) if (dstart + timedelta(days=x)).weekday() == 5]
    for i in days:
        s3.append(base + i.strftime('%Y-%m-%d'))
    
    data = spark.read.option("header", "True").option("delimiter", "|").option("basePath","s3://metadata_v1/").csv(s3)

错误:

pyspark.sql.utils.AnalysisException: u'Unable to infer schema for CSV. It must be specified manually.;'

共有1个答案

姚嘉容
2023-03-14

当某些csv文件包含标题行时,可能会发生这种情况,在尝试转换某些列的数据类型时,某些列无法加载标题行。在读入数据帧之前,可以尝试删除每个CSV文件中的标题行。

 类似资料:
  • 但随后: UPDATE:当使用master=“local”连接时,此操作工作,当连接到master=“MySparkCluster”时,此操作失败。

  • 我实际上有几个问题,第一个问题是为什么我的CSS文件没有加载?需要说明的是,我对HTML和CSS非常陌生,这实际上是我的第一个项目,所以不要太苛刻?而且,有时我的视频没有加载,就像我有一个模因页面,它只是给我一个黑色的视频播放器。我决定忽略它,专注于CSS,然后测试我的页面和加载的memes。我的最后一个问题是如何将多个视频/音频加在一起。例如,如果我有三个音频文件,如音频一,音频二,音频三,只有

  • 我实际上有几个问题,第一个问题是为什么我的CSS文件没有加载?需要说明的是,我对HTML和CSS非常陌生,这实际上是我的第一个项目,所以不要太苛刻?而且,有时我的视频没有加载,就像我有一个模因页面,它只是给我一个黑色的视频播放器。我决定忽略它,专注于CSS,然后测试我的页面和加载的memes。我的最后一个问题是如何将多个视频/音频加在一起。例如,如果我有三个音频文件,如音频一,音频二,音频三,只有

  • 问题内容: 我最近决定从Apache2切换到Nginx。我在CentOS服务器上安装了Nginx并设置了基本配置。当我尝试在浏览器(FF / Chrome)中加载网站时,我注意到未加载CSS文件。我检查了错误控制台,并看到以下消息: 我检查了Nginx的配置,一切似乎都很好: 在/etc/nginx/mime.types中正确设置了css文件的mime类型。 一切似乎都配置正确,但是我的css文件

  • 我在Spring Boot 2和GraphQL中使用了以下示例,但在加载graphiql时出现了以下错误,模式没有加载。 https://github.com/TechPrimers/spring-boot-graphql-query-example 该代码通过postman但来自Graphiql的POST调用工作。

  • 我正在使用Javase6手动部署webservice。我想使用@SchemaValidation来验证SOAP流量。在发布终结点期间,我收到错误: 原因:org.xml.sax.SAXParseException:s4s-att-invalid-value:元素“restriction”中“base”的属性值无效。记录原因:UndeclaredPrefix:无法将“xsd:string”解析为QN