当前位置: 首页 > 知识库问答 >
问题:

Spark release 2.1.0(2016年12月28日)无法推断csv文件

隆钊
2023-03-14

我试图使用Scala中Windows的最新版本spark(2.1.0(12月28日,2016年)读取csv文件。我注意到,当读取csv文件并推断模式时,解析文件将失败。inferschema选项将失败,一些本应为double的字段将被列为字符串。我可以强制列为指定类型的数据,但解析行仍将保留空值。我认为发生这种情况是因为字符串列中有逗号。

共有1个答案

佘辰龙
2023-03-14

我将构建的spark更改为2.0.1(2016年10月3日),推断模式工作正常。因此,可能在windows的新spark构建版本(2.1.0(2016年12月28日)中存在错误。

 类似资料:
  • 我有一本书。包含以下列的csv文件:名称、日期、信息、统计信息、更多信息 我想进口这个。csv文件(使用Python 3.6代码或Pandas) 然后我需要过滤列:NAME,DATE,INFO 这是我有麻烦的地方,我需要采取我的. csv文件的'日期'列,其中列出了一个日期为1/16/2016,并将其分开,这样我就可以只选择月份为我的过滤. csv输出文件。 我最后要读的专栏,比如名字、月份、信息

  • 工单 【新增】批量编辑工单新增修改工单分类功能 客服通过工单列表多选工单进行批量编辑时,可通过“工单分类”对选中的工单进行修改,修改分类时,若修改后的工单分类模板,含原工单中不存在或未填写的必填字段内容,则该字段为空并可以保存成功。 【新增】自定义字段权限,增加问题描述的权限设置 对工单自定义字段-自定义字段权限设置,新增问题描述的权限设置,可对指定的权限组,将问题描述设置为只读或读写权限,权限组

  • 企微智客 【优化】朋友圈sop任务执行流程 对员工执行发朋友圈sop任务的流程进行了优化,更加方便快捷 在线客服 【优化】平台电商子商户商品卡片 取消平台电商子商户商品卡片创建工单按钮。 【优化】客服工作台-会话切换快捷键“Shift+↑/↓” 会话关闭后系统默认选择会话列表中下一个会话以便继续使用快捷键进行会话切换。 【优化】平台电商新增客服接口 完善新增客服相关接口字段,增加:电话及接待坐席上

  • 类似于: 2016年4月1日 2016年4月3日 2016年4月22日的日期格式将是什么 那么有没有API可以这样解析日期呢? 编辑:重复的问题不包含任何关于分析日期1(st)、2(nd)、3(rd)的答案。我不知道如何分析第1中的st,第2中的nd和第3中的rd。

  • 迁移到Github 这篇文章已经在github上作为一个仓库创建了,这样它可以很容易地被分享、更新、提高。它是从这里复制过来的。http://samizdat.mines.edu/howto/HowToBeAProgrammer.htm by Braydie Grove。 2016年1月迁移到github。 希望反馈或扩展。 请将你对这篇文章的任何评论发给我,我会考虑所有的建议,大部分都会对这篇文

  • 问题内容: 我需要解析一个字符串到目前为止。但是得到了一个不可解析的异常。以下是我的代码: 问题答案: 您的格式有几个问题: 表示年份中的某天,而不是月份中的某天 您错过了时区 月的格式不正确 因为你的时间是24小时制,你需要的,而不是 有关 日期和时间模式的 信息,请参阅文档。