问题：

如何从spark SQL访问本地parquet文件？

宰父俊民

2023-03-14

我正在使用Dropwizard web服务来访问许多parquet文件，我需要使用“真正的”sql（字符串）而不是spark DDL（我已经尝试过了，但没有满足我的需要）。我在独立模式下使用spark从eclipse启动服务。Spark版本是1.4.1。

问题是spark不能解析普通SQL中的parquet引用，如下所示：（我在./bro/conn.parquet中启动web服务的文件夹中有一个测试副本）

DataFrame df = sqlContext
        .sql(sql)
        .limit(5)
;

http://localhost:8080/table/query?sql=select%20ts%20from%20%20parquet.`./bro/conn.parquet`

parquet通过SQL访问是否有效，或者仅仅使用DDL API（我不能用于本用例）。是否有一种方法可以使用DDL api加载dataframe（dataframe df=sqlcontext.read（）.parquet（path））然后将完整的sql命令（减去from子句）应用到结果？

0:0:0:0:0:0:0:1 - - [02/Jun/2016:12:47:06 +0000] "GET /table/query?sql=select%20ts%20from%20%20parquet.`./bro/conn.parquet` HTTP/1.1" 500 1483 74 74
ERROR [2016-06-02 13:02:29,810] com.yammer.dropwizard.jersey.LoggingExceptionMapper: Error handling a request: fc462d5554bce965
! java.lang.RuntimeException: Table Not Found: parquet../bro/conn.parquet
! at scala.sys.package$.error(package.scala:27)
! at org.apache.spark.sql.catalyst.analysis.SimpleCatalog$$anonfun$1.apply(Catalog.scala:115)
! at org.apache.spark.sql.catalyst.analysis.SimpleCatalog$$anonfun$1.apply(Catalog.scala:115)
! at scala.collection.MapLike$class.getOrElse(MapLike.scala:128)
! at scala.collection.AbstractMap.getOrElse(Map.scala:58)
! at org.apache.spark.sql.catalyst.analysis.SimpleCatalog.lookupRelation(Catalog.scala:115)
! at org.apache.spark.sql.catalyst.analysis.Analyzer$ResolveRelations$.getTable(Analyzer.scala:222)
! at org.apache.spark.sql.catalyst.analysis.Analyzer$ResolveRelations$$anonfun$apply$7.applyOrElse(Analyzer.scala:233)
! at org.apache.spark.sql.catalyst.analysis.Analyzer$ResolveRelations$$anonfun$apply$7.applyOrElse(Analyzer.scala:229)
! at org.apache.spark.sql.catalyst.trees.TreeNode$$anonfun$3.apply(TreeNode.scala:222)
! at org.apache.spark.sql.catalyst.trees.TreeNode$$anonfun$3.apply(TreeNode.scala:222)
! at org.apache.spark.sql.catalyst.trees.CurrentOrigin$.withOrigin(TreeNode.scala:51)
! at org.apache.spark.sql.catalyst.trees.TreeNode.transformDown(TreeNode.scala:221)
! at org.apache.spark.sql.catalyst.trees.TreeNode$$anonfun$4.apply(TreeNode.scala:242)
...
0:0:0:0:0:0:0:1 - - [02/Jun/2016:13:02:29 +0000] "GET /table/query?sql=select%20ts%20from%20%20parquet.`./bro/conn.parquet` HTTP/1.1" 500 1483 20 20

共有1个答案

夏法

2023-03-14

这是由spark-sql 1.4.1中的一个bug引起的。升级到1.6.1修正了它。

类似资料：

使用Ajax从本地文件访问Web

问题内容：我对JQuery和Ajax有点陌生，所以如果这是新手的问题，我深表歉意。我正在尝试使用本地文件中的ajax来访问Web（例如，获取文本文件）。我没有使用IIS或任何其他来自硬盘驱动器的简单文件（我需要它保持这种状态）。在IE8和Chrome（版本11.0.696.60）上都进行了检查。这是一些JavaScript来说明：此代码试图从Web加载文本文件-IE和chrome上的操
Angular4：如何访问本地json？

问题内容：在Angular2中，您可以在其中有一个文件夹/ data /和一个json文件，并且可以在localhost：4200 / data / something.json中访问它。在Angular4中不再可能。任何想法如何使其起作用？问题答案：您可以使用此代码这是您的本地json文件。另请参阅angular-cli的changlog路径 https://github.com/
我如何从战争中访问文本文件

问题内容：我如何知道要从WAR中获取文件的文件参考。 WAR的结构为： WAR SRC -Model -Network structure WebContent META-INF WEB-INF LIB JSP位于WebContent下，我已将config.txt文件放在WebContent文件夹下，并尝试通过 BufferedReader in = new BufferedReader（new
AngularJS访问本地json文件

问题内容：我是angularjs的新手，我整天都在网上进行搜索，目的是找到一种解决方案，可以从本地json文件获取数据，而不必在我的webapp中使用本地主机。不幸的是，我还没有找到任何东西。我尝试使用$http.get，但收到Cross Origin *错误。有没有其他方法可以从本地json文件中获取数据而不必在本地托管我的webapp？ angularjs是否有其他功能可以从本地json文
如何从angular组件中访问本地css类名

我需要从angular组件中访问生成的css类名，以便为第三方组件设置样式。 Angular对本地css类名进行一些神奇的转换，以启用作用域。我需要对一个ngx-datatable组件应用一些自定义样式。为此，我需要向它传递自定义类名。由于angular对类名的作用，这些类名不再匹配。将类名添加到全局作用域或使用都可以工作，但是我不希望破坏封装。仪表板-Component.ts 仪表板-Com
如何从Spark2.3访问us-east-2区域的parquet文件（使用hadoop aws 2.7）

我们能够从我们当前的代码访问us-east-1，但是我们不能访问US-East-2上的拼花文件。请注意“US-East-2”连接，创建数据流在intellij上运行良好，但当我们从Spark-Shell尝试时，它会给出400个错误。我想在星火壳上做工作 /users/test/downloads/spark-2.3.3-bin-hadoop2.7/bin/spark-shell-jars/use

如何从spark SQL访问本地parquet文件？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档