当前位置: 首页 > 知识库问答 >
问题:

RDF4J:从endpoint解析查询结果并将其存储为ntriples文件(格式错误的查询)

弘烨烁
2023-03-14

在此终结点中,有一个以N-三元组格式获取查询结果的选项。我想在连接到endpoint时对rdf4j库做同样的事情,并将结果保存在ntriples格式文件中。

到目前为止,我使用了一个图形查询(CONSTRUCT):

        .....
        String queryString = prefixes +
                " CONSTRUCT { ?sub ?hasProp ?prop } WHERE { ?sub ?hasProp ?prop FILTER(?sub = yago:Naples) } ";
        GraphQuery graphQuery = con.prepareGraphQuery(QueryLanguage.SPARQL, queryString);
        RDFWriter writer = new NTriplesWriter(System.out);
        graphQuery.evaluate(writer);

不幸的是,我得到:[畸形查询结果从服务器](预期'.',发现'-')。在endpoint中,结果返回正常(Ntriples格式)。这可能是rdf4j的bug吗?

> <http://yago-knowledge.org/resource/Naples>
> <http://yago-knowledge.org/resource/linksTo>
> <http://yago-knowledge.org/resource/S.S.C._Napoli> .
> <http://yago-knowledge.org/resource/Naples>
> <http://yago-knowledge.org/resource/linksTo>
> <http://yago-knowledge.org/resource/Treno_Alta_Velocit\u00E0> .
> <http://yago-know18:50:57.014 [main] ERROR
> o.e.r.rio.helpers.ParseErrorLogger - [Rio fatal] Expected '.', found
> '–' (386, -1) org.eclipse.rdf4j.query.QueryEvaluationException:
> Malformed query result from server    at
> org.eclipse.rdf4j.repository.sparql.query.SPARQLGraphQuery.evaluate(SPARQLGraphQuery.java:69)
>   at org.example.Connect.main(Connect.java:60) Caused by:
> org.eclipse.rdf4j.repository.RepositoryException: Malformed query
> result from server    at
> org.eclipse.rdf4j.http.client.SPARQLProtocolSession.getRDF(SPARQLProtocolSession.java:934)
>   at
> org.eclipse.rdf4j.http.client.SPARQLProtocolSession.sendGraphQuery(SPARQLProtocolSession.java:463)
>   at
> org.eclipse.rdf4j.repository.sparql.query.SPARQLGraphQuery.evaluate(SPARQLGraphQuery.java:62)
>   ... 1 more Caused by: org.eclipse.rdf4j.rio.RDFParseException:
> Expected '.', found '–' [line 386]    at
> org.eclipse.rdf4j.rio.helpers.RDFParserHelper.reportFatalError(RDFParserHelper.java:403)
>   at
> org.eclipse.rdf4j.rio.helpers.AbstractRDFParser.reportFatalError(AbstractRDFParser.java:755)
>   at
> org.eclipse.rdf4j.rio.turtle.TurtleParser.reportFatalError(TurtleParser.java:1318)
>   at
> org.eclipse.rdf4j.rio.turtle.TurtleParser.verifyCharacterOrFail(TurtleParser.java:1153)
>   at
> org.eclipse.rdf4j.rio.turtle.TurtleParser.parseStatement(TurtleParser.java:241)
>   at
> org.eclipse.rdf4j.rio.turtle.TurtleParser.parse(TurtleParser.java:201)
>   at
> org.eclipse.rdf4j.rio.turtle.TurtleParser.parse(TurtleParser.java:143)
>   at
> org.eclipse.rdf4j.http.client.SPARQLProtocolSession.getRDF(SPARQLProtocolSession.java:931)
>   ... 3 more

共有1个答案

徐隐水
2023-03-14

当RDF4J的SPARQLRepository针对该endpoint执行SPARQL查询请求时,该endpoint将以海龟格式发回其响应。不幸的是,该响应包含语法错误。发生的情况如下:

  1. RDF4J执行查询请求,指示几种可接受的结果格式(包括Turtle和N-Triples)
  2. endpoint执行查询,选择Turtle作为响应格式,并将查询结果序列化为Turtle
  3. RDF4J接收海龟数据并对其进行解析
  4. 解析后的结果被传递给NTriplesWriter,然后由NTriplesWriter将其写出

但是,endpoint发回的查询结果文档在语法上不是有效的Turtle,这导致RDF4J的Turtle解析器在步骤3中出现错误而中止。

问题是响应中的这一行(第386行):

    yago:Italian_War_of_1494–98 ,

具体地说,字符介于149498之间。虽然它看起来像一个减号(-),这是完全合法的,但它实际上是所谓的短折线(Unicode字符0x2013)。在Turtle中,这不是前缀名称中的法律字符。

endpoint的编写器应该通过更改为完整URI而不是前缀名称,并使用Unicode转义序列正确序列化该值,如下所示:

<http://yago-knowledge.org/resource/Italian_War_of_1494\u201398>

可能值得使用endpoint维护者记录错误报告,并建议对此进行修复。

作为一种解决方案,endpoint的N-Triples输出(如果您强制它用N-Triples而不是Turtle响应)在语法上似乎是正确的。您可以通过覆盖RDF4J的SPARQLRepository发送的标准接受标头来强制服务器使用N-Triples而不是Turtle进行响应,就像这样:

SPARQLRepository repo = new SPARQLRepository(endpoint);

// create a new map of additional http headers
Map<String, String> headers = new HashMap<String, String>();

// we set the Accept header to _only_ accept text/plain, forcing the endpoint
// to use N-Triples as the response format. This overwrites the standard
// Accept header that RDF4J sends.
headers.put("Accept", "text/plain");
repo.setAdditionalHttpHeaders(headers);

一旦这样做了,剩下的代码就可以工作了。

 类似资料:
  • 这可以在单个sql查询中完成吗?或者我必须在循环中对每个房间进行查询吗?还是在一次查询中转储整个数据集,然后在pyhton中处理它更有效率?这是一个很小的数据集,但我有兴趣知道哪一个是最有效的方法。 先谢谢你,马丁 下面是我的表结构:

  • 哪种方法是以CSV格式导出JPA查询结果的最佳方法?我试过opencsv,但它需要一个java.sql.ResultSet对象,我不明白如何创建它。我尝试了以下代码 但我收到异常java.lang.ClassCastException:java.util.Vector不能强制转换为java.sql.ResultSet

  • 我想去 > 我确信这方面的最佳做法是什么。 我初始化

  • 问题内容: 我正在尝试使用elasticsearch和ruby-on- rails建立一个现有项目。我可以启动并运行该项目,但是elasticsearch查询为我返回了各种错误消息,而我的同事都没有: 这显然使我相信这与我的设置有关。我已经安装了它们的相同版本(2.4),但是即使项目附带了setup命令,也是如此: 给我超时错误。我已经检查并且服务正在运行。如果我在此方面呆了2天,将对我的设置有什

  • 如何将查询结果保存在字符串数组中 查询很简单,只有一列,即: 我想要的是将id存储在String数组中,这样我就可以将它们显示为列表视图中的可点击项。