当前位置: 首页 > 知识库问答 >
问题:

freebase RDF转储的Jena解析问题(2014年1月)

唐哲
2023-03-14

我正在尝试使用Jena解析Freebase-RDF-2014-01-12-00-00.gz(25 GB)的Freebase-RDF-2014-01-12-00-00.gz。耶拿报告了许多关于不良数据的问题。示例-150.0无效,true和false值无效我通过在decimal和true/false的转储文件中添加双引号来解决这些问题。但是,Jena仍在报告问题。(current-org.apache.jena.riot.riotexception:[line:161083,col:110]非法对象:[MINUS])

有没有办法对这个数据进行预处理,这样我就不用一个一个地修复每个问题了。我的Java代码:

    // Open TDB dataset
    String directory = "D:/test_dump";
    Dataset dataset = TDBFactory.createDataset(directory);

    // Assume we want the default model, or we could get a named model here
    Model tdb = dataset.getDefaultModel();

    // Read the input file - only needs to be done once
    String source = "D:/test_dump/fixed-freebase-second-rdf.gz";
    FileManager.get().readModel( tdb, source, "N-TRIPLES" ); 

共有1个答案

上官锦
2023-03-14

数据是Turtle格式的,而不是N三元组。他们使用各种Turtle缩写(如true表示“true”^^xsd:boolean或number-27表示“-27”^^xsd:integer)。

仍然可能存在错误,因为它们的转储还包含非法语法,例如在前缀名称中使用$而没有使用必要的\

在事物周围添加引号会改变RDF。

 类似资料:
  • 问题内容: 我在sql server中有一个datetime列及其可选字段,如果用户决定不输入,那么我想在表中插入NULL值,并定义如下内容: 当我插入sql server时,我在asp.net中有此代码 但问题是:其插入 在SQL表而不是 我在这里做错了什么? 更新: 问题答案: 假设您有: 如果您想插入SQL NULL,那么您应该下一步: 意思是: 如果要在函数中注意可空的datetime,则

  • 我用一个递归函数尝试过它,它迭代语句,当语句不是文字时,它会跟随对象到达下一个节点。像这样: 但不知怎的,我用这个方法没有什么进展。非常感谢你的每一次洞察。

  • 我正在尝试使用java堆转储来帮助调查内存泄漏。每当我使用它时: 堆转储文件到达大约16,048 kb并停止增长,jmap将永远运行并且不会停止,除非我杀死它。或者我尝试使用它: 但由于我是从根目录执行它的,并且该过程是从另一个用户运行的,因此我得到了以下结果: 所以我想我的问题是我做错了什么,在尝试获得这个堆转储时,最好的方法是什么?

  • 我正在用Jena生成一些RDF文件。整个应用程序使用utf-8文本。源代码也存储在UTF-8中。 当我在控制台上打印包含非英语字符的字符串时,我会得到正确的格式,例如。 然后,我使用RDF writer输出文件: RDF文件以:开头。如果添加utf-8,则不会发生任何变化。 默认情况下,文本应该编码为UTF-8。得到的RDF文件验证正常,但当我用任何编辑器/Visualiser(vim、Firef

  • 问题内容: 我正在尝试在我的android应用程序中解析Json的链接是https://www.buzzador.com/apps/present_software/webservice/index.php?op=ProductQ&campaign_id=607&userid=10776 当我将其放入Json对象时,它给我带来错误错误是:08-31 14:40:52.281:WARN / Syst

  • 我花了相当多的时间阅读GraphQL教程,但不幸的是,它们似乎没有涵盖足够的深度,我无法理解。我真的很感谢你对这个现实世界的例子的帮助。 在示例中,查询位于解析器对象的根;我可以让它在单级查询中正常工作。但是,当我尝试解析嵌套查询时,嵌套解析程序从未被调用。让我非常困惑的是,我发现graphql网站上没有发布的每一个教程都放在一个查询对象中,并将它们的查询嵌套在下面,而不是根级别。 考虑以下模式: