我目前正在评估Datomic的存储和查询形成本体的解析符号的用例 . 总共有225122个符号(实体)在数据库中(因此它是一个相当大的本体,但对于数据库来说不应该是一个大问题) .
结构非常标准,符号有
包含它们的父符号(如子符号等)
supersymbols(他们继承的符号)
为了能够很好地访问这些符号,我们为每个符号都有一个唯一的 name . 这相当于以下Datomic架构:
[{:db/ident :ml/name,
:db/valueType :db.type/string,
:db/cardinality :db.cardinality/one,
:db/unique :db.unique/identity}
{:db/ident :ml/parent,
:db/valueType :db.type/ref,
:db/index true,
:db/cardinality :db.cardinality/one}
{:db/ident :ml/superclass,
:db/valueType :db.type/ref,
:db/index true,
:db/cardinality :db.cardinality/one}]
现在我有了最基本的递归查询“给我所有符号(传递)包含在符号 p 中的符号” . 在Datomic术语中:
(def rules
'[
[(ubersymbol ?c ?p) (?c :ml/parent ?p)]
[(ubersymbol ?c ?p) (?c :ml/parent ?c1) (ubersymbol ?c1 ?p) ]
])
(q '[:find ?c ?n :in $ % :where
(ubersymbol ?c ?d) [?d :ml/name "name of a root symbol"] [?c :ml/name ?n]]
current-db rules)
查询本身(所以中等大小的符号)需要在 5 和 5.5 秒之间,并返回80次点击 . Not milliseconds, but real seconds . 这只是我想要询问的关于数据集的最基本的查询(它旨在从Web工具中使用,以帮助建模者理解本体的结构) .
我正在运行 datomic-pro-0.9.5554 ,带有内存数据库并使用对等库(我按照"getting started"指南中的说明启动了服务器 .
非常感谢帮助为Datomic提供案例 .
马库斯