我正在研究在两个数据集上跨边缘在TitanGraph DB上执行图形聚合(groupBy,groupCount)查询:
>
大约200,000个节点和大约10亿边
有人知道我需要在什么时候安装Faunus才能在1分钟内完成这种小精灵查询吗?
在10000个节点和1M个边上,您不应该对普通的小精灵(没有Faunus)有问题。请参阅下面的代码,其中我使用熔炉生成了一个近似该大小的图形:
gremlin> g = TitanFactory.open('/tmp/titan/generated')
==>titangraph[local:/tmp/titan/generated]
gremlin> import com.tinkerpop.furnace.generators.*
==>import com.tinkerpop.gremlin.*
==>import com.tinkerpop.gremlin.java.*
...
==>import com.tinkerpop.furnace.generators.*
gremlin> for (int i=0;i<10000;i++) g.addVertex(i)
==>null
gremlin> r = new java.util.Random()
==>java.util.Random@137f0ced
gremlin> generator = new DistributionGenerator("knows", { it.setProperty("weight", r.nextInt(100)) } as EdgeAnnotator)
==>com.tinkerpop.furnace.generators.DistributionGenerator@111a3ce4
gremlin> generator.setOutDistribution(new PowerLawDistribution(2.1))
==>null
gremlin> generator.generate(g,1000000)
==>1042671
回顾您在这里关于聚合的帖子,我基本上对这个数据集执行相同的查询。
gremlin> start=System.currentTimeMillis();g.E.groupBy{it.getProperty("weight")}{it}.cap.next();System.currentTimeMillis()-start
==>1415
gremlin> m.size()
==>100
正如你们所见,遍历大约需要1.5秒(在TinkerGraph上大约需要500毫秒,这都在内存中)。
在1B边缘,你可能需要Faunus。我不认为你能在一分钟内完成所有这些边缘的迭代,即使你能以某种方式将其全部放入内存中。请注意,使用Faunus,您可能无法获得1分钟的查询/回答时间。我认为您需要进行一些实验。
size 是 GNU Binutils 之一,它能为列出 elf 文件的每个段的大小。我们的 dsp 工具链也集成了此工具叫 xt-size。 $ xt-size output/dsp.elf text data bss dec hex filename 154801 3056 17640 17549
size 是 GNU Binutils 之一,它能为列出 elf 文件的每个段的大小。我们的 dsp 工具链也集成了此工具叫 xt-size。 $ xt-size output/dsp.elf text data bss dec hex filename 154801 3056 17640 17549
它没有任何问题,没有抛出异常或任何其他迹象。为什么?
我正在按照本教程将 Graphql 与 Django 集成,当我在本地机器上点击 graphql URL 时,我根据该教程执行了所有操作 http://localhost:8000/graphql 我得到以下错误 断言错误在 /graphql 需要向GraphQLView提供架构。 请求方法:GET请求URL:http://localhost:8000/graphqlDjango版本:1.11.1
Titan 是美图公司基于 TiKV 开发的一个 NoSQL 数据库,Titan 使用完全兼容 Redis 的通讯协议。 主要特性: 完全兼容 Redis 协议 完全支持强一致性的分布式事务 支持多租户模式 无缝扩展 高可用性 下面是 Titan 的一些性能测试结果: Get Set LPush LPop LRange