当前位置: 首页 > 知识库问答 >
问题:

将超大型数据集导入Neo4j

慕金林
2023-03-14

我有一个庞大的CA的csv数据集。7GB,它有不同类型的列:string和Float。那么将其导入到Neo4J中的超快解决方案是什么呢?

我也尝试使用neo4j-admin导入工具,但每次我都被以下错误所困扰:

Invoke-Neo4jAdmin:c:\users\shafigh.neo4jdesktop\neo4jdatabases\database-417e361b-f273-496c-9836-4fca6f80d0c0\installation-3.4.1不是有效的Neo4j安装。缺少C:\users\shafigh.neo4jdesktop\neo4jdatabases\database-417e361b-f273-496c-9836-4fca6f80d0c0\installation-3.4.1\lib在行:1 char:161+...sd1';Exit(Invoke-Neo4jAdmin import--节点

共有1个答案

况谦
2023-03-14

neo4j操作手册的导入部分描述了如何使用neo4j-admin工具的Import命令“批量导入大量数据”到新的neo4j数据库。

import命令非常快,因为它直接构建新数据库的内部文件,而不必处理事务。

 类似资料:
  • 我正在使用数据库和。现在,我想导入相当大的数据集,因此我研究了的批插入功能。 经过我的研究,我发现: 用于嵌入式数据库:http://docs.neo4j.org/chunked/stable/batchinsert.html以及使用它的Michael Hunger项目:https://github.com/jexp/batch-import/ REST批处理终结点:http://docs.neo

  • 本文向大家介绍pytorch下大型数据集(大型图片)的导入方式,包括了pytorch下大型数据集(大型图片)的导入方式的使用技巧和注意事项,需要的朋友参考一下 使用torch.utils.data.Dataset类 处理图片数据时, 1. 我们需要定义三个基本的函数,以下是基本流程 这里,我将 读取图片 的步骤 放到 __getitem__ ,是因为 这样放的话,对内存的要求会降低很多,我们只是将

  • 我有一个1.5GB.dat文件需要作为pandas数据帧导入,我遇到了内存问题(8GB RAM)。如何将dat文件分解成块来执行分析?

  • 我有一个500GB的csv文件和一个1.5 TB数据的mysql数据库,我想运行aws sagemaker分类和回归算法和随机森林。 aws sagemaker能支持吗?模型可以批量或分块读取和训练吗?它的任何例子

  • 问题内容: 我有一个看起来像这样的数据结构: 我在模型表中有超过500万行,我需要在两个外键表的每一个中插入 约5000万 行。我的文件看起来像这样: 它们每个约为 7 Gb 。问题是,当我这样做时,大约需要 12个小时 才能在AMD Turion64x2 CPU上导入 约400万 行。操作系统是Gentoo〜amd64,PostgreSQL是版本8.4,在本地编译。数据目录是一个绑定安装,位于我

  • 问题内容: 如何在MAMP上导出/导入大型数据库?使用PHPMyAdmin无法正常工作。 问题答案: 应该通过如下所示的终端来完成。 在终端中,使用以下命令导航到MAMP的文件夹 使用此命令导出文件。EG将是 行应该出现在说。在这里输入MySQL密码。请记住,这些字母不会出现,但是它们在那里。 如果需要导入,请使用BigDump,这是一个MySQL Dump Importer。