当前位置: 首页 > 知识库问答 >
问题:

为deeplearning4j准备数据

公西志文
2023-03-14

我想预测具有以下形式的数据分类

分类器;文本描述

    null
    RecordReader recordReader = new CSVRecordReader(1, ';');
    recordReader.initialize(new FileSplit(new File(csvFilePath)));

    DataSetIterator iterator = new RecordReaderDataSetIterator(recordReader,batchSize,labelIndex,numClasses);
    return iterator.next();

共有1个答案

戚哲
2023-03-14

您通常使用我们的ETL库datavec。我不知道你在看哪里,但示例中有大量的csv、图像和文本中的预处理数据的示例。这取决于你在做什么。

对于CSV,您找到了正确的起点。它将从CSVS目录加载。在我们的例子中,我引用了其中的一个例子:

 int numLinesToSkip = 0;
 char delimiter = ',';
  String localDataPath = DownloaderUtility.IRISDATA.Download();
RecordReader recordReader = new CSVRecordReader(numLinesToSkip,delimiter);
recordReader.initialize(new FileSplit(new File(localDataPath,"iris.txt")));
int labelIndex = 4;
int numClasses = 3;
DataSetIterator iteratorA = new RecordReaderDataSetIterator(recordReaderA,10,labelIndex,numClasses);
       

这将设置一个记录读取器来解析数据,您将其初始化为将该读取器指向特定的文件或目录(可以是任何数据)

继续我所拥有的,可能是因为你在用文字或一些不是数字的东西折腾。所有的机器学习都涉及到将一切(无关紧要)转换为数字。我不想在一个帖子里做一个完整的ML课程,但如果你能更具体一点,我可以给你一些提示,告诉你你需要为你的特殊情况做什么。

 类似资料:
  • 通过Keras神经网络运行一组标记向量。 查看Keras数据集示例mnist: 它似乎是一个三维Numpy数组: 第一个维度用于样本 每个示例功能的第二个和第三个 构建标记向量: 为什么对于如此简单的数据集,我会得到如此糟糕的结果?我的数据集是否格式错误? 谢谢

  • 启动Mysql控制台, 建立数据库 create database nutzbook default character set utf8; 运行后的截图

  • 这一章,主要是为了把权限模型给准备好 User 用户表 Role 角色表 Permission 权限表 User -- Role 多对多 User -- Permission 多对多 Role -- Permission 多对多

  • PS:我使用的是Apache Spark 1.6.3

  • Deeplearning4j(简称DL4J)是为Java和Scala编写的首个商业级开源分布式深度学习库。DL4J与Hadoop和Spark集成,为商业环境(而非研究工具目的)所设计。Skymind是DL4J的商业支持机构。 Deeplearning4j技术先进,以即插即用为目标,通过更多预设的使用,避免太多配置,让非研究人员也能够进行快速的原型制作。DL4J同时可以规模化定制。DL4J遵循Apa

  • 本书大部分篇幅会用来关注MongoDB的核心功能。所以我们基本上使用的是MongoDB的外壳(shell)。shell在学习MongoDB还有管理数据库的时候很有用,不过您的实际代码还是会用相应的语言来驱动mongoDB的。 这也引出了关于MongoDB您首先需要了解的东西:它的驱动。MongoDB有许多针对不同语言的官方驱动。可以认为这些驱动和您所熟知的各种数据库驱动是一样的。基于这些驱动,Mo