问题：

为deeplearning4j准备数据

公西志文

2023-03-14

我想预测具有以下形式的数据分类：

分类器；文本描述

null

    RecordReader recordReader = new CSVRecordReader(1, ';');
    recordReader.initialize(new FileSplit(new File(csvFilePath)));

    DataSetIterator iterator = new RecordReaderDataSetIterator(recordReader,batchSize,labelIndex,numClasses);
    return iterator.next();

共有1个答案

戚哲

2023-03-14

您通常使用我们的ETL库datavec。我不知道你在看哪里，但示例中有大量的csv、图像和文本中的预处理数据的示例。这取决于你在做什么。

对于CSV，您找到了正确的起点。它将从CSVS目录加载。在我们的例子中，我引用了其中的一个例子：

 int numLinesToSkip = 0;
 char delimiter = ',';
  String localDataPath = DownloaderUtility.IRISDATA.Download();
RecordReader recordReader = new CSVRecordReader(numLinesToSkip,delimiter);
recordReader.initialize(new FileSplit(new File(localDataPath,"iris.txt")));
int labelIndex = 4;
int numClasses = 3;
DataSetIterator iteratorA = new RecordReaderDataSetIterator(recordReaderA,10,labelIndex,numClasses);

这将设置一个记录读取器来解析数据，您将其初始化为将该读取器指向特定的文件或目录（可以是任何数据）

继续我所拥有的，可能是因为你在用文字或一些不是数字的东西折腾。所有的机器学习都涉及到将一切（无关紧要）转换为数字。我不想在一个帖子里做一个完整的ML课程，但如果你能更具体一点，我可以给你一些提示，告诉你你需要为你的特殊情况做什么。

类似资料：

如何为Keras准备数据集？

通过Keras神经网络运行一组标记向量。查看Keras数据集示例mnist：它似乎是一个三维Numpy数组：第一个维度用于样本每个示例功能的第二个和第三个构建标记向量：为什么对于如此简单的数据集，我会得到如此糟糕的结果？我的数据集是否格式错误？谢谢
数据库准备

启动Mysql控制台, 建立数据库 create database nutzbook default character set utf8; 运行后的截图
为Shiro做准备

这一章,主要是为了把权限模型给准备好 User 用户表 Role 角色表 Permission 权限表 User -- Role 多对多 User -- Permission 多对多 Role -- Permission 多对多
用PySpark1.6为LDA训练准备数据

PS：我使用的是Apache Spark 1.6.3
Deeplearning4j

Deeplearning4j（简称DL4J）是为Java和Scala编写的首个商业级开源分布式深度学习库。DL4J与Hadoop和Spark集成，为商业环境（而非研究工具目的）所设计。Skymind是DL4J的商业支持机构。 Deeplearning4j技术先进，以即插即用为目标，通过更多预设的使用，避免太多配置，让非研究人员也能够进行快速的原型制作。DL4J同时可以规模化定制。DL4J遵循Apa
准备

本书大部分篇幅会用来关注MongoDB的核心功能。所以我们基本上使用的是MongoDB的外壳（shell）。shell在学习MongoDB还有管理数据库的时候很有用，不过您的实际代码还是会用相应的语言来驱动mongoDB的。这也引出了关于MongoDB您首先需要了解的东西：它的驱动。MongoDB有许多针对不同语言的官方驱动。可以认为这些驱动和您所熟知的各种数据库驱动是一样的。基于这些驱动，Mo

为deeplearning4j准备数据

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档