这是一个维护良好的和开发中的工具,包,库等的策展列表,内容与使用Go语言做数据科学相关。
GopherDS,这个项目主要是与基于Go的数据科学的工具和学习相关。resources里面存放了收集的基于Go做数据科学项目的相关资源。
运算(Arithmetic):
math - Stdlib 数学函数。
math/cmplx - cmplx 安装包为负数提供基本常数和运算功能。
github.com/gonum/floats - 一套处理 float64 切片的辅佐程序。
github.com/gonum/optimize - Go 语言的优化包。
分类(Classification):
github.com/jbrukh/bayesian - Naive Bayes 分类。
github.com/datastream/libsvm - 基于 LIBSVM 3.14 派生出来的 libsvm golang。
集群(Clustering):
github.com/salkj/kmeans - Go 的现用 Kmeans 算法包。
计算机系统验证(CSV):
encoding/csv - Stdlib CS 功能。
github.com/go-hep/csvutil - 一组用便捷方式处理 CSV 数据文件的 s 和 funcs。
github.com/go-hep/csvutil/tree/master/csvdriver - databases/sql 的 CSV 文库。
分布式数据分析/传递方式(Distributed Data Analysis/Pipelining):
github.com/pachyderm/pachyderm - 集装箱式数据分析 http://pachyderm.io 。
github.com/chrislusf/glow - Glow 是 Go 的易于使用的分布式计算系统,与 Hadoop Map Reduce, Spark, Flink, Storm 等相似。
github.com/chrislusf/gleam - 另一个基于 Go 的分布式执行系统。
github.com/flowbase/flowbase - 基于 Flow 的 Go(Golang)编程微框架。http://flowbase.org
github.com/scipipe/scipipe - Go (Golang) 的工作流系统,受 Flow-based Programming 启示。http://scipipe.org
通用数据整理(General data munging):
github.com/kniren/gota - 数据帧。
github.com/gopherds/gophernotes - Jupyter 笔记本的 Go 内核。
通用目的性机器学习(General purpose machine learning):
github.com/sjwhitworth/golearn - GoLearn 是 Go 的“电池包含”的机械学习文库。
github.com/cdipaolo/goml - goml
是完全用 Golang 写的机器学习文库,它可以让开发人员将机器学习安装到他们的应用中。
github.com/xlvector/hector - Golang 的机器学习文库。目前,它可以用来解决二元分类问题。
图表(Graphs):
github.com/gyuho/goraph - 图表包能实现图形数据结构和算法。
github.com/gonum/graph - 这是 Go 语言的广义图形包。
github.com/cayleygraph/cayley - Cayley 是一个开源图表,受 Freebase 和 Google's Knowledge Graph 后的图形数据库启发。
JavaScript对象符号(JSON):
encoding/json - Stdlib json 功能。
github.com/tidwall/gjson - 一个 Go 开发包,提供了非常快速和简单的方式来获得一个JSON文档的值。
github.com/pquerna/ffjson - ffjson 为 Go 结构产生 MarshalJSON 和 UnmarshalJSON 功能。
矩阵/线性代数(Matrices/Linear Algebra):
github.com/gonum/lapack - 安装包收集器,为 Go 语言提供 LAPACK 功能。
github.com/gonum/blas - 安装包收集器,为 Go 语言提供 BLAS 功能。
github.com/gonum/matrix - Go 语言的矩阵包。
神经网络(Neural Networks):
github.com/tleyden/neurgo - Go 的神经网络。
github.com/fxsjy/gonn - GoNN 是 Go 的执行器,包括 BPNN, RBF, PCN。
github.com/NOX73/go-neural - golang 的神经网络执行。
自然语言处理(NLP):
github.com/advancedlogic/go-freeling - Freeling 3.1 的局部端口。(http://nlp.lsi.upc.edu/freeling/)
github.com/endeveit/enca - libenca 的最小 cgo 绑定。
github.com/Lazin/go-ngram - Go 的N-gram index。
github.com/reiver/go-porterstemmer - Porter Stemming Algorithm 的 Go 清理指令。
github.com/blevesearch/segment - Unicode Text Segmentation 的Go 文库,Unicode Standard Annex #29 中有描述。
https://github.com/kljensen/snowball - Go 执行的 Snowball 词干 NLP。
github.com/sajari/word2vec - word2vec 是 Go 包,提供查询 word2vec 模式的功能。
Non-SQL 数据库交互(Non-SQL Database Interactions):
gopkg.in/mgo.v2 - mgo 是 Go 语言的 MongoDB 驱动器。
github.com/gocql/gocql - Go 编程语言最快最强大的 Cassandra 代理。
github.com/go-redis/redis - Golang 的 Redis 代理。
github.com/garyburd/redigo - Redis 的 Go 代理。
github.com/tsuna/gohbase - Pure Go HBase 代理。
绘图/仪表板(Plotting/dashboarding):
github.com/gonum/plot - 建立和绘制图的API。
github.com/gigablah/dashing-go - 实时仪表板的一个端口。
概率/统计/实验(Probability/statistics/experiments):
github.com/gonum/stat - Go 的 数据包。
github.com/montanaflynn/stats - 具常用功能的数据包,Golang 标准库缺失。
github.com/URXtech/planout-golang - Go 中的 Planout 译码。
github.com/peleteiro/bandit-server - Bandit-server 是一个 Multi-Armed Bandit api 服务器,它不需要配置也没有持久化存储。
回归(Regression):
github.com/sajari/regression - 多元线性回归。
github.com/glycerine/zettalm - 在 zettabytes 数据中建立线性回归模型的 Go 编码。
SQL-like 数据交互(SQL-like Database Interactions):
databases/sql - sql 包围绕 SQL(或 SQL-like)数据提供通用接口。
github.com/Boostport/avatica - Go database/sql
package 的 Apache Phoenix/Avatica 驱动。
github.com/lib/pq - Go 的 database/sql
安装包的纯 Go postgres 驱动。
github.com/go-pg/pg - Fast PostgreSQL 代理 and ORM。
github.com/jackc/pgx - 纯Go PostgreSQL 驱动,它提供性能提升和更多的功能,同时保持数据库database/sql
兼容。
github.com/go-sql-driver/mysql - Go's database/sql
安装包的 MySQL-Driver 。
github.com/mattn/go-sqlite3 - sqlite3 驱动,符合内置 database/sql
接口。
github.com/lukasmartinelli/pgclimb - 从 PostgreSQL 的数据导出成不同的数据格式 (JSON, JSON Lines, CSV, XLSX, XML) 或使用 Golang 模板。
github.com/lukasmartinelli/pgfutter - 将 CSV 和 JSON 导入 PostgreSQL 的简单方法。
github.com/omniscale/imposm3 - 将 OpenStreetMap 数据导入 PostgreSQL/PostGIS 数据库。
网页抓取(Web Scraping):
github.com/yhat/scrape - Go 网页抓取的简单高效接口。
github.com/cathalgarvey/sqrape - 带有 CSS and Go 反射的简单 Query Scraping 。
建议(Proposed):
介绍 Resources是处理项目中资源文件的插件.maven把我们项目中的资源分成两个部分:main resource和test resource. 插件目标 resources:resources 拷贝main resources到main output directory.它绑定了process-resource 生命周期阶段,当执行compiler:compile插件的时候就会执行该阶段.
maven-resources-plugin主要是将项目中的资源文件编译、打包;注意,资源文件不是源代码,一般是环境的配置文件,默认存在src/main/resources和src/test/resources中。 maven-resources-plugin的三个目标(goal): resources:resources:用来将目录中的资源文件src/main/resources拷贝到编译目录$
概述 try-with-resources自JDK7引入,在JDK9中进行了改进,使得用户可以更加方便、简洁的使用try-with-resources。 JDK7之前资源需要手动关闭 下面是一个常见的文件资源关闭的示例: BufferedWriter writer = null; try { writer = Files.newBufferedWriter(file, charse
在父工程里的pom.xml配置 <!-- maven编译构建时的一些配置 --> <build> <finalName>${project.artifactId}</finalName> <!-- 父工程定义的插件,子工程都能继承 --> <plugins> <!-- 资源文件拷贝的插件 --> <!-- 我们通过逆向工程生成的mapper.xml配置文件,如果存放在sr
1、概念 maven中默认只能读取resources文件夹下的资源,如果要读取其他路径下的资源文件,那么就需要用到maven-resources-plugin这一插件 2、配置 (1)在maven配置文件pom.xml中导入插件 <plugin> <groupId>org.apache.maven.plugins</groupId> <artifact
[ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources) on project helloworld: The plugin org.apache.maven.plugins:maven-resources-plugin:3.2
package的时候报错 增加了这些代码: 是因为maven 2.6的依赖改变了!需要添加这些依赖!让他重新下载,或者加载已经有的包!!!!! <plugin> <groupId>org.apache.maven.plugins</groupId> <artifactId>maven-resources-plugin</artifactId> <version>2.6
<build> <!-- maven-resources-plugin 插件会读取如下的resources配置,来完成文件的copy工作 --> <resources> <!-- 因为我们通过逆向工程生成的mapper.xml配置文件,是存放在Java文件目录下的,不是resources资源文件夹下, resources资源文件夹是classes类路径文件。 默认是把sr
Resources插件负责处理项目资源文件并拷贝到输出目录。Maven将main resources和test resources分开,一般main resources关联main source code,而test resources关联test source code。 Resources插件目标有三个: resources:resources,拷贝main resources到main ou
在Java编程过程中,如果打开了外部资源(文件、数据库连接、网络连接等),我们必须在这些外部资源使用完毕后,手动关闭它们。因为外部资源不由JVM管理,无法享用JVM的垃圾回收机制,如果我们不在编程时确保在正确的时机关闭外部资源,就会导致外部资源泄露,紧接着就会出现文件被异常占用,数据库连接过多导致连接池溢出等诸多很严重的问题。 在java1.7以前,我们关闭资源的方式如下: public clas
原文链接 http://javapapers.com/core-java/try-with-resources/ 概述 Java 7 gave us try-with-resources, a nice feature on exception handling. This tutorial is part 3 of the exception handling series. Part I is
昨天在打包部署中,发现控制台出现maven-resources-plugin:2.6:resources (default-resources),然后一直停在那里,经排查是在pom文件中配置的一个变量参数,在多个properties文件中引入,出现了问题,如何解决这个问题,就是把这个参数复制一个重命名,把其中一个引入的位置,改为新的变量赋值。
style样式资源处理器,在style资源中注入内容,导入css / sass / scss / less / stylus这些内容 主要作用 导入一些公共的样式文件,比如:variables / mixins / functions,避免在每个样式文件中手动的@import导入 module.exports = { // ... module: { rules:
错误信息如下 [INFO] ------------------------------------------------------------------------ [INFO] [INFO] --- maven-resources-plugin:3.2.0:resources (default-resources) @ 07-springboot-session --- [INFO]
一、新建一个全局样式 新建一个全局样式variable.less文件,放在src/assets/css/variable.less @charset"UTF-8"; @primary-color: #08b5a7; @primary-bg: #08b5a710; @orange-color: #ff9800; ...... 二、安装插件,全局引入 方式一 1、安装 style-resources
<plugin> <groupId>org.apache.maven.plugins</groupId> <artifactId>maven-resources-plugin</artifactId> <version>2.6</version> </plugin> pom.xml缺少了org.apache.maven.plugins配置
yarn add style-resources-loader vue.config.js 配置 pluginOptions: { 'style-resources-loader': { preProcessor: 'less', patterns: [path.resolve(__dirname, "./src/assets/css/var.less")]
问题内容: 我想知道Scala或其著名的数学库之一(例如Spire)是否具有与Go 函数相同的功能 (来自http://tour.golang.org/#4) 如果没有,那么获得相同功能的最“ Scala”方法是什么? 问题答案: 它是Java 库的一部分:
Statistical learning Machine learning is a technique with a growing importance, as the size of the datasets experimental sciences are facing is rapidly growing. Problems it tackles range from building
我已经创建了一个RESTAPI,我想我遇到了RESTful问题。 它与以下问题有关: 检索相关数据 我有一个叫做“案例”的资源。案例还包含相关数据,如用户和消息。问题是我想从案例中获取相关的查询用户和消息数据,但我不确定URI设计。也有不同类型的相关/计算数据。这些相关数据应用于创建数据可视化。 我如何获取案例/用户/消息是RESTful的: 我创建相关资源的第一个想法是(我认为URI看起来不对,
Smarty's homepage is located at http://smarty.php.net/. You can join the mailing list by sending an e-mail to smarty-general-subscribe@lists.php.net. An archive of the mailing list can be viewed at ht
数据科学最近成为计算机的热门领域。数据科学是利用计算机的运算能力对数据进行处理,从数据中提取信息,进而形成“知识”。它已经影响了计算机视觉、信号处理、自然语言识别等计算机分支。
数据科学最近成为计算机的热门领域。数据科学是利用计算机的运算能力对数据进行处理,从数据中提取信息,进而形成“知识”。它已经影响了计算机视觉、信号处理、自然语言识别等计算机分支。数据科学已经在IT、金融、医学、自动驾驶等领域得到广泛使用。(如果你熟知中情局的棱镜泄密事件,你会发现数据科学已经在情报领域广泛使用。) 在这系列文章中,我希望能完成从概率论,统计,到机器学习的整个数据分析的链条。传统意义上