当前位置：首页 > 软件库 > Web应用开发 > 常用JavaScript包 >

dataframe-js

生成不可变数据结构的 JavaScript 库

授权协议 MIT

开发语言 JavaScript

所属分类 Web应用开发、常用JavaScript包

软件类型开源软件

地区不详

投递者施鸿

操作系统跨平台

开源组织无

适用人群未知

软件官网

软件文档

官方下载

软件概览

DataFrame-js 为 JavaScript 和数据科学提供了一个不可变的数据结构，即 DataFrame，它允许使用 SQL 和函数编程灵感来处理行和列。

使用 DataFrame，您可以轻松完成大量复杂的操作，例如加入，分组，探索任务，机器学习......
它主要设计用于服务器端（带节点），但它也可以在浏览器中工作（没有与文件系统相关的功能）。

例子：

import DataFrame from "dataframe-js";
import { data, columns } from "./titanic_data.js";
const df = new DataFrame(data, columns);
const filteredDf = df
    .filter(row => row.get("survived") === "yes")
    .select("class", "age", "sex");
filteredDf.show(3);

| class       | age        | sex        |
----------------------------------------
| 1st class   | adults     | man        |
| 1st class   | adults     | man        |
| 1st class   | adults     | woman      |

使用案例

DataFrame 是什么？

前言本文隶属于专栏《1000个问题搞定大数据技术体系》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！本专栏目录结构和参考文献请见1000个问题搞定大数据技术体系正文 DataFrame 的定义与 RDD 类似，即都是 Spark 平台用以分布式并行计算的不可变分布式数据集合。与 RDD 最大的不同在于， RDD 仅仅是一条条数据的集合，并不了解每一条数据的内容
DataFrame获取数据

DataFrame获取数据 1、获取行数和列数 shape 除了索引和列名，查看数组中有几行几列 2、获取行索引 index.tolist( ) 3、获取数据类型 dtypes 4、获取内容 values values属性也会以二维ndarray的形式返回DataFrame的数据 5、显示头几行，默认显示5行 head 6、显示后几行 tail 7、获取DataFrame的列获取某一列，直接写列
Pandas DataFrame

#### DataFrame * 三个基本属性：values，columns,index Pandas DataFrame.values属性返回对应的二维数组的numpy数值， Pandas DataFrame.columns属性返回给定Dataframe的列标签。return Index([], dtype='object') Pandas DataFrame.index
pyspark dataframe & pandas dataframe

pyspark创建的dataframe和普通pandas dataframe有很多容易使用上容易混淆的地方，特来梳理记录下。一、pandas dataframe特有的用法 data1.show(行数) 展示表结构和数据二、pyspark dataframe特有的用法 1、新增一列分配唯一切递增的id df.withColumn('new_id',fn.monotonically_increas
pandas dataframe转spark dataframe报错

本文并没有解决掉bug～样例代码： spark_df=spark.createdataframe(pandas_df) 注：pandas_df是一个pandas dataframe变量报错信息： session.py line 584 createDataFrame session.py line 420 in _createFromLocal context.py line 474 in p
dataFrame操作

spark dataframe派生于RDD类，但是提供了非常强大的数据操作功能。当然主要对类SQL的支持。在实际工作中会遇到这样的情况，主要是会进行两个数据集的筛选、合并，重新入库。首先加载数据集，然后在提取数据集的前几行过程中，才找到limit的函数。而合并就用到union函数，重新入库，就是registerTemple注册成表，再进行写入到HIVE中。不得不赞叹dataframe的强大
【DataFrame】DataFrame操作

创建一个DataFrame，它有几种创建方式：列表，序列(pandas.Series), numpy.ndarray的字典二维numpy.ndarray 别的DataFrame 结构化的记录(structured arrays) 其中，我最喜欢的是通过二维ndarray创建DataFrame，因为代码敲得最少： 1 2 3 4 5 6 7 8 import pandas as pd impo
json转dataframe格式

方法1：利用pandas自带的read_json直接解析字符串方法2：利用json的loads和pandas的json_normalize进行解析方法3：利用json的loads和pandas的DataFrame直接构造(这个过程需要手动修改loads得到的字典格式) path = '...' file = open(path,'r') all_json_data = [] for line
pandas.DataFrame.any与pandas.DataFrame.all

一个总的原则就是“any”意味着一行或者一列有一个为真（这里一般指不为0）则返回真，一行或者一列全部为假（一般指0）才为假，”all“意味着一行或者一列所有为真才为真（均不等于0），一行或者一列有一个为假则为假。 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ pandas.DataFrame.any： DataFrame.all(axis=Non
DataFrame(3)：DataFrame列的操作

padas对列的操作是数据分析常用的操作，本文做些相关介绍 1、loc和iloc loc适用于索引中的标签。iloc在索引中的位置上起作用。 1.1 loc基于行标签和列标签进行索引 loc先行后列，中间用逗号（,）隔开 df.loc['a','A'] #取a和A对应的数据 df.loc['a':'b',:] #取前两行对应数据 df.loc[:,'A':'B'] #取前两列对应数据 df.loc
python dataframe

dataframe为pandas中的数据格式，通常用来存储时间序列数据，比如K线数据，这在量化分析时通常用到。 1、创建dataframe import pandas as pd df0 = pd.DataFrame([[1,2,3,4],[5,6,7,8]], columns=['a', 'b', 'c', 'd']) 2、读取csv文件为dataframe格式，或保存为csv文件 df0 =
dataFrame数据处理

如果想要应用自定义的函数，或者把其他库中的函数应用到 Pandas 对象中，有以下三种方法： 1) 操作整个 DataFrame 的函数：pipe() 2) 操作行或者列的函数：apply() 3) 操作单一元素的函数：applymap() 1 pipe import pandas as pd import numpy as np #自定义函数 def adder(ele1,ele2):
DataFrame 是什么

在 Spark 中，DataFrame 是一种以 RDD 为基础的分布式数据集，类似于传统数据库中的二维表格。DataFrame 与 RDD 的主要区别在于，前者带有 schema 元信息，即 DataFrame所表示的二维表数据集的每一列都带有名称和类型。这使得 Spark SQL 得以洞察更多的结构信息，从而对藏于 DataFrame 背后的数据源以及作用于 DataFrame
python处理DataFrame数据

1.数据的读取 import csv with open('地址','r',encoding='utf-8') as file: reader = csv.read(file) 2.按“属性”读取相应的列 usecols=[’ '] import pandas as pd name= pd.read_csv(r'地址',sep='\t',usecols=['属性'] print(name)
DataFrame(9)：DataFrame对文件操作

1、读取文件 1.1 读取csv文件 pd.read_csv(“路径”) data = pd.read_csv('data.csv',encoding='gbk',header=None) 1.2 读取txt文件 pd.read_table(“路径”) 1.3 读取excel文件 pd.read_excel(“路径”) 1.4读取json文件 pd.read_json(“路径”)
DataFrame(1)：DataFrame的基本属性和方法

本文简单介绍下DataFrame的基本属性和方法一、DataFrame的基本属性 (1)dataframe.shape #元组，返回dataframe形状如（1000,10）即1000行10列 (2)dataframe.head(3) #新DataFrame，获取前三行，默认获取前五行 (3)dataframe.tail(3) #新DataFrame，获取后三行，默认获取后五行 (4)

dataframe-js

同类工具

相关阅读

相关文章

相关问答

相关文档