当前位置: 首页 > 面试题库 >

是否有适用于Python的示例数据集?

慕阳文
2023-03-14
问题内容

为了进行快速测试,调试,创建可移植的示例和进行基准测试,R提供了许多数据集(在Base
Rdatasets包中)。library(help="datasets")R提示符下的命令描述了近100个历史数据集,每个数据集都有相关的描述和元数据。

Python有这样的东西吗?


问题答案:

您可以使用rpy2package从Python访问所有R数据集。

设置界面:

>>> from rpy2.robjects import r, pandas2ri
>>> def data(name): 
...    return pandas2ri.ri2py(r[name])

然后data()使用可用数据集的任何数据集名称进行调用(就像中的一样R

>>> df = data('iris')
>>> df.describe()
       Sepal.Length  Sepal.Width  Petal.Length  Petal.Width
count    150.000000   150.000000    150.000000   150.000000
mean       5.843333     3.057333      3.758000     1.199333
std        0.828066     0.435866      1.765298     0.762238
min        4.300000     2.000000      1.000000     0.100000
25%        5.100000     2.800000      1.600000     0.300000
50%        5.800000     3.000000      4.350000     1.300000
75%        6.400000     3.300000      5.100000     1.800000
max        7.900000     4.400000      6.900000     2.500000

要查看可用数据集的列表以及每个数据集的描述,请执行以下操作:

>>> print(r.data())

注意:rpy2需要R使用设置R_HOME变量pandas进行安装,并且也必须安装。

我刚刚创建了PyDataset,这是一个简单的模块,可以使从Python加载数据集的操作与一样简单R(并且不需要R安装,只需pandas)。

要开始使用它,请安装模块:

$ pip install pydataset

然后只需加载您想要的任何数据集(当前大约有757个数据集):

from pydataset import data

titanic = data('titanic')


 类似资料:
  • 问题内容: 我试图在我的Python编程中使用一些AOP,但是我对现有的各种库没有任何经验。 所以我的问题是: Python有哪些AOP支持?两者之间的差异库有什么优势? 编辑 我找到了一些,但我不知道它们的比较: Aspyct 适用于Python的轻量级AOP 编辑2 我将在哪种情况下使用这些? 我有两个用Python编写的应用程序,它们通常具有计算税金和其他金钱事物的方法。我希望能够编写功能的

  • 问题内容: 我需要一些正在创建的MySQL实用程序的测试数据。有谁知道我在哪里可以找到与SQL Server的Northwind具有相似(如果不是更多)数据量的数据? 问题答案: 更新: 这是大约4年前的答案,并且由于时间原因链接已失效,一旦找到链接,我会立即放置新链接。 1- FlightStats 2- NW模式的MySql版本(InnoDB) 3- NW模式的MySql版本(MyISAM)

  • 问题内容: 是否有Java 的软件包管理器,如Python的easy_install? 我正在寻找可从命令行而不是从IDE使用的解决方案。 问题答案: Maven确实基于可浏览,可搜索的远程 存储库* (如中央 存储库) 提供 依赖项管理 。 * Maven Ant Tasks (已淘汰) 使用Maven的存储库提供依赖项管理以及对Ant构建的更多支持。 Ant Ivy是Maven Ant Tas

  • 问题内容: 我通过PDO访问我的MySQL数据库。我正在设置对数据库的访问,而我的第一次尝试是使用以下内容: 我想到的第一件事是: 这被认为是不好的做法。稍作搜索后,我得到了Singleton模式,该模式 “适用于需要一个类的单个实例的情况。” 根据手册中的示例,我们应该这样做: 为什么我需要这个相对较大的课程? 最后一个效果很好,我不必担心了。 如何创建较小的单例类,或者在PHP中缺少单例的用例

  • 我正在尝试运行以下代码: UpdateUserLimitions(用户ID,{“messages.totalMessages”:admin.firestore.FieldValue.increment(1)}); 但是... 而不是在我的数据库中获取此文档数据: 我得到: 我需要带有合并选项的集合,因为如果文档不存在,我正在更新和创建。。。。 有什么想法吗?我做错什么了吗?

  • 问题内容: 依赖性分析程序通过控制代码中模块之间的依赖性来帮助我们组织代码。当一个模块是另一个模块的循环依赖项时,可以找到一种方法将其转变为单向依赖项或将两个模块合并为一个模块。 什么是针对Python代码的最佳依赖关系分析工具? 问题答案: 我建议使用snakefood创建Python项目的图形依赖图。它可以很好地检测到依存关系,以立即查看要重构的区域。如果您阅读一些文档,它的用法非常简单。 当