Seaborn load_dataset

花健

2023-03-14

问题内容：

我正在尝试按照示例使用Seaborn使分组箱图工作

我可以使上面的示例工作，但是行：

tips = sns.load_dataset("tips")

完全没有解释。我已经找到了tips.csv文件，但是似乎找不到关于load_dataset具体作用的足够文档。我试图创建自己的csv并加载它，但无济于事。我还重命名了提示文件，它仍然可以工作…

因此，我的问题是：

load_dataset实际在哪里寻找文件？我可以实际将其用于自己的箱形图吗？

编辑：我设法使自己的箱形图使用我自己的DataFrame，但是我仍然想知道是否load_dataset除了神秘的教程示例外，它还用于其他任何用途。

问题答案：

load_dataset在https://github.com/mwaskom/seaborn-
data
上查找在线csv文件。这是文档字符串：

从在线存储库加载数据集（需要Internet）。

参量

name：str数据集的名称（https://github.com/mwaskom/seaborn-
data上的
name.csv
）。您可以使用：func获取可用数据集的列表：get_dataset_names

kws：dict，可选传递给pandas.read_csv

如果要修改该在线数据集或引入自己的数据，则可能必须使用pandas。load_dataset实际上会返回一个pandasDataFrame对象，您可以通过进行确认type(tips)。

如果您已经在名为tips2.csv的csv文件中创建了自己的数据，并将其保存在脚本的相同位置，请使用此文件（在安装了熊猫之后）将其加载到：

import pandas as pd

tips2 = pd.read_csv('tips2.csv')

Seaborn load_dataset

相关阅读

相关文章

相关问答