我正在尝试按照示例使用Seaborn使分组箱图工作
我可以使上面的示例工作,但是行:
tips = sns.load_dataset("tips")
完全没有解释。我已经找到了tips.csv文件,但是似乎找不到关于load_dataset具体作用的足够文档。我试图创建自己的csv并加载它,但无济于事。我还重命名了提示文件,它仍然可以工作…
因此,我的问题是:
load_dataset
实际在哪里寻找文件?我可以实际将其用于自己的箱形图吗?
编辑:我设法使自己的箱形图使用我自己的DataFrame
,但是我仍然想知道是否load_dataset
除了神秘的教程示例外,它还用于其他任何用途。
load_dataset
在https://github.com/mwaskom/seaborn-
data
上查找在线csv文件。这是文档字符串:
从在线存储库加载数据集(需要Internet)。
参量
name:str数据集的名称(https://github.com/mwaskom/seaborn-
data上的name
.csv
)。您可以使用:func获取可用数据集的列表:get_dataset_names
kws:dict,可选传递给pandas.read_csv
如果要修改该在线数据集或引入自己的数据,则可能必须使用pandas。load_dataset
实际上会返回一个pandasDataFrame
对象,您可以通过进行确认type(tips)
。
如果您已经在名为tips2.csv的csv文件中创建了自己的数据,并将其保存在脚本的相同位置,请使用此文件(在安装了熊猫之后)将其加载到:
import pandas as pd
tips2 = pd.read_csv('tips2.csv')