sklearn.datasets模块主要提供了一些导入、在线下载及本地生成数据集的方法,可以通过dir或help命令查看,我们会发现主要有三种形式:
load_<dataset_name>
fetch_<dataset_name>
make_<dataset_name>
1.datasets.load_<dataset_name>:sklearn包自带的小数据集:
1.1数据集文件目录:
在sklearn安装目录下datasets\data文件下
In [2]: datasets.load_*?
datasets.load_boston#波士顿房价数据集
datasets.load_breast_cancer#乳腺癌数据集
datasets.load_diabetes#糖尿病数据集
datasets.load_digits#手写体数字数据集
datasets.load_files
datasets.load_iris#鸢尾花数据集
datasets.load_lfw_pairs
datasets.load_lfw_people
datasets.load_linnerud#体能训练数据集
datasets.load_mlcomp
datasets.load_sample_image
datasets.load_sample_images
datasets.load_svmlight_file
datasets.load_svmlight_files
(2)datasets.fetch_<dataset_name>&