当前位置: 首页 > 工具软件 > IRIS > 使用案例 >

Logistic Regression iris

南宫正阳
2023-12-01

根据鸢尾花数据集样本,建立模型,以花萼长度、花萼宽度、花瓣长度、花瓣宽度这4个特征值来推断目标值,属于山鸢尾、虹膜锦葵、变色鸢尾的哪一种

数据集介绍

Iris数据集是常用的分类实验数据集,由Fisher,1936年收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。

关于数据集的具体介绍:

特征值:花萼长度、花萼宽度、花瓣长度、花瓣宽度

目标值: 山鸢尾、虹膜锦葵、变色鸢尾

代码:

>>> from sklearn.datasets import load_iris

>>> from sklearn.linear_model import LogisticRegression

>>> X, y = load_iris(return_X_y=True)

>>> clf = LogisticRegression(random_state=0).fit(X, y)

>>> clf.predict(X[:2, :])

array([0, 0])

>>> clf.predict_proba(X[:2, :])

array([[9.8...e-01, 1.8...e-02, 1.4...e-08],

       [9.7...e-01, 2.8...e-02, ...e-08]])

>>> clf.score(X, y)

0.97...

数据分割

机器学习一般的数据集会划分成两个部分:

训练数据:用于训练,构建模型

测试数据:在模型检验时使用,用于评估模型是否有效

划分比例一般为:

训练集:70%~80%

测试集:20~30%

 类似资料:

相关阅读

相关文章

相关问答