相关性是指涉及两个数据集之间的依赖性的一些统计关系。 依赖现象的简单例子包括父母与其后代的外貌之间的相关性,以及产品价格与其供应数量之间的相关性。
我们以seaborn python库中提供的虹膜数据集为例。 在其中我们试图建立三种鸢尾花的萼片和花瓣的长度和宽度之间的相关性。 根据发现的相关性,可以创建一个强大的模型,可以轻松区分一个物种与另一个物种。
import matplotlib.pyplot as plt
import seaborn as sns
df = sns.load_dataset('iris')
#without regression
sns.pairplot(df, kind="scatter")
plt.show()
其output如下 -