将值范围转换为标准值范围的过程称为标准化。这些值可以在-1到+1或0到1之间。数据也可以借助减法和除法进行归一化。
作为输入馈入学习算法的数据应保持一致和结构化。输入数据的所有特征都应在单个范围内,以有效地预测值。但是在现实世界中,数据是非结构化的,而且在大多数情况下,数据的规模是不同的。
这是规范化的时候。这是最重要的数据准备过程之一。
它有助于将输入数据集的列的值更改为相同的范围。
在规范化过程中,确保值的范围不失真。
注意-并非所有输入到机器学习算法的输入数据集都必须进行标准化。仅当数据集中的要素具有完全不同的值范围时才需要规范化。
有不同种类的规范化-
最小-最大归一化
Z归一化
单位向量归一化
让我们了解L1归一化的工作原理。
也称为最小绝对偏差,它会更改数据,使绝对值的总和在每一行中保持为1。
让我们看看如何使用scikit learning在Python中实现L1规范化-
import numpy as np
from sklearn import preprocessing
input_data = np.array(
[[34.78, 31.9, -65.5],[-16.5, 2.45, -83.5],[0.5, -87.98, 45.62],[5.9, 2.38, -55.82]]
)
data_normalized_l1 = preprocessing.normalize(input_data, norm='l1')
print("\nL1 normalized data is \n", data_normalized_l1)
输出结果
L1 normalized data is
[[ 0.26312604 0.24133757 -0.49553639]
[-0.16105417 0.0239141 -0.81503172]
[ 0.00372856 -0.65607755 0.34019389]
[ 0.09204368 0.03712949 -0.87082683]]
所需的软件包已导入。
输入数据是使用Numpy库生成的。
类“预处理”中存在的“规格化”功能用于规格化数据。
规范化的类型指定为“ l1”。
这样,数组中的任何数据都将被标准化,并且每一行的总和将仅为1。
此规范化数据显示在控制台上。
本文向大家介绍解释如何使用python中的scikit-learn库实现L2规范化?,包括了解释如何使用python中的scikit-learn库实现L2规范化?的使用技巧和注意事项,需要的朋友参考一下 将值范围转换为标准值范围的过程称为标准化。这些值可以在-1到+1或0到1之间。数据也可以借助减法和除法进行归一化。 让我们了解L2归一化的工作原理。它也被称为“最小正方形”。此归一化修改数据的方式
本文向大家介绍解释Python中scikit-learn库的基础?,包括了解释Python中scikit-learn库的基础?的使用技巧和注意事项,需要的朋友参考一下 Scikit-learn,通常称为sklearn,是Python中的一个库,用于实现机器学习算法。 这是一个开源库,因此可以免费使用。强大而强大,因为它提供了多种工具来执行统计建模。在Python强大而稳定的界面的帮助下,这包括分类
本文向大家介绍如何使用Python中的scikit-learn库缩放数据?,包括了如何使用Python中的scikit-learn库缩放数据?的使用技巧和注意事项,需要的朋友参考一下 特征缩放是构建机器学习算法的数据预处理阶段的重要步骤。它有助于规范化数据以使其落在特定范围内。 有时,它还有助于提高机器执行计算的速度。 为什么需要它? 作为输入馈入学习算法的数据应保持一致和结构化。输入数据的所有特
本文向大家介绍scikit-learn库如何用于在Python中加载数据?,包括了scikit-learn库如何用于在Python中加载数据?的使用技巧和注意事项,需要的朋友参考一下 Scikit-learn,通常称为sklearn,是Python中的一个开源库,用于实现机器学习算法。 在Python强大而稳定的界面的帮助下,这包括分类,回归,聚类,降维等等。该库基于Numpy,SciPy和Mat
本文向大家介绍解释如何使用scikit-learn库拆分数据集,以便在Python中进行训练和测试?,包括了解释如何使用scikit-learn库拆分数据集,以便在Python中进行训练和测试?的使用技巧和注意事项,需要的朋友参考一下 Scikit-learn,通常称为sklearn,是Python中的一个库,用于实现机器学习算法。它功能强大且强大,因为它提供了多种工具来执行统计建模。 在Pyth
本文向大家介绍如何在Python中使用scikit-learn库从特征向量中消除均值?,包括了如何在Python中使用scikit-learn库从特征向量中消除均值?的使用技巧和注意事项,需要的朋友参考一下 预处理数据是指清除数据,删除无效数据,噪声,用相关值替换数据等。 数据预处理基本上是指将所有数据(从各种资源或单个资源收集的数据)收集为通用格式或统一数据集(取决于数据类型)的任务。一步的输出