当前位置: 首页 > 面试题库 >

sklearn:如何获取多项式特征的系数

袁华清
2023-03-14
问题内容

我知道可以通过使用:获得多项式特征作为数字polynomial_features.transform(X)。根据手册,在以下两个方面,这些功能是:[1, a, b, a^2, ab, b^2]。但是,如何获得高阶功能的描述?.get_params()不显示任何功能列表。


问题答案:

顺便说一下,现在有更合适的功能: PolynomialFeatures.get_feature_names。

from sklearn.preprocessing import PolynomialFeatures
import pandas as pd
import numpy as np

data = pd.DataFrame.from_dict({
    'x': np.random.randint(low=1, high=10, size=5),
    'y': np.random.randint(low=-1, high=1, size=5),
})

p = PolynomialFeatures(degree=2).fit(data)
print p.get_feature_names(data.columns)

输出结果如下:

['1', 'x', 'y', 'x^2', 'x y', 'y^2']

注意由于某种原因,您必须先适合PolynomialFeatures对象,然后才能使用get_feature_names()。

如果您是熊猫恋人(就像我一样),则可以使用以下所有新功能轻松组成DataFrame:

features = DataFrame(p.transform(data), columns=p.get_feature_names(data.columns))
print features

结果将如下所示:

     1    x    y   x^2  x y  y^2
0  1.0  8.0 -1.0  64.0 -8.0  1.0
1  1.0  9.0 -1.0  81.0 -9.0  1.0
2  1.0  1.0  0.0  1.0   0.0  0.0
3  1.0  6.0  0.0  36.0  0.0  0.0
4  1.0  5.0 -1.0  25.0 -5.0  1.0


 类似资料:
  • 问题内容: 我用作以下功能选择器。 我还执行以下操作,以调整以下超参数。 但是,我不清楚如何将特征选择()与合并。 编辑: 当我运行@Gambit建议的答案时,出现以下错误: 我可以通过在参数列表中使用来解决上述问题。 我现在的问题是 如何使用所选的特征和参数来验证模型是否可以很好地处理看不见的数据。如何获得并使用进行训练? 如果需要,我很乐意提供更多详细信息。 问题答案: 基本上,您希望在选择特

  • 我有一个设计问题,当使用类似的东西时: 我认为应该有一些更好的方法来实现这种参数化的特性。 我在std中没有找到好的示例(例如,在具有类似的关联类型的traits中没有实现)?

  • 问题内容: 我正在处理高度不平衡的数据集,我的想法是从我的 libSVM 模型中获取特征权重的值。到目前为止,我对线性内核还可以,我可以在其中获得特征权重,但是当我使用或时,我无法达到目标。 在这里,我正在使用我的模型,并且可以使用轻松获得线性核的特征权重。谁能帮助我可以做同样的事情还是?到目前为止,我已尝试执行以下操作: 问题答案: 正如文档中所述,这不仅是不可能的: 权重分配给特征(原始问题的

  • 我当前的Cucumber文件如下所示: 所以现在我想再添加几个场景,可能是在同一个文件中进行API测试。所以我想为此创建一个新特性,而不是使用Feature:Test Online application页面。这样我就不需要为API测试创建单独的特性文件。

  • 1 介绍   词频-逆文档频率法(Term frequency-inverse document frequency,TF-IDF)是在文本挖掘中广泛使用的特征向量化方法。 它反映语料中词对文档的重要程度。假设用t表示词,d表示文档,D表示语料。词频TF(t,d)表示词t在文档d中出现的次数。文档频率DF(t,D)表示语料中出现词t的文档的个数。 如果我们仅仅用词频去衡量重要程度,这很容易过分强调

  • 我对Java和OOP都是新手。但是,我使用notify读取一个特征,然后使用read读取回调中的多个特征。 我想知道,为什么在使用readCharacteristic(我的特征)时,只能从单个特征(除了通知的特征)中获取值。蓝牙gatt回调声明如下: 公共布尔值 (BluetoothGattCharacteristic characteristic characteristic)从相关远程设备读取