当前位置: 首页 > 面试题库 >

Logistic回归中正则化强度的倒数是什么?它应如何影响我的代码?

赏光霁
2023-03-14
问题内容

我使用sklearn.linear_model.LogisticRegressionscikit learn运行逻辑回归。

C : float, optional (default=1.0) Inverse of regularization strength;
    must be a positive float. Like in support vector machines, smaller
    values specify stronger regularization.

C简单来说,这是什么意思?什么是正则化强度?


问题答案:

正则化对增加参数值的幅度施加惩罚,以减少过度拟合。当训练模型(例如逻辑回归模型)时,您正在选择最适合数据的参数。这意味着将给定数据的模型对因变量的预测与实际因变量之间的误差最小化。

当您有很多参数(很多独立变量)但数据太多时,就会出现问题。在这种情况下,模型通常会根据您数据中的特质来调整参数值-
这意味着它几乎可以完美地适合您的数据。但是,由于这些特质不会出现在您看到的未来数据中,因此您的模型预测不佳。

为了解决这个问题,并尽可能减少错误,如上所述,您可以添加到最小化的内容中,还可以最小化惩罚较大参数值的函数。最常见的功能是λΣθ Ĵ
2,这是一些恒定λ倍平方参数值θ的总和Ĵ 2。λ越大,仅为了适应数据中的小扰动而调整参数的幅度的可能性就越小。但是,在您的情况下,您没有指定λ,而是指定C
= 1 /λ。



 类似资料:
  • Logistic回归是一种回归模型,其中响应变量(因变量)具有分类值,例如True/False或0/1。 它实际上基于将其与预测变量相关联的数学方程来测量二元响应的概率作为响应变量的值。 逻辑回归的一般数学方程是 - y = 1/(1+e^-(a+b1x1+b2x2+b3x3+...)) 以下是所用参数的说明 - y是响应变量。 x是预测变量。 a和b是数值常数的系数。 用于创建回归模型的函数是

  • 逻辑回归是一个分类算法,它可以处理二元分类以及多元分类。虽然它名字里面有“回归”两个字,却不是一个回归算法。那为什么有“回归”这个误导性的词呢?个人认为,虽然逻辑回归是分类模型,但是它的原理里面却残留着回归模型的影子,本文对逻辑回归原理做一个总结。 1. 从线性回归到逻辑回归 我们知道,线性回归的模型是求出输出特征向量Y和输入样本矩阵X之间的线性关系系数θ,满足Y=Xθ。此时我们的Y是连续的,所以

  • Logistic 回归 概述 Logistic 回归 或者叫逻辑回归 虽然名字有回归,但是它是用来做分类的。其主要思想是: 根据现有数据对分类边界线(Decision Boundary)建立回归公式,以此进行分类。 须知概念 Sigmoid 函数 回归 概念 假设现在有一些数据点,我们用一条直线对这些点进行拟合(这条直线称为最佳拟合直线),这个拟合的过程就叫做回归。进而可以得到对这些点的拟合直线方

  • 主要内容:什么是范数?,回归类算法,实现Logistic回归在 Scikit-Learn 机器学习库中,有关线性模型的算法族都在 模块下,不同的算法又会分化为很多类,但它们都是经过几种基本算法调整和组合而成,因此基本上都是 大同小异,换汤不换药,下面介绍经常用到回归类算法,其中就包含了 Logistic 回归算法。在这之前我们需要先熟悉几个概念,比如“正则化”。 什么是范数? 范数又称为“正则项”,它是机器学习中会经常遇到的术语,它表示了一种运算方式,“范

  • 本实例展示了回归模型系数间的共线性。 岭回归 是本例中使用的预测模型。每种颜色都分别表示不同特征下的回归系数向量,岭系数alpha是正则化项的参数。下图表示了岭系数作为变量参数,回归系数在岭回归模型中的变化。 这个例子还显示了将岭回归应用于高病态矩阵的有效性。在高病态矩阵中,一些变量的微小变化会导致计算权重(回归系数)的巨大差异。在这种情况下,设置一个确定的正则化项(alpha)可以减少这种不良差

  • 主要内容:什么是分类问题?,Logistic回归算法我们知道有监督学习分为“回归问题”和“分类问题”,前面我们已经认识了什么是“回归问题”,从本节开始我们将讲解“分类问题”的相关算法。在介绍具体的算法前,我们先聊聊到底什么是分类问题。 什么是分类问题? 其实想要理解“分类”问题非常的简单,我们不妨拿最简单的“垃圾分类处理”的过程来认识一下这个词。现在考虑以下场景: 小明拎着两个垃圾袋出门倒垃圾,等走到垃圾回收站的时候,小明发现摆放着两个垃圾桶,上面