问题：

为什么我的keras模型根本不训练？

单凯捷

2023-03-14

我的代码是：

from keras.models import Sequential
from keras.layers import Dense, Dropout, Masking
import numpy as np
import pandas as pd

dataset = pd.read_csv("data/train.csv", header=0)
dataset = dataset.fillna(0)

X = dataset.drop(columns=['YearRemodAdd', "Id", "SalePrice"], axis=1)
Y = dataset[['SalePrice']]

X = pd.get_dummies(X, columns=["MSSubClass", "MSZoning",
                               "Street", "Alley", "LotShape",
                               "LandContour", "Utilities", "LotConfig",
                               "LandSlope", "Neighborhood", "Condition1",
                               "Condition2", "BldgType", "HouseStyle",
                               "YearBuilt", "RoofStyle", "RoofMatl",
                               "Exterior1st", "Exterior2nd", "MasVnrType",
                               "ExterQual", "ExterCond", "Foundation",
                               "BsmtQual", "BsmtCond", "BsmtExposure",
                               "BsmtFinType1", "BsmtFinType2", "Heating",
                               "HeatingQC", "CentralAir", "Electrical",
                               "KitchenQual", "Functional", "FireplaceQu",
                               "GarageType", "GarageFinish", "GarageQual",
                               "GarageCond", "PavedDrive", "PoolQC",
                               "Fence", "MiscFeature", "MoSold",
                               "YrSold", "SaleType", "SaleCondition"])

Ymax = Y['SalePrice'].max()
Y = Y['SalePrice'].apply(lambda x: float(x) / Ymax)

input_units = X.shape[1]
print(X)
print(Y)

model = Sequential()
model.add(Dense(input_units, input_dim=input_units, activation='relu'))
model.add(Dense(input_units, activation='relu'))
model.add(Dense(input_units, activation='relu'))

model.add(Dense(1, activation='sigmoid'))

model.compile(loss='binary_crossentropy',
              optimizer='adam', metrics=['mse'])
model.fit(X, Y, epochs=250, batch_size=50,
          shuffle=True, validation_split=0.05, verbose=2)

scores = model.evaluate(X, Y)
print("\n%s: %.2f%%" % (model.metrics_names[1], scores[1]*100))

我的数据如下：

Id,MSSubClass,MSZoning,LotFrontage,LotArea,Street,Alley,LotShape,LandContour,Utilities,LotConfig,LandSlope,Neighborhood,Condition1,Condition2,BldgType,HouseStyle,OverallQual,OverallCond,YearBuilt,YearRemodAdd,RoofStyle,RoofMatl,Exterior1st,Exterior2nd,MasVnrType,MasVnrArea,ExterQual,ExterCond,Foundation,BsmtQual,BsmtCond,BsmtExposure,BsmtFinType1,BsmtFinSF1,BsmtFinType2,BsmtFinSF2,BsmtUnfSF,TotalBsmtSF,Heating,HeatingQC,CentralAir,Electrical,1stFlrSF,2ndFlrSF,LowQualFinSF,GrLivArea,BsmtFullBath,BsmtHalfBath,FullBath,HalfBath,BedroomAbvGr,KitchenAbvGr,KitchenQual,TotRmsAbvGrd,Functional,Fireplaces,FireplaceQu,GarageType,GarageYrBlt,GarageFinish,GarageCars,GarageArea,GarageQual,GarageCond,PavedDrive,WoodDeckSF,OpenPorchSF,EnclosedPorch,3SsnPorch,ScreenPorch,PoolArea,PoolQC,Fence,MiscFeature,MiscVal,MoSold,YrSold,SaleType,SaleCondition,SalePrice
1,60,RL,65,8450,Pave,NA,Reg,Lvl,AllPub,Inside,Gtl,CollgCr,Norm,Norm,1Fam,2Story,7,5,2003,2003,Gable,CompShg,VinylSd,VinylSd,BrkFace,196,Gd,TA,PConc,Gd,TA,No,GLQ,706,Unf,0,150,856,GasA,Ex,Y,SBrkr,856,854,0,1710,1,0,2,1,3,1,Gd,8,Typ,0,NA,Attchd,2003,RFn,2,548,TA,TA,Y,0,61,0,0,0,0,NA,NA,NA,0,2,2008,WD,Normal,208500
2,20,RL,80,9600,Pave,NA,Reg,Lvl,AllPub,FR2,Gtl,Veenker,Feedr,Norm,1Fam,1Story,6,8,1976,1976,Gable,CompShg,MetalSd,MetalSd,None,0,TA,TA,CBlock,Gd,TA,Gd,ALQ,978,Unf,0,284,1262,GasA,Ex,Y,SBrkr,1262,0,0,1262,0,1,2,0,3,1,TA,6,Typ,1,TA,Attchd,1976,RFn,2,460,TA,TA,Y,298,0,0,0,0,0,NA,NA,NA,0,5,2007,WD,Normal,181500

我的结果是：

Epoch 123/250
 - 0s - loss: 3.8653 - mean_squared_error: 0.0687 - val_loss: 3.8064 - val_mean_squared_error: 0.0639
Epoch 124/250

两个时代后它就卡在那里了。我能做些什么来防止它这么快卡住？

共有1个答案

陆敏学

2023-03-14

似乎您正在处理回归问题（即预测连续值）。至少有两件事你需要考虑：

使用准确度作为回归问题的度量没有意义，因为它仅对分类任务有效。相反，使用回归度量，如mse（即均方误差）或mae（即平均绝对误差）。

请在代码中应用上面的两点，然后报告培训的进展情况，我会根据需要更新这个答案。

类似资料：

为什么自我训练的NER模型与OpenNLP版本不兼容？

我训练OpenNLP NER模型来检测一个新实体，但当我使用这个模型时，我遇到了以下异常：我使用的是OpenNLP 1.6.0版，源代码如下：谁能帮我解决这个问题。。
为什么我的keras模型有这么多参数？

以上是目前我的CNN的架构。然而，它说它有1.8m可训练的参数。为什么会这样？我以为第一层给出了（32*4=128个参数），但是我如何找到模型的其余部分有多少个参数？我的理解是，CNN架构应该只依赖于过滤和最大池，因为它们是共享权重。为什么我有这么多参数？我应该如何着手减少这个数字？我不是问如何使用“汇总”找到参数的数量。我是问为什么我的模型有这么多参数，以及我如何减少这个数字。我不直观地理解
为什么keras模型不那么准确，不被认可？

我下载了mnist数据集（jpg），并用. hdf（. h5）创建了一个模型文件。图像是使用. h5模型识别的，但是识别率很低... 。实际编译时精度很低... 我做了吗有问题吗？。。图像使用了灰度的28x28图像... ... 历元98/100 1257/1257[==============================================================
keras训练模型时的TypeError和ValueError

/usr/local/lib/python3.6/dist-packages/keras/backend/tensorflow_backend.py:174:不推荐使用名称tf.get_default_session。请改用tf.compat.v1.get_default_session。 /usr/local/lib/python3.6/dist-packages/keras/backend/t
将Keras模型导出为TF估计器：找不到经过训练的模型

问题内容：尝试将Keras模型导出为TensorFlow Estimator以便服务模型时遇到以下问题。由于该问题的答案中也弹出相同的问题，因此，我将说明玩具示例中发生的情况，并提供用于文档目的的解决方法。Tensorflow 1.12.0和Keras 2.2.4会发生此行为。实际的Keras和。尝试导出使用Keras模型从Keras模型创建的Estimator时出现问题。调用时，将抛出a或a
Keras模型不是训练层，验证精度始终为0.5

我的Keras CNN模型（基于AlexNet的一个实现）的训练精度总是接近0.5（在+-0.02以内），验证精度总是精确的0.5。它是一个二进制分类模型，其中train/val的分割大约为85/15，并且在这两个集合中，图像对每个类进行50/50的分割。

为什么我的keras模型根本不训练？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档