当前位置: 首页 > 知识库问答 >
问题:

使用输入器后如何将数据放入dataframe?

宇文德明
2023-03-14
from datawig import SimpleImputer
from datawig.utils import random_split
from sklearn.metrics import f1_score, classification_report
df_train, df_test = random_split(df, split_ratios=[0.8, 0.2])
# Initialize a SimpleImputer model
imputer = SimpleImputer(
input_columns=['SITUACION_DNI_A'],  # columns containing information about 
 the column we want to impute
output_column='EXTRANJERO_A',  # the column we'd like to impute values for
output_path='imputer_model'  # stores model data and metrics
)

# Fit an imputer model on the train data
imputer.fit(train_df=df_train, num_epochs=10)

# Impute missing values and return original dataframe with predictions
predictions = imputer.predict(df_test)

共有1个答案

阎功
2023-03-14

如果这两个dataframe都有一个唯一的列或类似ID的东西,那么这个方法就可以工作了

df_test = df_test.set_index('unique_col')
df_test.fillna(predictions.set_index('unique_col'))

如果上面的方法不起作用,那么删除具有丢失值的行,并将输入器预测追加到DataFrame。请查看以下链接以获得帮助

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.dataframe.append.html

 类似资料:
  • 我无法将微调器的选定项目放入我的sqlite数据库。当我单击按钮时,我的应用程序会自动关闭。 我所得到的。。 D/AndroidRuntime:关闭VM E/AndroidRuntime: FATAL EXCEPTION: main Process:Ok_button_onClick, PID: 14079android.os.NullPointerException:尝试在android.os.

  • 我对Kinesis是新手。阅读我发现的文档,我可以创建Kinesis流来从生产者那里获得数据。然后使用KCL将从流中读取这些数据以进行进一步的处理。我了解了如何通过引入IRecordProcessor来编写KCL应用程序。

  • 这只是一个简单的音乐应用程序。在中搜索时,我希望同时搜索并列出作曲家的姓名和歌曲标题。这是我在Firebase中的实时数据库。 我试图在android studio中访问这两个数据库,但ArrayList(=array)中的数据结果始终为空。单击“搜索”按钮时,以下是我在中的kotlin代码。 是否可以访问两个数据库并获取一个没有空值的数组值?我知道,发生得很晚,但是否可以将值放入数组,然后放入适

  • 我的问题不是: < li >维护h2o数据帧的有效方法 < li>H2O运行速度比data.table R慢 < li >在h2o中加载大于内存大小的数据 硬件/空间: 32 个至强线程,带 ~256 GB 内存 要上传约 65 GB 的数据。(约56亿个细胞) 问题: 将数据上传到h2o需要几个小时。这不是任何特殊处理,只是“as.h2o(...)”。 使用“fread”将文本放入空间只需要不到

  • 问题内容: 我想从字节数组中提取一组坐标到DoubleBuffer中。 以下是如何将一组坐标从主字节数组提取到另一个字节数组的示例。 我的问题是: 如何将geomCoords字节数组放入DoubleBuffer? 还是 可以在不创建geomCoords的情况下将这些数据放入DoubleBuffer中?速度和效率是关键,因此任何捷径或优化都是最欢迎的! 问题答案: 如果您知道字节缓冲区中的8个字节确