当前位置：首页 > 面试题库 >

熊猫康卡特产生nan值

晏卓君

2023-03-14

问题内容：

我很好奇为什么在熊猫中简单地串联两个数据框：

shape: (66441, 1)
dtypes: prediction    int64
dtype: object
isnull().sum(): prediction    0
dtype: int64

shape: (66441, 1)
CUSTOMER_ID    int64
dtype: object
isnull().sum() CUSTOMER_ID    0
dtype: int64

形状相同且都没有NaN值

foo = pd.concat([initId, ypred], join='outer', axis=1)
print(foo.shape)
print(foo.isnull().sum())

如果加入，可能会导致很多NaN值。

(83384, 2)
CUSTOMER_ID    16943
prediction     16943

如何解决此问题并防止引入NaN值？

试图像复制它

aaa  = pd.DataFrame([0,1,0,1,0,0], columns=['prediction'])
print(aaa)
bbb  = pd.DataFrame([0,0,1,0,1,1], columns=['groundTruth'])
print(bbb)
pd.concat([aaa, bbb], axis=1)

失败，例如，因为没有引入NaN值，所以效果很好。

问题答案：

我认为索引值不同存在问题，因此concat无法对齐get NaN：

aaa  = pd.DataFrame([0,1,0,1,0,0], columns=['prediction'], index=[4,5,8,7,10,12])
print(aaa)
    prediction
4            0
5            1
8            0
7            1
10           0
12           0

bbb  = pd.DataFrame([0,0,1,0,1,1], columns=['groundTruth'])
print(bbb)
   groundTruth
0            0
1            0
2            1
3            0
4            1
5            1

print (pd.concat([aaa, bbb], axis=1))
    prediction  groundTruth
0          NaN          0.0
1          NaN          0.0
2          NaN          1.0
3          NaN          0.0
4          0.0          1.0
5          1.0          1.0
7          1.0          NaN
8          0.0          NaN
10         0.0          NaN
12         0.0          NaN

解决方案是reset_index如果不需要索引值：

aaa.reset_index(drop=True, inplace=True)
bbb.reset_index(drop=True, inplace=True)

print(aaa)
   prediction
0           0
1           1
2           0
3           1
4           0
5           0

print(bbb)
   groundTruth
0            0
1            0
2            1
3            0
4            1
5            1

print (pd.concat([aaa, bbb], axis=1))
   prediction  groundTruth
0           0            0
1           1            0
2           0            1
3           1            0
4           0            1
5           0            1

类似资料：

熊猫数据框用NaN替换空白

我有一个空单元格的数据框，并希望用NaN替换这些空单元格。之前在这个论坛上提出的解决方案有效，但前提是单元格包含一个空间：当单元格为空时，此代码不起作用。有人建议用熊猫代码来代替空细胞吗？
在熊猫中用NaN替换空白值（空白）

问题内容：我想在包含空格（任意数量）的Pandas数据框中找到所有值，并用NaN替换这些值。有什么想法可以改善吗？基本上我想把这个：变成这个：我已经用下面的代码做到了，但是这很丑。这不是Pythonic，而且我敢肯定，这也不是最有效的熊猫使用方式。我遍历每一列，并对通过应用对每个值进行正则表达式搜索的函数生成的列掩码进行布尔替换，在空白处进行匹配。通过仅迭代可能包含空字符串的字段，可以
熊猫数据框：用行平均值替换NaN

问题内容：我正在尝试学习熊猫，但请对以下内容感到困惑。我想用行平均值替换NaN是一个数据框。因此，类似的东西应该可以工作，但是由于某种原因，它对我来说是失败的。我是否想念任何东西，我做错了什么？是因为其未执行；但是这样的事情看起来很好问题答案：如评论所述，fillna的axis参数为NotImplemented。注意：这在这里很重要，因为您不想用第n行平均值填写第n列。现在，您需要遍历
在熊猫中用NaN替换空白值（空白）

我想找到熊猫数据框中包含空白（任意数量）的所有值，并用NaN替换这些值。有什么想法可以改进吗？基本上，我想把这个转变为：为此：我已经设法做到了下面的代码，但人是丑陋的。这不是蟒蛇，我肯定这也不是对熊猫最有效的利用。我循环遍历每一列，并对应用一个函数生成的列掩码进行布尔替换，该函数对每个值进行正则表达式搜索，并在空格上进行匹配。只需遍历可能包含空字符串的字段，即可对其进行一点优化：但这算
熊猫用空白/空字符串替换NaN

问题内容：我有一个Pandas Dataframe，如下所示：我想用一个空字符串删除NaN值，使其看起来像这样：问题答案：这可能会有所帮助。它将用空字符串替换所有NaN。
熊猫-将列转换为int并强制NaN

给定如下所示的数据帧您可能会注意到，这里所有的列都已转换为类型。是否有办法将某些列转换为？尝试了以下方法这会引发错误阅读有关可为空的整数数据类型的信息，然后重试这会引发错误

相关阅读

Java何时可以产生NaN？熊猫SettingWithCopyWarning 熊猫：SettingWithCopyWarning 防止熊猫将'NA'解释为字符串中的NaN 重命名熊猫中的特定列

相关文章

康冠科技产品工程师10.26 海康威视产品经理一面康旭科技Java实习生移卡产品一面面经移卡产品二面面经

相关问答

如何计算熊猫数据帧中某列中的 NaN 值？大熊猫熊猫将字符串列和NaN（浮点数）转换为整数，保持NaN[重复]空熊猫数据帧填充随机值，如何使其全部NaN？如何在熊猫的NaN值之间均衡地重新分配值？

相关工具

熊猫Flash播放器健康资讯触摸屏幕产生圆圈扩大瑞星卡卡安全浏览器猫国建设者

相关文档

变现猫接入文档 v1.4 LocaSpace Viewer 产品文档 Wish3D Earth 产品文档人人都是产品经理 v2.0 写给泛产品经理产品经理进化论：AI+时代产品经理的思维方法