当前位置: 首页 > 面试题库 >

pandas追加无效

祁聪
2023-03-14
问题内容

datum = soup.findAll(‘a’, {‘class’: ‘result-title’})
for data in datum:
print(data.text)
print(data.get(‘href’))
df = {‘Title’: data.text, ‘Url’: data.get(‘href’)}
houseitems.append(df, ignore_index=True)

我的代码有什么问题?为什么当我要求提供房屋物品时,它给了我空的数据。

空数据框

Columns: [Title, Url, Price]
Index: []

问题答案:

问题是你需要分配回追加DataFrame,因为熊猫 不是* 工作就地喜欢纯Python
DataFrame.append
*append

似乎您想附加到list,因此ignore_index=True不需要参数:

循环解决方案:

houseitems = []
for data in datum:
    print(data.text)
    print(data.get('href'))
    df = {'Title': data.text, 'Url': data.get('href')}
    houseitems.append(df)

list comprehension解决方案:

houseitems = [{'Title': data.text, 'Url': data.get('href')} for data in datum]

然后创建DataFrame

df1 = pd.DataFrame(houseitems)


 类似资料:
  • 我有一个带有数值的数据框。添加表示每列总和的行(具有给定索引值)的最简单方法是什么?

  • 问题内容: 我正在运行一个基本脚本,该脚本遍历嵌套字典,从每个记录中获取数据,并将其附加到Pandas DataFrame。数据看起来像这样: 总共有几百万条记录。脚本本身如下所示: 但是,这非常缓慢。在寻找并行化方法之前,我只是想确保我没有错过任何明显的东西,这些东西可以使它按原样更快地执行,因为我对Pandas还是很陌生。 问题答案: 我还在循环中使用了数据框的 append 函数,感到困惑的

  • 问题内容: 我有3个数据框,可以从下面显示的代码中生成 我想做两件事 a) 将所有这三个数据帧追加到一个大数据帧中 当我尝试使用以下代码进行此操作时,输出结果与预期不符 因此,要解决此问题,我了解我们必须重命名导致以下目标b的列名 b) 以一种优雅的方式将这n个数据帧的列重命名为统一的 请注意,在实时情况下,我可能具有预先不知道的具有不同列名的数据框,但它们中的值始终属于列和,并且始终相同。但请注

  • 问题内容: 我编写此代码是为了使用HTML中的元素将图像上传到本地Apache Web服务器。该记录为不为空,但为什么是完全空的? 这是我在本地网络服务器上的 将记录所有PHP文件的代码行,而不是返回的结果 问题答案: 仅记录formData对象时,它始终返回空,因为您无法记录formData。 如果您只需要在发送前对其进行记录,则可以使用它来获取formData对象中的条目

  • 我知道pandas的设计目的是加载完全填充的,但我需要创建一个空的DataFrame,然后逐个添加行。做这件事最好的方法是什么? 我成功创建了一个空DataFrame,其中包含: 然后我可以添加一个新行,并用以下内容填充字段: 它可以工作,但看起来很奇怪:-/(它不能添加字符串值) 我如何添加一个新的行到我的数据帧(不同的列类型)?