当前位置: 首页 > 知识库问答 >
问题:

在python中从html获取价值的最佳方式?[重复]

谢旻
2023-03-14

所以我想在python中抓取属性值,目前我正在使用正则表达式,但它不是那么有效,所以我想知道我应该使用什么,因为许多人说正则表达式不适合这样的东西。

谢谢

这就是我想得到的。

<input type="hidden" name="test" value="99948555"> 

值始终包含随机数。

共有1个答案

扶开诚
2023-03-14

我会使用美丽汤进行这种解析:

from bs4 import BeautifulSoup
html = '<input type="hidden" name="test" value="99948555">'
soup = BeautifulSoup(html, 'html.parser')
print(soup.find('input')['name'], ':', soup.find('input')['value'])
# outputs : "test : 99948555"

您在这里寻找的是:< code > soup . find(' input ')[' value ']

有关用法和示例,请参阅留档:https://www.crummy.com/software/BeautifulSoup/bs4/doc/

您可以这样安装:

[python_binary] -m pip install bs4
 类似资料:
  • 我对函数返回有点困惑,我的目的是尽量避免复制。 我读了一些文档,告诉我不要使用reference作为map的值。 但在下面的代码中,我感到困惑。 哪一个最快?你认为哪一个是最好的?

  • 我试图找出在Spark dataframe列中获得最大值的最佳方法。 考虑以下示例: 上面的每一个都给出了正确的答案,但在没有Spark分析工具的情况下,我无法判断哪一个是最好的。 就Spark运行时或资源使用而言,上述哪种方法最有效,或者是否有比上述方法更直接的方法,有任何来自直觉或经验主义的想法?

  • 问题内容: 从和/或内部,如何确定复选框的新状态? 问题答案: 简短的答案: 使用该事件,直到值更新后才会触发,并在您希望它触发时触发: 更长的答案: 该事件处理函数不是调用,直到状态已经更新,但因为(蒂姆·布泰在评论中指出)IE不火,直到选框失去焦点的事件,你没有得到主动通知。更糟的是,与IE浏览器,如果你点击一个标签的复选框(而不是复选框本身)进行更新,你可以得到的印象是。这是因为如果复选框具

  • 问题内容: 我正在尝试找出在Spark dataframe列中获得最大值的最佳方法。 考虑以下示例: 哪个创建: 我的目标是在A列中找到最大值(通过检查,这是3.0)。使用PySpark,我可以想到以下四种方法: 上面的每一个都给出了正确的答案,但是在没有Spark分析工具的情况下,我无法确定哪个是最好的。 从直觉或经验主义的观点来看,就Spark运行时或资源使用而言,上述哪种方法最有效,或者是否

  • 如何将您在网页上看到的内容/内容提取成字符串例如将以下内容: 转换成如下所示的字符串:

  • 问题内容: 我有一个问题,我需要从中获得价值 任何想法? 问题答案: 是您要找的东西。它需要更多的“推动”来告诉它“获得此价值并将其还给我”。 我还要说您可能甚至不需要这样做。如果您在努力获取元素的属性,则最好这样做: