当前位置: 首页 > 面试题库 >

如何在BeautifulSoup.contents中保留空格

汝彭薄
2023-03-14
问题内容

我在网上找到的大多数示例都显示了如何删除空格-但就我而言,我需要保留它。

html = "I can flip this whole thing with one hand\n               <span>D#m</span>\nThe ringleader man\n<span>A#</span>                           <span>Dm</span>                          <span>A#</span>\nI know~~~~ it's a fact that you'd rather just have some of me instead"
bs = BeautifulSoup(html, 'html.parser')
content = (unicode('').join(unicode(content) for content in bs.contents))

我希望保留空白(“ html”变量包含pre标记的内容),但是似乎用一个空格代替了多个空格。

如何保存/获取给定beautifulsoup解析器的原始内容?


问题答案:

如果您要解析的内容在

标记中,则html解析器似乎仅保留空白-在我的情况下,pre标记已删除。新增中

html = "<pre>" + html + "</pre>"

保留空白。



 类似资料:
  • 我的短信有点小问题。在文本的某些部分,我使用了' '来确保该特定单词不会中断(或移动)到新行。举个例子,我做了这样的事情: 所以从理论上讲,这个文本('-is')不应该以一个单词的形式出现在一个新的行中,对吧?我想那是对的。但是...这个技巧给我带来了一个问题,就是在“-”和“is”之间增加了很大的空格...而且我当然不想有那个“大空位”。我将给出结果示例: 如你所见,有一个巨大的空间。所以,我的

  • 问题内容: 如何在逗号处分割字符串,以便保留所有空格。例: 需要将其分隔成数组,使其看起来像这样: 连接它们之后: 尝试使用split这样的方法:但是后来我将其分离而没有空格… 任何想法如何做到这一点? 问题答案:

  • 考虑以下bash脚本: 第一个参数中的尾随空格发生了什么变化?如何保存它?

  • 问题内容: 在AngularJS部分中,我如下遍历条目列表: 的内容有一些换行符,AngularJS会忽略它们。如何使其保留换行符? 问题答案: 这只是基本的HTML。AngularJS对此不会做任何改变。您可以改用标签: 或使用CSS: 如果包含HTML代码,则可以使用: 不要忘记包括ngSanitize:

  • 问题内容: 该函数会删除尾部和前导空格,但是,如果我只想删除字符串的尾部空格,该怎么办? 问题答案: 如果您使用的是JDK 11或更高版本,则可能应该使用stripTrailing()。 早期的JDK版本 使用正则表达式,您可以将所有尾随空格字符(包括空格和制表符)替换为空字符串()。 输出量 在线演示。 这是正则表达式的细分: –任何空白字符, –匹配一个或多个先前的令牌(可能);即,匹配一个或

  • 问题内容: 在我的应用程序中,我更改了XML文件的某些部分,其开始如下: 注意之前的空白行。加载,更改和保存后,结果远非令人满意: 我发现注释和文档节点之间的空白(一个换行符)根本没有在DOM中表示。下面的独立代码可靠地重现了此问题: 有谁知道如何避免这种情况?本质上,我希望输出与输入相同。(我知道将重新生成xml声明,因为它不是DOM的一部分,但这在这里不是问题。) 问题答案: 根本原因是标准D