当前位置: 首页 > 面试题库 >

解码HTML字符串

羊舌兴德
2023-03-14
问题内容

如何从以下位置解码我的html字符串:

<span>Bj&ouml;rn</span>

<span>Björn</span>

在Swift 3中?


问题答案:

<span>在替换&ouml;符号时,您真的需要保留标签吗?Leo Dabus在“ 将Unicode符号或其XML /
HTML实体转换为Swift中的Unicode数字”中提出了一种技术,该符号转换包括通过属性字符串来回转换符号。

在Swift 4中:

extension String {
    /// Converts HTML string to a `NSAttributedString`

    var htmlAttributedString: NSAttributedString? {
        return try? NSAttributedString(data: Data(utf8), options: [.documentType: NSAttributedString.DocumentType.html, .characterEncoding: String.Encoding.utf8.rawValue], documentAttributes: nil)
    }
}

如果要使用属性字符串(例如,用于中UILabel

let string = "Bj&ouml;rn is <em>great</em> name"
label.attributedText = string.htmlAttributedString

这也将转换Bj&ouml;rnBjörn斜体<em>...</em>

如果您只想转换HTML符号并去除HTML标签(例如<span>/ </span>),则只需抓住string

let string = "Bj&ouml;rn is <em>great</em> name"
if let result = string.htmlAttributedString?.string {
    print(result)   // "Björn is great name"
}


 类似资料:
  • 问题内容: 我正在使用Beautiful Soup 3解析一些HTML,但是它包含HTML实体,Beautiful Soup 3不会自动为我解码: 如何解码HTML实体以获得而不是。 问题答案: Python 3.4以上 用途: FYI 已弃用,并且应该在3.5中删除,尽管它是错误地保留的。它将很快从语言中删除。 Python 2.6-3.3 您可以从标准库中使用: 对于python 2.6-2.

  • 问题内容: 我正在使用Beautiful Soup 3解析一些HTML,但是它包含HTML实体,Beautiful Soup 3不会自动为我解码: 如何解码HTML实体text以获得而不是。 问题答案: Python 3.4以上 用途: FYI html.parser.HTMLParser.unescape已弃用,并且应该在3.5中删除,尽管它是错误地保留的。它将很快从语言中删除。 Python

  • 问题内容: 我正在使用Beautiful Soup 3解析一些HTML,但是它包含HTML实体,Beautiful Soup 3不会自动为我解码: 如何解码HTML实体以获得而不是。 问题答案: Python 3.4以上用途 FYI 已过时,并且应该在3.5中删除,尽管它是错误地遗忘的。它将很快从语言中删除。 Python 2.6-3.3 您可以HTMLParser.unescape()从标准库中

  • 问题内容: 首先,我发现了这一点:目标CHTML转义/转义,但对我不起作用。 我的编码字符(来自RSS feed,顺便说一句)如下所示: 我在网上搜索了所有内容,并找到了相关的讨论,但是没有解决我的特定编码问题,我认为它们被称为十六进制字符。 问题答案: 这些被称为字符实体引用。当采用它们的形式时,它们称为_数字实体引用_ 。基本上,它是应该替换的字节的字符串表示形式。在的情况下,它表示ISO-8

  • 问题内容: ’=?KOI8-R?B?W1JFUS0wMDI1NDEtNDc5NzddIO / h7yAi89TSz8rGwdLGz9IiIDs =?= \ r \ n \ t =?KOI8-R?B?Ry43MjkgKDEwKQ ==?=’ 如何将其转换为可读的内容?谢谢 ! 问题答案: email.header.decode_header(‘=?KOI8-R?B?W1JFUS0wMDI1NDEtN

  • 问题内容: 我搜索了一个解决方案,但没有任何意义,所以这是我的问题: 我想解析一个包含HTML文本的字符串。我想用JavaScript做。 我尝试了这个库,但似乎它解析了当前页面的HTML,而不是字符串。因为当我尝试下面的代码时,它更改了页面的标题: 我的目标是从读取的HTML外部页面中提取链接,就像读取字符串一样。 您知道执行此操作的API吗? 问题答案: 创建一个虚拟DOM元素并将字符串添加到