当前位置: 首页 > 面试题库 >

解析bbcode的最佳方法

洪哲彦
2023-03-14
问题内容

我想为php网站使用bbcode过滤器。(我正在使用cakephp,它将是一个bbcode助手)我有一些要求。

Bbcode可以嵌套。 所以类似的东西是有效的。

[block]  
    [block]  
    [/block]  
    [block]  
        [block]  
        [/block]  
    [/block]  
[/block]

Bbcode可以具有0个或多个参数。

范例:

[video: url="url", width="500", height="500"]Title[/video]

Bbcode可能具有多种行为。

可以说,[url]text[/url]将转换为[url:url="text"]text[/url]
或视频bbcode可以在youtube,dailymotion …之间进行选择。

我认为它可以满足我的大部分需求。我用正则表达式做了一些事情。但是我最大的问题是匹配参数。实际上,我可以使用嵌套的bbcode并使用0参数的bbcode。但是,当我添加参数的正则表达式匹配时,它与嵌套的bbcode匹配不正确。

"\[($tag)(=.*)\"\](.*)\[\/\1\]" //不是。*,但非匹配器

我现在没有完整的正则表达式,但是我有一个看起来像(上面)的东西。

因此,有一种方法可以将bbcode与正则表达式或其他有效匹配。我唯一能想到的就是使用访客模式,并以这种方式将文本与每个可能的标签分开,我可以对文本解析有更多的控制权,而且我可能会验证我的文档,因此如果输入文本没有没有有效的bbcode。我可以在保存任何内容之前通知用户错误。

我将使用sablecc创建我的文本解析器。 http://sablecc.org/

有更好的主意吗?或任何可能导致高效灵活的bbcode解析器的东西?

谢谢,抱歉我的英语不好。


问题答案:

同时有一个pecl和PEAR
BBCode解析库。软件足够强大,而不必自己重复数年的工作。

如果这两个选项都不可行,那么我将集中精力将BBCode转换为有效的XML字符串,然后对它使用您喜欢的XML解析例程。这里的想法非常非常粗糙,但是

  1. 通过htmlspecialchars运行代码以转义任何需要转义的实体

  2. 将所有[和]字符分别转换为<和>

  3. 在[标记名:

如果BBCode正确嵌套,则应该全部设置为将此字符串传递到XML解析对象(SimpleXML,DOMDocument等)中。



 类似资料:
  • 问题内容: 我想知道什么是将DateTime对象解析到SQL Server的最佳方法。 在代码中生成SQL的位置。 除了今天出现错误之外,我一直都使用类似的方法并取得了良好的结果,这让我产生了思考。 因此,不管有什么设置,每个人都可以想到并推荐的一种可以在所有SQL Server上使用的方法。 也许像 问题答案: 只有2种安全格式 ISO和ISO8601 ISO = yymmdd ISO8601

  • 问题内容: 我目前正在使用MagpieRSS,但是当RSS或Atom提要格式不正确时,有时会掉下来。还有其他使用PHP解析RSS和Atom提要的选项吗? 问题答案: 我一直使用PHP内置的SimpleXML函数来解析XML文档。它是目前为数不多的具有直观结构的通用解析器之一,这使得为RSS提要等特定内容构建有意义的类非常容易。此外,它将检测XML警告和错误,找到任何内容后,您可以简单地通过HTML

  • 问题内容: 我正在使用解析Java中的字符串。但是,没有直接解析字符串的函数,所以我改为这样做: 这是最好的方法吗?我觉得必须有一个更简单的方法…谢谢! 问题答案: 直接回答您的问题-据我所知,没有更好的方法。使用输入源是因为它比较通用,可以处理来自文件,字符串或跨线的输入,这是我的理解。 您还可以尝试使用SAX Xml解析器- 它稍微有点基础,并且使用了Visitor模式,但是可以完成工作,对于

  • 在python中,从URL查询字符串(例如,通过表单附加到URL的数据)解析数据的最佳方法是什么?我的目标是接受表单数据并将其显示在同一页面上。我已经研究了几种方法,但并不完全是我想要的。 我正在创建一个简单的Web服务器,目标是学习套接字。此Web服务器仅用于测试目的。

  • 问题内容: 我正在寻找一种库/方法来解析比通用xml解析库具有更多html特定功能的html文件。 问题答案: 这是一个敏捷的HTML解析器,它构建了一个读/写DOM并支持纯XPATH或XSLT(您实际上不必了解XPATH或XSLT来使用它,不用担心…)。这是一个.NET代码库,可让您解析“网络外” HTML文件。该解析器对“真实世界”格式的HTML十分宽容。对象模型与提出System.Xml的对

  • 问题内容: 我正在尝试使用gson库(http://code.google.com/p/google-解析一些巨大的JSON文件(例如http://eu.battle.net/auction- data/258993a3c6b974ef3e6f22ea6f822720/auctions.json )JAVA中的gson / )。 我想知道解析这种大文件(约80k行)的最佳方法是什么,以及您是否知道