当前位置：首页 > 文档资料 > Beautiful Soup 4.4.0 中文文档 >

附录

优质

小牛编辑

133浏览

2023-12-01

[1]	BeautifulSoup的google讨论组不是很活跃,可能是因为库已经比较完善了吧,但是作者还是会很热心的尽量帮你解决问题的.
[2]	(1, 2) 文档被解析成树形结构,所以下一步解析过程应该是当前节点的子节点
[3]	过滤器只能作为搜索文档的参数,或者说应该叫参数类型更为贴切,原文中用了 `filter` 因此翻译为过滤器
[4]	元素参数,HTML文档中的一个tag节点,不能是文本节点
[5]	(1, 2, 3, 4, 5) 采用先序遍历方式
[6]	(1, 2) CSS选择器是一种单独的文档搜索语法, 参考 http://www.w3school.com.cn/css/css_selector_type.asp
[7]	原文写的是 html5lib, 译者觉得这是原文档的一个笔误
[8]	wrap含有包装,打包的意思,但是这里的包装不是在外部包装而是将当前tag的内部内容包装在一个tag里.包装原来内容的新tag依然在执行 wrap() 方法的tag内
[9]	文档中特殊编码字符被替换成特殊字符(通常是�)的过程是Beautful Soup自动实现的,如果想要多种编码格式的文档被完全转换正确,那么,只好,预先手动处理,统一编码格式
[10]	(1, 2) 智能引号,常出现在microsoft的word软件中,即在某一段落中按引号出现的顺序每个引号都被自动转换为左引号,或右引号.

免责声明：以上内容版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。感谢每一位辛勤著写的作者，感谢每一位的分享。