我做到了sudo pip install BeautifulSoup4
,得到了非常乐观的回应:
Downloading/unpacking beautifulsoup4
Running setup.py egg_info for package beautifulsoup4
Installing collected packages: beautifulsoup4
Running setup.py install for beautifulsoup4
Successfully installed beautifulsoup4
Cleaning up..
但是当我尝试使用import BeautifulSoup4
或from BeautifulSoup4 import BeautifulSoup4
在脚本中使用python时,它说该名称没有模块。
> import BeautifulSoup
ImportError: No module named BeautifulSoup
更新:pip
告诉我,beautifulsoup4 in /usr/local/lib/python2.6/dist- packages
但是我正在运行2.7.2+(并print sys.path
看到2.7个路径)…所以现在我需要弄清楚为什么pip
将事物放置在错误的位置。
尝试import bs4
。不幸的是,PyPI软件包名称和导入名称之间没有对应关系。之后,类名与之前相同。soup = bs4.BeautifulSoup(doc)
将工作。
如果仍然无法解决问题,请重试pip install
并记下软件包安装路径。然后在您的python控制台中运行import sys
,print sys.path
并确保路径存在。
您可能需要明确指定pip-2.7
或切换到easy_install
(或easy_install-2.7
)
CSS 选择器:BeautifulSoup4 和 lxml 一样,Beautiful Soup 也是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML 数据。 lxml 只会局部遍历,而Beautiful Soup 是基于HTML DOM的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于lxml。 BeautifulSoup 用来解析 HT
脱机工作时,适用于 Windows 的独立 Postman 客户端将集合保存在何处? 澄清一下,我想找到当禁用在线同步时Postman默认保存集合文件的位置。我没有尝试将我的集合导出为JSON文件。 我查看了、“我的文档”和“程序文件”,但我看不到Postman将收集的数据保存在哪里。
本文向大家介绍在页面上隐藏元素的方法有哪些?相关面试题,主要包含被问及在页面上隐藏元素的方法有哪些?时的应答技巧和注意事项,需要的朋友参考一下 利用 dispaly disaplay: none; 页面不会渲染 visibility: hidden; 页面会渲染只是不限显示 opacity: 0; 看不见,但是会占据空间 利用 position (absolute 的情况下) left/right
我想在PyCharm 2018.3.2中使用BeautifulSoup4。问题是,“bs4”和“Beautiful Soup”/“BeautiFul Soup4”在PyCharm中用红色下划线表示: 没有其他无法导入,只有这个模块。红色下划线告诉我“bs4”和“美丽汤(4)”也是如此: “未解析的引用'bs4' 更少...(按 F1 键) 检查信息:该检查检测应该解析但没有解析的名称。由于动态调度
我正在尝试从使用非特定span类来格式化/显示内容的网站中刮取数据。这些页面提供了有关化学产品的信息,并且每个产品都在一个div类中进行描述。我首先用那个div类进行解析,然后从那里提取我需要的数据。我已经能够得到许多东西,但我似乎无法提取的部分是在span类“ppisreportspan”中。如果您查看代码,您会注意到它在每个化学描述中出现多次。 这个样品包括两种化学物质。一个有“Alstar”
我对Python相当陌生,第一次使用漂亮的汤,尽管我对硒有一些经验。我试图刮一个网站(http://cbseaff.nic.in/cbse_aff/schdir_Report/userview.aspx)所有的从属关系号码。 问题是它们在多个页面上(1上有20个结果,总计:21000个结果) 所以,我希望在某种循环中刮这些,可以在下一个页面上迭代btn,网页的URL中的问题不会改变,因此没有模式。