我同时安装了Python 2.7和Python 3.5。当我键入< code > pip install beautiful soup 4 时,它告诉我它已经安装在python2.7/site-package目录中。
但是如何将其安装到python3目录中呢?
如果您使用的是最新版本的Debian或UbuntuLinux,您可以使用系统包管理器安装美丽的汤:
$ apt-get install python-bs4 (for Python 2)
$ apt-get install python3-bs4 (for Python 3)
Afer 安装导入库
from bs4 import BeautifulSoup
以root身份运行:
apt-get install python3-bs4
#or
pip3 install beautifulsoup4
然后像这样导入它:
import bs4
我认为pip3会满足您的需求,请在终端上使用以下命令:
pip3 install beautifulsoup4
查看文档
问题内容: 我想使用漂亮的汤删除html文件中的所有注释。由于BS4将每个注释作为一种特殊类型的可导航字符串,所以我认为这段代码可以工作: 所以那行不通…。如何使用BS4查找所有评论? 问题答案: 您可以将函数传递给find_all()来帮助它检查字符串是否为Comment。 例如我有下面的HTML: 码: 输出将是: 顺便说一句,我认为不起作用的原因是(来自BeautifulSoup文档): 输
问题内容: 我正在尝试解析一个网站,并通过BeautifulSoup.findAll获取一些信息,但它并没有全部找到。.我正在使用python3 代码是这个 它只打印其中一半… 问题答案: 不同的HTML解析器对损坏的HTML的处理方式不同。该页面提供了损坏的HTML,解析器对此的处理不佳: 标准库在此特定页面上的麻烦较少: 使用将其转换为您的特定代码示例,您将这样指定解析器:
问题内容: 我用Java编写并编译了一个简单的Hello World程序,但是当我尝试运行该程序时,却收到了错误消息。只有在我执行命令后,它才能成功运行。 奇怪的是,当前目录似乎已经是类路径的一部分。剧本 打印,尽管我再次必须显式设置该选项。 有谁知道为什么会这样?我正在使用Ubuntu 16.04和open-JDK版本1.8。 问题答案: 我希望已经设置了环境变量。运行以查看其设置。 如果您不使
问题内容: 我正在尝试从Google搜索结果中提取链接。检查元素告诉我,我感兴趣的部分具有“ class = r”。第一个结果如下所示: 要提取“ href”,我要做: 但是我意外地得到: 我想要的地方: 属性“ ping”似乎使它感到困惑。有任何想法吗? 问题答案: 发生了什么? 如果您打印响应内容(即),则会看到您得到的HTML完全不同。页面源和响应内容不匹配。 因为内容是动态加载的,所以 不
我有一个HTML文件。我试着打开它,读里面的内容 当我打印上述命令中的内容时,它可以完美地打印。但是,当我将内容传递给美丽汤并打印汤时,它会更改HTML代码 这是BeautifulSoup的输出 我不明白为什么它这样做。我需要从中提取3个标签,但它一直给出作为输出。 有人能帮帮我吗?
我正在写报告。现在我有一个jrxml文件,我必须加载它,以便我可以解析它。然而问题是我想直接加载文件与它的名字 但是我无法找到我应该把文件放在我的项目中的哪里,以便上面的路径有效。在简单的java项目中,我们只是把我们想要的文件放在src文件夹所在的项目文件夹中,但它在vaadin项目中不起作用。那么我应该把我的文件放在哪里。 谢谢。