当前位置: 首页 > 知识库问答 >
问题:

漂亮的汤模块错误(html解析器)

公西宏毅
2023-03-14

我使用beautifulsoup查找网页上的页数,但在编写代码时:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import urllib2
import requests
import BeautifulSoup


soup = BeautifulSoup(response.text)
pages = soup.select('div.pagination a')

a = int(pages[-2].text)
print a

它给出了以下错误:

回溯(最近一次调用):文件“C:/Users/HangaarLab/Desktop/sonartik/sonartik.py”,第13行,在soup=BeautifulSoup(response.text)TypeError中:“模块”对象不可调用

在另一台计算机中,代码运行,但它给出了以下警告: UserWarning:没有显式指定解析器,所以我为这个系统使用了最好的超文本标记语言解析器(“html.parser”)。这通常不是问题,但是如果您在另一个系统上或在不同的虚拟环境中运行此代码,它可能会使用不同的解析器并表现不同。引起此警告的代码位于文件C:/用户/Ar elik/Desktop/sikayet/klo.py.的第14行。要消除此警告,请将附加参数“功能=“html.parser”传递给美丽汤构造函数。

我需要代码在给出第一个错误的计算机中工作。那我该怎么办?

共有3个答案

鲁彬炳
2023-03-14

BeautifulSoup是bs4包的一部分。要修复代码,只需执行以下操作:

pip install bs4 

并将导入更改为:

from bs4 import BeautifulSoup
桂坚
2023-03-14

你必须从bs4包导入美汤

import urllib2
import requests
from bs4 import BeautifulSoup #here
headers = {'User-Agent': 'Mozilla/5.0'}
response = requests.get("https://www.sikayetvar.com/onedio", headers = headers)

soup = BeautifulSoup(response.text)
pages = soup.select('div.pagination a')

a = int(pages[-2].text)
print a
慎俊艾
2023-03-14

使现代化

import BeautifulSoup

from bs4 import BeautifulSoup

前任:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import urllib2
import requests
from bs4 import BeautifulSoup
headers = {'User-Agent': 'Mozilla/5.0'}
response = requests.get("https://www.sikayetvar.com/onedio", headers = headers)

soup = BeautifulSoup(response.text, "html.parser")   #Use a parser to fix second error warning 
pages = soup.select('div.pagination a')

a = int(pages[-2].text)
print a
 类似资料:
  • 我一直在使用下面的代码来解析链接中的网页https://www.blogforacure.com/members.php.代码将返回给定页面的所有成员的链接。 但是我只得到上面页面的前10个链接。即使在打印美化选项时,我也只能看到前10个链接。

  • 我有一小段代码来从web站点中提取表数据,然后以csv格式显示。问题是for循环多次打印记录。我不确定是不是因为 标签。顺便说一句,我是Python新手。谢谢你的帮助!

  • 我的xml文件编码如下: 我正在尝试使用漂亮的汤解析此文件。 但这导致 包\bs4__init__.py“,第 245 行,初始化标记 = 标记.read() 文件 “C:\ Users \ Gregg _ 000 \ AppData \ Local \ Programs \ Python \ Python 36 \ lib \ encodings \ CP 125 2 . py”,第23行,在d

  • 我已经获得了刮取第一页的代码,但是url从: https://www.expansion.com/empresas-de/ganaderia/granjas-en-general/index.html -- 如何创建从第2页到第65页的循环?非常感谢!

  • 我试图刮此页上Flipkart: http://www.flipkart.com/moto-x-play/p/itmeajtqp9sfxgsk?pid=MOBEAJTQRH4CCRYM 我试图找到的div类"fk-ui-ccarousel超级容器相同的vreco部分reco-carousel-边界-顶部sameHorizontalReco",但它返回空结果。 divs是空的。我使用inspect元

  • 问题内容: 我正在尝试在Python 2.7中安装BeautifulSoup 。我不断收到错误消息,无法理解原因。 我按照说明安装了pip,该pip已安装到以下目录:,然后尝试将其添加到路径中并运行命令。 尝试了两种不同的方法: 都给我这个错误信息: 该外壳突出显示“安装”一词,并说这是无效的语法。 我不知道发生了什么,所以任何帮助将不胜感激。 问题答案: 是 命令行工具 ,而不是Python语法