问题：

使用Python抓取多个网页

墨宜人

2023-03-14

我想刮从多个网站与类似的网址的，如https://woollahra.ljhooker.com.au/our-team, https://chinatown.ljhooker.com.au/our-team和https://bondibeach.ljhooker.com.au/our-team.

我已经写了一个脚本，第一个网站的工作，但我不知道如何告诉它从其他两个网站刮。

我的代码：

from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup

my_url = "https://woollahra.ljhooker.com.au/our-team"

page_soup = soup(page_html, "html.parser")  
containers = page_soup.findAll("div", {"class":"team-details"})

for container in containers:
    agent_name = container.findAll("div", {"class":"team-name"})
    name = agent_name[0].text

    phone = container.findAll("span", {"class":"phone"})
    mobile = phone[0].text

    print("name: " + name)
    print("mobile: " + mobile)

有没有一种方法可以让我简单地列出url的不同部分（woollahra、chinatown、bondibeach），这样脚本就可以使用我已经编写的代码在每个网页中循环？

共有2个答案

慕容博涛

2023-03-14

你只需要一个循环

for team in ["woollahra", "chinatown", "bondibeach"]:
    my_url = "https://{}.ljhooker.com.au/our-team".format(team)
    page_soup = soup(page_html, "html.parser")  

    # make sure you indent the rest of the code

曾丰茂

2023-03-14

locations = ['woollahra', 'chinatown', 'bondibeach']
for location in locations:
    my_url = 'https://' + location + '.ljhooker.com.au/our-team'

后面是代码的其余部分，它们将查看列表中的每个元素，您可以稍后添加更多位置

类似资料：

如何使用不变的网址抓取多个页面-Python

问题内容：我正在尝试抓取此网站：http : //data.eastmoney.com/xg/xg/ 到目前为止，我已经使用selenium执行javascript并抓取了表格。但是，现在我的代码仅使我获得第一页。我想知道是否有一种方法可以访问其他17个页面，因为当我单击下一页时，URL不会更改，因此我不能每次都遍历另一个URL 下面是我到目前为止的代码：还是我每次单击后都可以使用webdri
使用Python进行网页抓取

问题内容：我想从网站上获取每天的日出/日落时间。是否可以使用Python抓取网络内容？使用什么模块？有没有可用的教程？问题答案：结合使用urllib2和出色的BeautifulSoup库：
asyncio网站抓取101：使用aiohttp获取多个网址

问题内容：在先前的问题中，一位作者建议使用aiohttp的新语法从中获取多个网址：但是，当其中一个请求中断时（如上所述，由于导致错误），则错误不会得到处理，整个中断。我就开始寻找插入有关的结果的测试，比如找地方了，或者一个，但我只是不理解如何与工作，与各种对象。由于仍然很新，因此没有很多示例。如果向导可以显示如何执行此操作，对许多人来说将非常有帮助。毕竟，大多数人想要测试的第一件事就是同时
Python-网页抓取

我是python新手，正在尝试从以下站点获取数据。虽然这段代码适用于不同的站点，但我无法让它适用于nextgen stats。有人想知道为什么吗？下面是我的代码和我得到的错误下面是我得到的错误 df11=pd。读取html（urlwk1）回溯（上次调用）：文件“”，第1行，在文件“C:\Users\USERX\AppData\Local\Packages\PythonSoftwareFounda
Python-使用Python网页抓取JavaScript页面

问题内容：我正在尝试开发一个简单的网页抓取工具。我想提取没有代码的文本。我实现了这个目标，但是我发现在某些加载了的页面中，我没有获得良好的结果。例如，如果一些代码添加了一些文本，则看不到它，因为当我调用我得到的原始文本没有添加文本（因为在客户端执行了）。因此，我正在寻找一些解决此问题的想法。问题答案：一旦安装了，请确保二进制文件在当前路径中可用：例举个例子，我用以下HTML代码创建
使用python和selenium抓取动态网页

问题内容：在网站上，有在标顶部的几个环节，，，和。如果按下以数字标记的链接，它将动态地将一些数据加载到content中。如果被按下，它会用标签页，，，和第4页中的数据显示。我想从按下的所有链接的内容中抓取数据（我不知道有多少，一次只显示3个，然后）请举一个例子。例如，考虑网站www.cnet.com。请指导我下载使用selenium的一系列页面，并自行解析它们以处理漂亮的汤。问题答案：

使用Python抓取多个网页

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档