我想使用python脚本在Google中搜索文本,然后返回每个结果的名称,描述和URL。我目前正在使用此代码:
from google import search
ip=raw_input("What would you like to search for? ")
for url in search(ip, stop=20):
print(url)
这仅返回URL。如何返回每个URL的名称和描述?
并不是我一直在寻找的东西,但是我发现自己现在是一个不错的解决方案(如果我可以做得更好的话,我可以对其进行编辑)。我像在Google中一样搜索(仅返回URL)和Beautiful
Soup软件包结合在一起来解析HTML页面:
from google import search
import urllib
from bs4 import BeautifulSoup
def google_scrape(url):
thepage = urllib.urlopen(url)
soup = BeautifulSoup(thepage, "html.parser")
return soup.title.text
i = 1
query = 'search this'
for url in search(query, stop=10):
a = google_scrape(url)
print str(i) + ". " + a
print url
print " "
i += 1
这给了我页面标题和链接的列表。
另一个很棒的解决方案:
from google import search
import requests
for url in search(ip, stop=10):
r = requests.get(url)
title = everything_between(r.text, '<title>', '</title>')
问题内容: 任何人都可以帮助我如何编写一个python脚本来搜索google并显示最佳结果的链接。 问题答案: 也许是这样的? 阅读文档http://docs.python.org/ [编辑]由于AJAX API已失效,因此您可以使用第三方服务,例如SerpApi,它们确实提供了Python库。
问题内容: 最近我一直在学习很多python,以便在工作中的某些项目上工作。 目前,我需要对Google搜索结果进行一些网页抓取。我发现了几个站点,这些站点演示了如何使用ajax google api进行搜索,但是在尝试使用它之后,似乎不再受支持。有什么建议? 我一直在寻找一种方法,但似乎找不到当前有效的解决方案。 问题答案: 您随时可以直接抓取Google搜索结果。为此,您可以使用将返回前10个
问题 我试图通过搜索文本来确定文档是什么类型(例如恳求、通信、传票等),最好使用python。所有的PDF都是可搜索的,但是我还没有找到用python解析它并应用脚本搜索它的解决方案(除了先将它转换为文本文件,但是对于n个文档来说,这可能是资源密集型的)。 到目前为止,我所做的 我已经研究了pypdf、pdfminer、adobe pdf文档,以及我能在这里找到的任何问题(尽管似乎没有一个能直接解
问题内容: 我不确定他们已经进行了多长时间,但是我只是注意到Google 在他们的搜索网址中使用 # 而不是 搜索? 。 新方法 http://www.google.com/#q=stackoverflow 旧方法 http://www.google.com/search?q=stackoverflow 井号/井号通常用作页面部分的锚点。 除了较短的网址,对Google有什么好处?它似乎违背了搜索
可确认Google Maps™的服务条款。
问题内容: 我完全是AJAX的新手。我熟悉HTML / CSS,jQuery和GAE和Python的初学者。 为了理解AJAX的工作原理,我想知道如何在下面的示例中使用AJAX(实际代码)。让我们使用类似于reddit的示例,其中上下左右投票被弃用: 这是故事种类: HTML看起来像这样: AJAX如何容纳在这里? 问题答案: 好吧,先生,我们走了…一个带有一个故事和无限投票的简单应用… ;-)