当前位置: 首页 > 面试题库 >

如果socket.setdefaulttimeout()无法正常工作,该怎么办?

罗河
2023-03-14
问题内容

我正在编写一个脚本(多线程)以从网站上检索内容,并且该网站不是很稳定,因此时不时会有一个挂起的http请求,甚至无法超时socket.setdefaulttimeout()。由于我无法控制该网站,所以我唯一能做的就是改善代码,但现在我的想法已经用尽。

样例代码:

socket.setdefaulttimeout(150)

MechBrowser = mechanize.Browser()
Header = {'User-Agent': 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.2.8) Gecko/20100722 Firefox/3.6.8 GTB7.1 (.NET CLR 3.5.30729)'}
Url = "http://example.com"
Data = "Justatest=whatever&letstry=doit"
Request = urllib2.Request(Url, Data, Header)
Response = MechBrowser.open(Request)
Response.close()

我该怎么做才能迫使挂起的请求退出?其实我想知道为什么一开始socket.setdefaulttimeout(150)不起作用。有人可以帮我吗?

补充:(是的问题仍然没有解决)

好的,我遵循了tomasz的建议,将代码更改为MechBrowser.open(Request, timeout = 60),但是同样的事情发生了。到目前为止,我仍然会随机挂起请求,有时是几个小时,有时可能是几天。现在我该怎么做?有办法强迫这些挂起的请求退出吗?


问题答案:

虽然socket.setsocketimeout将为新套接字设置默认超时,但是如果您不直接使用套接字,则可以轻松覆盖该设置。特别是,如果库socket.setblocking在其套接字上调用,它将重置超时。

urllib2.open有一个超时参数,但是,中没有超时urllib2.Request。在使用时mechanize,应参考其文档:

从Python
2.6开始,urllib2在内部对Request对象使用.timeout属性。但是,urllib2.Request没有超时构造函数参数,而urllib2.urlopen()会忽略此参数。mechanize.Request具有超时构造函数参数,该参数用于设置相同名称的属性,mechanize.urlopen()不会忽略超时属性。

来源: http :
//wwwsearch.sourceforge.net/mechanize/documentation.html

- -编辑 - -

如果socket.setsockettimeout超时mechanize值或传递超时值的值较小但不适用于较高的值,则问题的根源可能会完全不同。一件事是您的库可能会打开多个连接(这里记为@CédricJulien),因此超时适用于socket.open的每次尝试,如果第一次失败就不会停止–可能需要timeout * num_of_conn几秒钟的时间。另一件事是socket.recv:如果连接确实很慢并且您不够幸运,则整个请求可能会占用timeout * incoming_bytes每个socket.recv我们可以得到一个字节的字节,并且每个这样的调用都可能占用timeout秒。由于您不太可能遭受这种黑暗的场景(每个超时秒一个字节?您必须是一个非常粗鲁的男孩)的痛苦,因此很可能需要花很长时间才能获得非常慢的连接和很高的超时。

您唯一的解决方案是对整个请求强制超时,但是这里与套接字无关。如果您使用的是Unix,则可以对ALARM信号使用简单的解决方案。您将信号设置为以timeout秒为单位发出信号,您的请求将被终止(不要忘记捕获它)。您可能希望使用with语句使其整洁易用,例如:

import signal, time

def request(arg):
  """Your http request"""
  time.sleep(2)
  return arg

class Timeout():
  """Timeout class using ALARM signal"""
  class Timeout(Exception): pass

  def __init__(self, sec):
    self.sec = sec

  def __enter__(self):
    signal.signal(signal.SIGALRM, self.raise_timeout)
    signal.alarm(self.sec)

  def __exit__(self, *args):
    signal.alarm(0) # disable alarm

  def raise_timeout(self, *args):
    raise Timeout.Timeout()

# Run block of code with timeouts
try:
  with Timeout(3):
    print request("Request 1")
  with Timeout(1):
    print request("Request 2")
except Timeout.Timeout:
  print "Timeout"

# Prints "Request 1" and "Timeout"

如果要比这更具便携性,则必须使用一些较大的枪,例如multiprocessing,这样您将生成一个流程来调用您的请求,并在过期时终止该请求。由于这是一个单独的过程,因此您必须使用某种方法将结果传输回您的应用程序multiprocessing.Pipe。示例如下:

from multiprocessing import Process, Pipe
import time

def request(sleep, result):
  """Your http request example"""
  time.sleep(sleep)
  return result

class TimeoutWrapper():
  """Timeout wrapper using separate process"""
  def __init__(self, func, timeout):
    self.func = func
    self.timeout = timeout

  def __call__(self, *args, **kargs):
    """Run func with timeout"""
    def pmain(pipe, func, args, kargs):
      """Function to be called in separate process"""
      result = func(*args, **kargs) # call func with passed arguments
      pipe.send(result) # send result to pipe

    parent_pipe, child_pipe = Pipe() # Pipe for retrieving result of func
    p = Process(target=pmain, args=(child_pipe, self.func, args, kargs))
    p.start()
    p.join(self.timeout) # wait for prcoess to end

    if p.is_alive():
      p.terminate() # Timeout, kill
      return None # or raise exception if None is acceptable result
    else:          
      return parent_pipe.recv() # OK, get result

print TimeoutWrapper(request, 3)(1, "OK") # prints OK
print TimeoutWrapper(request, 1)(2, "Timeout") # prints None

如果要强制在固定秒数后终止请求,您实际上没有太多选择。socket.timeout将为单个套接字操作(连接/接收/发送)提供超时,但是如果有多个套接字,则执行时间会很长。



 类似资料:
  • 问题内容: 看来AngularJS的不起作用。它不适用于数字字符串。难道我做错了什么?我应该使用吗? 我需要一些东西来查看字符串是否是一个数字(实际上是一个数字),除非我乘以1,否则我不会这么做,但是如果我这样做,那么它将始终为真。另外是不是一个数字(定义)等应该返回false。 问题答案: 在 JavaScript中 ,。 例如,如果需要将 字符串 识别为 Number ,则将其转换为 Numb

  • 问题内容: 因此,我的设置无法按我想要的方式工作。因此,每当我运行该程序时,它就会立即从0变为100。我尝试使用,任务,并尝试了,但没有任何尝试。 这是我的程序: @MadProgrammer这是我尝试做一名摆动工作人员并将每个名称写入文档并更新进度栏的尝试。该程序将达到86%左右并停止运行,永远不会创建完成的文档。该程序将创建一个空白文档。这是我首先创建的SwingWorker对象,这是两种方法

  • 问题内容: 我在JLayeredpane上有两个JPanels。其中一个显示pdf,重叠的一个具有透明背景(我使用过setOpaque(false))。现在,我可以将图形添加到透明面板中,这样看来我实际上是在注释pdf。我想要一个橡皮擦工具来删除这些注释。我尝试使用以下代码 其中path是由多条线构成的形状。现在,不是在先前的图形上绘制 透明线 ,而是绘制 黑线 。我要去哪里错了? 问题答案: 请

  • 问题内容: 这看起来有效,但无法正常工作。我希望菜单悬停时’huh’div不透明。我尝试了淡入/淡出效果,但效果很好,但只有一次很奇怪。 问题答案: 不带点使用:

  • 问题内容: 我正在编辑从tesseract ocr获得的一些电子邮件。 这是我的代码: 但是输出不正确。 输入: 输出: 但是,当我在每次替换后将结果分配给新的String时,它都能正常工作。为什么在同一字符串中连续分配不起作用? 问题答案: 您将在Javadoc中的String.replaceAll()中注意到,第一个参数是正则表达式。 句点()和管道()以及花括号()都有特殊的含义。您需要对它

  • 问题内容: 我正在编写3D绘画,但在Java中发现了问题。在代码的一部分中,它起作用了: 在另一种情况下,它不起作用: 你能告诉我如何使它工作吗?谢谢在我问之前,是的,它确实执行了那部分代码。 编辑: 哦,现在工作正常,谢谢 问题答案: 代替: