目的:获取模拟浏览器时请求的参数,把参数带入headers 中, 使用requests 请求数据
#把browsermob-proxy-2.1.4 放入自己的电脑中,我放入的是F盘
server = Server(r'F:\browsermob-proxy-2.1.4\bin\browsermob-proxy.bat')
server.start()
proxy = server.create_proxy()
proxy.new_har("douyin", options={'captureHeaders': True, 'captureContent': True})
firfox 调用 browsermob-proxy 方法
profile = webdriver.FirefoxProfile()
profile.set_proxy(proxy.selenium_proxy())
driver = webdriver.Firefox(firefox_profile=profile)
chrome 调用 browsermob-proxy 方法
chrome_options = Options()
chrome_options.add_experimental_option('w3c', False)
chrome_options.add_argument('--proxy-server={0}'.format(proxy.proxy))
driver = webdriver.Chrome(chrome_options=chrome_options)
result = proxy.har # 返回值
for entry in result['log']['entries']: #循环获取需要的内容
pass
最后关闭 server.stop() 与 driver.quit()
这里存在个问题, 就是每次打开都会启动 java.exe,stop() 方法无法关闭 java.exe
解决办法:
方法一:修改 Remote 内的 class Server, 在
def __init__(self, path='browsermob-proxy', options=None): 方法中加入
self.command += ["java", "-Dapp.name=browsermob-proxy", "-Dbasedir=F:/browsermob-proxy-2.1.4/bin/browsermob-proxy", "-jar","F:/browsermob-proxy-2.1.4/lib/browsermob-dist-2.1.4.jar", '--port=%s' % self.port] 方法二:os.system("taskkill /F /IM java.exe) 杀死java.exe