python requests库怎么获取浏览器的所有请求

python requests库怎么获取浏览器的所有请求
在Python中，使用requests库本身并不能直接捕获浏览器发出的所有请求，因为requests库主要用于发起HTTP请求，而不是监控或捕获浏览器发出的请求。但是，你可以通过几种方法来间接地实现或模拟浏览器的行为，从而获取或模拟浏览器发出的请求。

方法1：使用Selenium
Selenium是一个强大的工具，可以模拟浏览器行为，包括打开网页、点击按钮、填写表单等。它能够捕获浏览器发出的所有网络请求。

from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities

设置Chrome WebDriver

driver = webdriver.Chrome()

访问一个网页

driver.get("http://example.com")

获取所有网络请求

logs = driver.get_log('performance')
for log in logs:
message = json.loads(log['message'])['message']
if message['method'] == 'Network.requestWillBeSent':
print(message)

driver.quit()
方法2：使用BrowserMob Proxy
BrowserMob Proxy可以捕获浏览器发出的所有HTTP请求和响应，并且可以用于测试和监控。它提供了一个简单的API来控制代理服务器和获取网络流量数据。

from browsermobproxy import Server
from selenium import webdriver

启动BrowserMob Proxy服务器

server = Server("path/to/browsermob-proxy")
server.start()
proxy = server.create_proxy()

配置Selenium使用BrowserMob Proxy

profile = webdriver.FirefoxProfile()
profile.set_proxy(proxy.selenium_proxy())
driver = webdriver.Firefox(firefox_profile=profile)

访问一个网页

driver.get("http://example.com")

获取所有请求和响应

entries = proxy.har # 这是一个HAR文件对象，包含了所有网络请求和响应的详细信息
print(entries)

关闭BrowserMob Proxy服务器和浏览器实例

proxy.close()
server.stop()
driver.quit()
方法3：使用mitmproxy或Wireshark进行网络抓包
如果你需要捕获和分析网络层面的数据包，可以使用mitmproxy或者Wireshark。这些工具可以在系统级别捕获所有经过的网络流量，包括浏览器发出的请求。

使用mitmproxy:
from mitmproxy import http, ctx, options, flowfilter, controller, script, addonmanager, http_async, websockets, websockets_async, websockets_flow, websockets_script, websockets_addonmanager, websockets_http_async, websockets_http_flow, websockets_http_script, websockets_http_addonmanager, websockets_websockets, websockets_websockets_async, websockets_websockets_flow, websockets_websockets_script, websockets_websockets_addonmanager
from mitmproxy.tools.dump import DumpMaster

配置mitmproxy的DumpMaster来保存HTTP流量到文件

options.listen_port = 8080 # 监听端口，可以根据需要修改
options.listen_host = "127.0.0.1" # 监听地址，可以根据需要修改
options.save_stream_file = "output.txt" # 输出文件路径
dump = DumpMaster(options)
dump.run() # 运行mitmproxy的DumpMaster来捕获流量并保存到文件
然后你可以通过浏览器设置代理为127.0.0.1:8080来捕获所有通过浏览器的HTTP请求。

总结：
每种方法都有其适用场景。如果你需要模拟浏览器行为并获取网络请求，使用Selenium或BrowserMob Proxy是较好的选择。如果你需要捕获和分析网络层面的数据包，使用mitmproxy或Wireshark可能更合适。选择合适的方法取决于你的具体需求和场景。

posted @ 2025-07-20 22:37 赏金猎人小熊阅读(60) 评论(0) 收藏举报

刷新页面返回顶部

赏金猎人小熊

python requests库怎么获取浏览器的所有请求

设置Chrome WebDriver

访问一个网页

获取所有网络请求

启动BrowserMob Proxy服务器

配置Selenium使用BrowserMob Proxy

访问一个网页

获取所有请求和响应

关闭BrowserMob Proxy服务器和浏览器实例

配置mitmproxy的DumpMaster来保存HTTP流量到文件

公告