【工作日常】Google 以图搜图调研

利用模拟http请求 , 检索并处理 html文本数据可以实现.

(性能方面考虑 , 优先考虑使用模拟请求的方式 , 最后兜底考虑 selenium driver)

如果网页的数据结构变化 , 要重新编写检索和处理文本数据的逻辑.

使用工具:

fiddler , chrome , 代码实现 http 请求以及响应处理

过程:

抓到请求的结果具体见文档:Google 以图搜图核心请求

最终确认 :

请求一的变量关键有两个:

图片url
请求头需要 User-Agent (例如 Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3)

请求二的变量关键有两个:

我命名为 imageKey , 是在请求一返回的响应 html 数据中 (例子 : lens-web-standalone-prod/4020b005-4ded-4bd7-af47-31a5d7bc4bb7)
我命名为 imageToken , 是在请求一返回的响应 html 数据中 (例子:EkcKJDVmMDc3Y2M1LTU1ZTYtNGQ5My05Y2VhLWRhZGVmNTQ3MmQ0ZRIfazBBMDhjSVYzRElXOEdtc3p4TWZDbHRYUU1jQi1oZw\u003d\u003d)

posted @ 2024-12-02 19:42 rongbu2 阅读(73) 评论(0) 收藏举报

刷新页面返回顶部

rongbu2