• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

cynchanpin

  • 博客园
  • 联系
  • 订阅
  • 管理

View Post

python使用get在百度搜索并保存第一页搜索结果

python使用get在百度搜索并保存第一页搜索结果


作者:vpoet

日期:大约在夏季

注:任意copy。不用在意我的感受


#coding:utf-8
import urllib
import urllib2
import re

"""
使用GET在百度搜索引擎上查询
此例演示怎样生成GET串,并进行请求.
"""
if __name__=="__main__":
    url = "http://www.baidu.com/s"
    search = [('w','QQ')]
    getString = url + "?" + urllib.urlencode(search)

    req = urllib2.Request(getString)
    fd = urllib2.urlopen(req)
    baiduResponse=""
    while 1:
        data= fd.read(1024)
        if not len(data):
            break
        baiduResponse+=data
    fobj=open("baidu.html",'w')
    fobj.write(baiduResponse)
    fobj.close()


搜索QQ保存的网页截图为:


打开看看:


再和百度搜索QQ的结果对照:


对的,是一样的。

我们保存的网页没有图片是由于我们仅仅保存的网页的html结构并没有将当中的图片链接从server上下载下来,懂了吧


posted on 2017-06-15 10:26  cynchanpin  阅读(1262)  评论(0)    收藏  举报

刷新页面返回顶部
 
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3