03 2017 档案

缓存的那些事
摘要:一般而言,现在互联网模式(一个网站或一个应用),整体流程可以概括描述为 浏览器→应用服务器→数据库或文件(存储)→应用服务器→浏览器,这是一个标准流程,通过浏览器(或App界面)发起请求,经过服务器、数据库计算整合后反馈浏览器呈现内容。随着互联网的普及,内容信息越来越复杂,使用者和访问量越来越大,我 阅读全文

posted @ 2017-03-27 09:09 cuiyubo 阅读(918) 评论(0) 推荐(1)

python中文资源大全
摘要:Python 资源大全中文版 我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列的资源整理。awesome-python 是 vinta 发起维护的 Python 资源列表,内容包括:Web框架、网络爬虫、网络内容提取、模板引擎、数据库、数据可视化、图片处理、文本处理、 阅读全文

posted @ 2017-03-20 09:19 cuiyubo 阅读(733) 评论(2) 推荐(1)

使用User Agent和代理IP隐藏身份
摘要:一、为何要设置User Agent 有一些网站不喜欢被爬虫程序访问,所以会检测连接对象,如果是爬虫程序,也就是非人点击访问,它就会不让你继续访问,所以为了要让程序可以正常运行,需要隐藏自己的爬虫程序的身份。此时,我们就可以通过设置User Agent的来达到隐藏身份的目的,User Agent的中文 阅读全文

posted @ 2017-03-13 09:21 cuiyubo 阅读(265) 评论(0) 推荐(0)

导航