随笔分类 -  Python爬虫

摘要:import jsonimport reimport requestsfrom bs4 import BeautifulSoupfrom requests import RequestExceptionfrom multiprocessing import Pooldef get_one_page( 阅读全文
posted @ 2017-05-13 18:27 云ime 阅读(607) 评论(0) 推荐(0)
摘要:截止今天,关于精准广告定向技术的介绍已经全部写完。介绍的写作初衷是总结自己的知识,将知识从片段的、隐形的转化为可以向别人讲述、能够给人帮助的。在总结的过程中自己也提升了很多,同时希望这些内容能够切实的给刚进入这个行业的同学们以帮助。 一、基础知识篇: Http Header之User-Agent U 阅读全文
posted @ 2017-04-28 11:26 云ime 阅读(927) 评论(0) 推荐(0)
摘要:今天写python,将网上数据流编写进文件里时遇到的,网上搜到结果并正确的进行了处理,把原文解决方法拷过来了,嘿嘿 使用Python写文件的时候,或者将网络数据流写入到本地文件的时候,大部分情况下会遇到:UnicodeEncodeError: ‘gbk’ codec can’t encode cha 阅读全文
posted @ 2017-04-27 22:04 云ime 阅读(380) 评论(0) 推荐(0)
摘要:潜伏了两天,认真学习了爬虫,现在开始模仿别人写我的小爬虫代码了,第一个爬虫开始扒一下新浪国内新闻:http://news.sina.com.cn/china/ 开始: 阅读全文
posted @ 2017-04-25 21:18 云ime 阅读(249) 评论(0) 推荐(0)