随笔分类 -  python

摘要:首语:开始准备认真学习爬虫了,先从基础的开始学起,比如先爬取微博的个人动态。 两个难点:获取动态加载的内容和翻页这两项操作。 对象:何炅的个人 分析过程: 首页url:https://weibo.com/hejiong?is_search=0&visible=0&is_all=1&is_tag=0& 阅读全文
posted @ 2018-05-01 23:11 cc成 阅读(5250) 评论(0) 推荐(0)
摘要:本篇介绍了StringIO和BytesIO的区别,并且用了大量代码来详细介绍 阅读全文
posted @ 2018-04-29 00:05 cc成 阅读(1758) 评论(0) 推荐(0)
摘要:本篇用代码详细地介绍了json.dump()和json.dumps() 阅读全文
posted @ 2018-04-28 23:55 cc成 阅读(1014) 评论(0) 推荐(0)
摘要:本篇介绍了如何上传多部分编码的文件,并介绍了流式上传和requests-toolbelt这个库的方法 阅读全文
posted @ 2018-04-28 23:50 cc成 阅读(3863) 评论(0) 推荐(0)
摘要:本篇介绍了Requests的get方法的具体用法,关于传递url参数,获得抓取的内容,如r.text,r.content,以及内容编码方式r.encoding,还讲了处理json数据的方法和如何传递http头 阅读全文
posted @ 2018-04-28 23:15 cc成 阅读(244) 评论(0) 推荐(0)
摘要:python的文件操作 阅读全文
posted @ 2018-04-27 22:50 cc成 阅读(457) 评论(0) 推荐(1)
摘要:本篇介绍了python的内置函数set的用法——用来去除重复元素,可以说是很方便的。 阅读全文
posted @ 2018-04-27 20:56 cc成 阅读(189) 评论(0) 推荐(0)