随笔分类 - python
摘要:[toc] 描述 爬取http://fundact.eastmoney.com/banner/pg.html ln网站的数据, 要求:爬取所有基金(有27页)的基金代码、基金名称、单位净值、日期、日增长率、近1周、近1月、近3月、近6月、近1年、近2年、近3年、今年来、成立来和手续费|起购金额。将爬
阅读全文
摘要:[toc] 描述 该链接爬取的是作者在CSDN上写的博文,我就研究爬取一下我自己在博客园上的博文吧。 这是我的博客园首页:http://www.cnblogs.com/wsygdb/default.html 确定要提取的信息: 1.标题 2.发布日期 3.文章链接 4.浏览量 5.评论量 确认hea
阅读全文
摘要:描述 今天学习写一篇用python(我的是Python 3.6)登录知乎网(https://www.zhihu.com) 的爬虫,测试时报错:urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed 原因分析 查
阅读全文
摘要:Python 3的源码.py文件的默认编码方式为UTF 8(Python 2.x的默认编码格式为unicode)。 encode的作用,使我们看到的直观的字符转换成计算机内的字节形式。 decode刚好相反,把字节形式的字符转换成我们看的懂的、直观的、“人模人样”的形式。 下面给个例子: 输出结果:
阅读全文