随笔分类 - ~ Python3&爬虫
摘要:Python 3 & 爬虫一些记录 [TOC] Python任何数据都看成一个“对象”,变量指向数据对象,对变量赋值就是把数据和变量给关联起来。 Python的整数没有大小限制浮点数也没有大小限制,但是超出一定范围就直接表示为inf(无限大)。 ord()函数获取字符的整数表示,chr()函数把编码
阅读全文
摘要:Python3微博爬虫[requests+pyquery+selenium+mongodb] 大数据时代,数据的获取对是研究的基础,而获取海量的数据自然不能通过人工获取,爬虫因运而生。微博作为新时代国内火爆的社交媒体平台,拥有大量用户行为和商户数据,学会通过爬虫获取所需数据将是将来研究学者的必备技能
阅读全文
摘要:深圳杯D题爬取电视收视率排行榜 [TOC] 站点分析 http://www.tvtv.hk/archives/category/tv 每天的排行版通过静态页面发布,先获取每天的排行榜链接,再进一步从链接里面获取数据 每天前10的信息发布在p标签内,存储的时候空格拆分一下 代码实现 获取每一页的静态链
阅读全文
摘要:Pycharm打造高效Python IDE 建议以 scientific mode运行 ,在科学计算时,可以方便追踪变量变化,并且会提示函数的用法,比普通模式下的提示更加智能,一般在文件中引入了numpy等科学计算包时会自动识别,并提示使用scientific mode模式。 具体步骤: Setti
阅读全文
摘要:pycharm新建项目后运行按钮为灰色 第一次运行需要先为项目创建解释器,第一次可以对项目右键选中Run或者Ctrl+Shift+F10自动为项目创建解释器 或者手动Run->Edit Configurations-> + →新建python指定Scrip path为当前xxx.py的路径
阅读全文
摘要:[爬虫Demo] pyquery+csv爬取猫眼电影top100 [TOC] 站点分析 https://maoyan.com/board/4?offset=0 翻页操作只会改变offset偏移量,每部电影的信息都在dd标签内,使用pyquery库中的css选择器直接解析页面 代码君 css选择器直接
阅读全文

浙公网安备 33010602011771号