随笔分类 - Python
网络爬虫
摘要:最近在看原前清皇帝溥仪的自传《我的前半生》, 这本小说记载了自他登基以来经历的奢华的宫闱生活,对答应日寇加冕成为伪满皇帝站在人民对立面的忏悔,以及在我党红色政权的拯救以及接收共产主义的洗礼的无限感恩。小说中多次提到各个年号下的所发生的一些事件,所以我想通过爬虫来抓取这部小说出现的“光绪”,“宣统”两
阅读全文
摘要:1. 什么是网络爬虫? 在大数据时代,信息的采集是一项重要的工作,而互联网中的数据是海量的,如果单纯靠人力进行信息采集,不仅低效繁琐,搜集的成本也会提高。如何自动高效地获取互联网中我们感兴趣的信息并为我们所用是一个重要的问题,而爬虫技术就是为了解决这些问题而生的。 网络爬虫(Web crawler)
阅读全文

浙公网安备 33010602011771号