随笔分类 - 爬虫
摘要:搞科研的小伙伴总是会被期刊严苛的引用文献格式搞的很头疼。虽然常用的文献软件可以一键导出BibTex,但由于很多论文在投稿之前都会先发上Arxiv占坑,软件就很可能会把文献引出为来自Arxiv。我用的是Zotero,就有这个毛病。 因此,如果是IEEE的期刊,最好是直接去IEEE官网搜索并导出引用,否
阅读全文
摘要:python爬虫主要用两个库:Urllib和BeautifulSoup4。一个用来爬取网页,一个用来解析网页。 Urllib是Python内置的HTTP请求库,它包含四个模块: 1、request,最基本的 HTTP 请求模块,用来模拟发送请求,就像在浏览器里输入网址然后敲击回车一样,只需要给库方法
阅读全文

浙公网安备 33010602011771号