摘要: Scrapy框架是一套基于Twisted的异步处理框架,用Python实现的爬虫框架,相对于requests模块和urllib模块,我们只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片,适合爬取大量的数据,也是我们学习爬虫必须掌握的技能。 阅读全文
posted @ 2020-04-16 12:05 merlin& 阅读(679) 评论(5) 推荐(1) 编辑
摘要: 利用python的第三方模块制作有声小说 阅读全文
posted @ 2020-04-13 21:16 merlin& 阅读(1710) 评论(0) 推荐(0) 编辑
摘要: 熟悉Linux中的权限管理命令 阅读全文
posted @ 2020-04-12 14:34 merlin& 阅读(336) 评论(0) 推荐(0) 编辑
摘要: wordcloud是Python扩展库中一种将词语用图片表达出来的一种形式,通过词云生成的图片,我们可以更加直观的看出某篇文章的故事梗概。 阅读全文
posted @ 2020-03-29 18:27 merlin& 阅读(2119) 评论(1) 推荐(2) 编辑
摘要: 前几天下载了Webdriver模块,经过简单的研究,发现这个模块可以做很多有意思的事情,下面我就用一个实例来理解webdriver的此处操作(完整代码在文章末尾)。 阅读全文
posted @ 2020-03-25 18:37 merlin& 阅读(508) 评论(0) 推荐(1) 编辑
摘要: webdriver是一个驱动,需要与selenium配合使用,selenium是自动化测试和爬虫的专业模块,对于不同的浏览器需要不同的webdriver,这里我用的是ubuntu19.10的系统,以python语言作为示范语言,用chrome浏览器来演示测试结果。 阅读全文
posted @ 2020-03-19 21:17 merlin& 阅读(697) 评论(0) 推荐(0) 编辑
摘要: 熟悉Linux操作的文件管理命令 阅读全文
posted @ 2020-03-18 11:49 merlin& 阅读(163) 评论(0) 推荐(0) 编辑
摘要: GitHub是一个面向开源及私有软件项目的托管平台,因为只支持git 作为唯一的版本库格式进行托管,故名GitHub。 作为开源代码库以及版本控制系统,Github拥有超过900万开发者用户。随着越来越多的应用程序转移到了云上,Github已经成为了管理软件开发以及发现已有代码的首选方法。 下面就由我来给大家介绍Linux系统中如何将代码托管到github 阅读全文
posted @ 2020-03-17 18:04 merlin& 阅读(1806) 评论(0) 推荐(0) 编辑