ShineLe - 博客园

2021年4月5日

摘要：学习自：手把手教你用Python爬取百度搜索结果并保存 - 云+社区 - 腾讯云如何利用python模拟百度搜索,Python交流,技术交流区,鱼C论坛指定关键字，对其进行百度搜索，保存搜索结果，记录下搜索的内容和标题思路：首页：https://www.baidu.com/s?wd=* （将阅读全文

posted @ 2021-04-05 21:58 ShineLe 阅读(5322) 评论(0) 推荐(1)

Python：Scrapy（三）进阶：额外的一些类ItemLoader与CrawlSpider，使用原理及总结

摘要：学习自：Python Scrapy 爬虫框架实例（一） - Blue·Sky - 博客园这一节是对前两节内容的补充，涉及内容为一些额外的类与方法，来对原代码进行改进原代码：这里并没有用前两节的代码，而是用了另一个爬虫的代码，作用是爬取千图网的图片信息。该爬虫的基本信息：项目名：AdilCraw 阅读全文

posted @ 2021-04-05 15:39 ShineLe 阅读(232) 评论(0) 推荐(0)

2021年4月1日

Linux：常用指令

摘要：全部：Linux常用命令 - SegmentFault 思否 wget 与 curl 命令详解 - SegmentFault 思否十万字Linux命令大全cat详细教程（一）_川川菜鸟的博客-CSDN博客规则与技巧 ctrl+k //剪切(删除)光标处到行尾的所有字符 ctrl+u //剪切光标阅读全文

posted @ 2021-04-01 21:52 ShineLe 阅读(120) 评论(0) 推荐(0)

Pycharm：在Pycharm中使用控制台命令

摘要：最下方跟Console同行的Terminal，其中输入指令就相当于在cmd命令行窗口输入指令阅读全文

posted @ 2021-04-01 12:26 ShineLe 阅读(2139) 评论(0) 推荐(0)

2021年3月31日

VMware：用Ubuntu创建一个新的虚拟机

摘要： 1）进入VMware，选择创建新虚拟机 2）安装ISO文件 3）各种名，密码这里有可能出错：原因是你输入的用户名和系统用户名重复了，修改一下就可以了 4）安装位置；这里可以是任意盘，但至少要有4G大小这里修改时有个窍门，直接把C改成E，把中间多余的目录删去，这样不用我们额外创建文件夹，系统会自阅读全文

posted @ 2021-03-31 16:50 ShineLe 阅读(781) 评论(0) 推荐(0)

Ubutun：镜像网站

摘要：中科大镜像站（地址：安徽）：http://mirrors.ustc.edu.cn清华大学镜像站：http://mirrors.tuna.tsinghua.edu.cn浙江大学镜像站：http://mirrors.zju.edu.cn重庆大学镜像站：http://mirrors.cqu.edu.cn兰阅读全文

posted @ 2021-03-31 15:33 ShineLe 阅读(168) 评论(0) 推荐(0)

VMware：安装过程

摘要：写在最前：VMware workstation用于个人的虚拟机安装，可直接去https://support.broadcom.com/group/ecx/downloads（需要注册）下载Workstation-Player版本，这个版本是免费的。大多数过程学习自vmware workstatio 阅读全文

posted @ 2021-03-31 15:00 ShineLe 阅读(47) 评论(0) 推荐(0)

2021年3月30日

XPath

摘要：学习自： XPath官方文档 XPath 教程 lxml+Xpath实现爬虫ck784101777的博客-CSDN博客 0、简介 XPath是一门在XML文档中查找信息的语言。 Xpath可以用于在XML文档中对元素和属性进行遍历。 XPath是W3C XSLT标准的主要元素，并且XQuery和XP 阅读全文

posted @ 2021-03-30 18:51 ShineLe 阅读(250) 评论(0) 推荐(0)

在用Scrapy进行爬虫时碰到的错误

摘要： 1、module() takes at most 2 arguments (3 given) 解决方法：导入Spider类时，是from scrapy import Spider而不是from scrapy.spiders import Spider；个人猜测可能是因为Python2和3版本差异引起阅读全文

posted @ 2021-03-30 10:50 ShineLe 阅读(379) 评论(0) 推荐(0)

2021年3月29日

Python：Scrapy（二）实例分析与总结、写一个爬虫的一般步骤

摘要：学习自：Scrapy爬虫框架教程（二）-- 爬取豆瓣电影TOP250 - 知乎 Python Scrapy 爬虫框架实例（一） - Blue·Sky - 博客园 1、声明Item 爬虫爬取的目标是从非结构性的数据源提取结构性的数据，例如网页。Spider可以以Dict类型来返回提取的数据。然而，虽然阅读全文

posted @ 2021-03-29 23:46 ShineLe 阅读(716) 评论(0) 推荐(0)

ShineLee

公告