上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 41 下一页
摘要: ID选择器和class类选择器的不同是:每一个ID只能够被html调用一次,而css当中所编写的class则可以被html调用多次,我们使用ID选择器编写一个谷歌样式的字体,如果需要选择同样的颜色,则需要更换不同的id名称,使用class类选择器编写谷歌字体样式的网页如下: https://www. 阅读全文
posted @ 2021-02-01 13:32 Geeksongs 阅读(161) 评论(0) 推荐(0) 编辑
摘要: 假设我们想要实现谷歌首页这样的样式字体该怎么办呢?如下所示: 从中可以看到Google当中的G和小写的g均为蓝色,o和e均为红色,剩下的一个o和l分别为黄色和绿色。我们可以使CSS当中的class选择器来完成这字体的编写,首先我们使用span标签来表示Google这个单词如下所示: <!DOCTYP 阅读全文
posted @ 2021-02-01 13:17 Geeksongs 阅读(263) 评论(0) 推荐(0) 编辑
摘要: 一.为什么要动态IP代理? 当我们有时使用爬虫的时候,如果频繁对某一个界面请求过太多的次数,那么有些网站就会因为反爬虫的措施发现同一个IP地址对它请求了太多的次数,因此对我们的爬虫进行了禁止,你必须要登录这个网站才能够继续进行爬虫。这个时候呢,如果我们能够直接在请求网页的时候不断更换自己的IP地址, 阅读全文
posted @ 2021-01-31 11:30 Geeksongs 阅读(614) 评论(0) 推荐(0) 编辑
摘要: 在本篇博文当中,将会教会大家如何使用高性能爬虫,快速爬取并解析页面当中的信息。一般情况下,如果我们请求网页的次数太多,每次都要发出一次请求,进行串行执行的话,那么请求将会占用我们大量的时间,这样得不偿失。因此我们可以i使用高性能爬虫,也就是采用多进程,异步的方式对数据进行爬取和解析,这样就可以在更快 阅读全文
posted @ 2021-01-31 10:42 Geeksongs 阅读(322) 评论(0) 推荐(0) 编辑
摘要: 前言:字体反爬,也是一种常见的反爬技术,例如58同城,猫眼电影票房,汽车之家,天眼查,实习僧等网站。这些网站采用了自定义的字体文件,在浏览器上正常显示,但是爬虫抓取下来的数据要么就是乱码,要么就是变成其他字符,是因为他们采用自定义字体文件,通过在线加载来引用样式,这是CSS3的新特性,通过 CSS3 阅读全文
posted @ 2021-01-31 09:01 Geeksongs 阅读(784) 评论(0) 推荐(0) 编辑
摘要: 我们首先打开58同城的网站:观察网站的版面: 发现所有的title都是以h3开头,并且具有class为“ property-content-title-name ” 因此我们可以编写这样的程序即可得到整个版面的title,在程序当中使用Xpath表达式即可,使用起来非常方便: import requ 阅读全文
posted @ 2021-01-29 11:40 Geeksongs 阅读(867) 评论(0) 推荐(0) 编辑
摘要: 假设我爬取了这样的一个html网页,前面的前端代码如下所示: <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>OK资源采集-最新影视资源大全</title> <meta http-equiv="Content-Type" conte 阅读全文
posted @ 2021-01-29 09:31 Geeksongs 阅读(460) 评论(0) 推荐(0) 编辑
摘要: 一.序列化简介 什么是序列化呢? 序列化:对象———》字节序列 反序列化:字节序列——》对象 备注:对象在内存(RAM)当中 字节序列:可以在磁盘(ROM)当中,也可以在网络当中进行传输 序列化的根本缘故:将对象从RAM里的数据 转化成ROM里的数据 二.序列化案例 我们这里将要编写的序列化的程序的 阅读全文
posted @ 2021-01-19 11:15 Geeksongs 阅读(178) 评论(0) 推荐(0) 编辑
摘要: 一.确定爬取思路 今天突发奇想,能不能使用python爬虫来爬取一些妹子图片呢,于是摩拳擦掌开始干了起来。首先打开网页htttps://gank.io 当中的妹子专栏, 发现里面全是妹子,如下所示: 网址如下所示: https://gank.io/special/Girl 翻到最下面发现按钮,一共有 阅读全文
posted @ 2021-01-16 14:12 Geeksongs 阅读(693) 评论(2) 推荐(0) 编辑
摘要: 一.实现案例 实现WorldCount的流程如下: 备注:其中输入的数据是一个txt文件,里面有各种单词,每一行中用空格进行空行 一.Mapper的编写 我们在IDEA是使用“ctrl+alt+鼠标左键点击”的方式来查看源码,我们首先查看mapper 类的源码,同时源码我已经使用了,如下所示: // 阅读全文
posted @ 2021-01-15 13:27 Geeksongs 阅读(226) 评论(0) 推荐(0) 编辑
上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 41 下一页

Coded by Geeksongs on Linux

All rights reserved, no one is allowed to pirate or use the document for other purposes.