上一页 1 ··· 8 9 10 11 12 13 14 15 下一页
摘要: 信息提取的一般方法方法一:完整解析信息的标记形式,再提取关键信息。XML JSON YAML需要标记解析器 例如:bs4库的标签树遍历优点:信息解析准确缺点:提取过程繁琐,速度慢 方法二:无视标记形式,直接搜索关键信息。搜索对信息的文本查找函数即可优点... 阅读全文
posted @ 2018-11-20 21:21 yorkmass 阅读(540) 评论(0) 推荐(0)
摘要: HTML就不做介绍了,太熟悉了,就是用各种标签进行标记XML以标签为主,来构建信息表达信息用于Internet上的信息交互与传递和Html非常接近,是Html的扩展XML学习教程:http://www.runoob.com/xml/xml-tutori... 阅读全文
posted @ 2018-11-20 10:14 yorkmass 阅读(245) 评论(0) 推荐(0)
摘要: 只要你提供的信息是标签,就可以很好的解析怎么使用BeautifulSoup库?from bs4 import BeautifulSoupsoup=BeautifulSoup('data','html.parser')例如:import requests... 阅读全文
posted @ 2018-11-19 11:19 yorkmass 阅读(968) 评论(0) 推荐(0)
摘要: 首先,我们找到一个能输入ip查询ip信息的网站,如ip138.com我们先随便输入一个ip,进行查询,得到的返回链接格式如:http://www.ip138.com/ips138.asp?ip=你要查询的ip地址接着我们就可以采用这个格式得到查看返回的... 阅读全文
posted @ 2018-11-18 13:59 yorkmass 阅读(1483) 评论(0) 推荐(0)
摘要: 图片爬取的代码r.content 文件的二进制格式Python引入了with语句来自动帮我们调用close()方法:open(path, ‘-模式-‘,encoding=’UTF-8’) w:以写方式打开,a:以追加模式打开 (从 EOF 开始, 必要... 阅读全文
posted @ 2018-11-18 13:40 yorkmass 阅读(217) 评论(0) 推荐(0)
摘要: 对于一些保护比较好的网站,他能识别你是用requests库对其进行访问,所以有些网站会禁止你用python对其进行访问所以我们可以修改发送给网站的头部信息,伪造浏览器对网站进行访问查看我们发送给网站的头部信息:r.request.headerskv={... 阅读全文
posted @ 2018-11-17 22:06 yorkmass 阅读(329) 评论(0) 推荐(0)
摘要: Requests库的安装:https://mp.csdn.net/postedit/83715574r=requests.get(url,params=None,**kwargs)这个r是Response对象url :拟获取页面的url链接params... 阅读全文
posted @ 2018-11-17 21:22 yorkmass 阅读(456) 评论(0) 推荐(0)
摘要: win10固然好用,但是对于一些比较老的电脑,更新可不是什么好事,他会导致一系列问题,比如卡机、蓝屏、系统崩溃等等,开启Windows自动更新,每次开机的时候还得等待系统更新,如果Windows在我们着急用电脑的时候,突然更新,那是一年非常糟糕的事情。... 阅读全文
posted @ 2018-11-09 14:34 yorkmass 阅读(698) 评论(0) 推荐(0)
摘要: 我们做web app的时候,可以做一个页面加载广告,在你网页加载的时候,先出现一段gif动图或者是海报。下面是实现页面加载动画的代码首先js代码的实现(function($){ $(window).load(function(){ ... 阅读全文
posted @ 2018-11-09 13:38 yorkmass 阅读(921) 评论(0) 推荐(0)
摘要: 最近的WIN10更新,对于一些老旧的电脑,总会发生蓝屏的情况,万一电脑蓝屏了,开不了机,我们这时候就需要用到U盘来重装系统了。重装系统我们这里主要介绍2017年之后出的电脑通用重装系统步骤,早期的电脑的步骤由于硬件差异需要修改bios配置,对于比较老版... 阅读全文
posted @ 2018-11-04 18:23 yorkmass 阅读(660) 评论(0) 推荐(0)
上一页 1 ··· 8 9 10 11 12 13 14 15 下一页