yorkmass

摘要：信息提取的一般方法方法一：完整解析信息的标记形式，再提取关键信息。XML JSON YAML需要标记解析器例如：bs4库的标签树遍历优点：信息解析准确缺点：提取过程繁琐，速度慢方法二：无视标记形式，直接搜索关键信息。搜索对信息的文本查找函数即可优点... 阅读全文

posted @ 2018-11-20 21:21 yorkmass 阅读(542) 评论(0) 推荐(0)

摘要： HTML就不做介绍了，太熟悉了，就是用各种标签进行标记XML以标签为主，来构建信息表达信息用于Internet上的信息交互与传递和Html非常接近，是Html的扩展XML学习教程：http://www.runoob.com/xml/xml-tutori... 阅读全文

posted @ 2018-11-20 10:14 yorkmass 阅读(246) 评论(0) 推荐(0)

摘要：只要你提供的信息是标签，就可以很好的解析怎么使用BeautifulSoup库？from bs4 import BeautifulSoupsoup=BeautifulSoup('data','html.parser'）例如：import requests... 阅读全文

posted @ 2018-11-19 11:19 yorkmass 阅读(969) 评论(0) 推荐(0)

摘要：首先，我们找到一个能输入ip查询ip信息的网站，如ip138.com我们先随便输入一个ip,进行查询，得到的返回链接格式如：http://www.ip138.com/ips138.asp?ip=你要查询的ip地址接着我们就可以采用这个格式得到查看返回的... 阅读全文

posted @ 2018-11-18 13:59 yorkmass 阅读(1492) 评论(0) 推荐(0)

摘要：图片爬取的代码r.content 文件的二进制格式Python引入了with语句来自动帮我们调用close()方法：open(path, ‘-模式-‘,encoding=’UTF-8’) w：以写方式打开，a：以追加模式打开 (从 EOF 开始, 必要... 阅读全文

posted @ 2018-11-18 13:40 yorkmass 阅读(217) 评论(0) 推荐(0)

摘要：对于一些保护比较好的网站，他能识别你是用requests库对其进行访问，所以有些网站会禁止你用python对其进行访问所以我们可以修改发送给网站的头部信息，伪造浏览器对网站进行访问查看我们发送给网站的头部信息：r.request.headerskv={... 阅读全文

posted @ 2018-11-17 22:06 yorkmass 阅读(331) 评论(0) 推荐(0)

摘要： Requests库的安装：https://mp.csdn.net/postedit/83715574r=requests.get(url,params=None,**kwargs)这个r是Response对象url ：拟获取页面的url链接params... 阅读全文

posted @ 2018-11-17 21:22 yorkmass 阅读(459) 评论(0) 推荐(0)

摘要： win10固然好用，但是对于一些比较老的电脑，更新可不是什么好事，他会导致一系列问题，比如卡机、蓝屏、系统崩溃等等，开启Windows自动更新，每次开机的时候还得等待系统更新，如果Windows在我们着急用电脑的时候，突然更新，那是一年非常糟糕的事情。... 阅读全文

posted @ 2018-11-09 14:34 yorkmass 阅读(700) 评论(0) 推荐(0)

摘要：我们做web app的时候，可以做一个页面加载广告，在你网页加载的时候，先出现一段gif动图或者是海报。下面是实现页面加载动画的代码首先js代码的实现(function($){ $(window).load(function(){ ... 阅读全文

posted @ 2018-11-09 13:38 yorkmass 阅读(924) 评论(0) 推荐(0)

摘要：最近的WIN10更新，对于一些老旧的电脑，总会发生蓝屏的情况，万一电脑蓝屏了，开不了机，我们这时候就需要用到U盘来重装系统了。重装系统我们这里主要介绍2017年之后出的电脑通用重装系统步骤，早期的电脑的步骤由于硬件差异需要修改bios配置，对于比较老版... 阅读全文

posted @ 2018-11-04 18:23 yorkmass 阅读(662) 评论(0) 推荐(0)

I wanner be a nice coder