上一页 1 ··· 44 45 46 47 48 49 50 51 52 ··· 86 下一页
摘要: https://www.taobao.com/ #CrowTaobaoPrice.py import requests import re def getHTMLText(url):#获得网页信息 headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 1 阅读全文
posted @ 2020-07-09 17:26 木子欢儿 阅读(936) 评论(0) 推荐(0)
摘要: 正则表达式的概念 正则表达式的语法 Re库的基本使用 练习: >>> import re >>> match=re.search(r'[1-9]\d{5}','BIT 100081') >>> if match: print(match.group(0)) 100081 >>> 练习: >>> im 阅读全文
posted @ 2020-07-09 15:55 木子欢儿 阅读(343) 评论(0) 推荐(0)
摘要: http://www.zuihaodaxue.com/zuihaodaxuepaiming-zongbang-2020.html 代码: import requests from bs4 import BeautifulSoup import bs4 def getHTMLtext(url):#获取 阅读全文
posted @ 2020-07-09 10:28 木子欢儿 阅读(295) 评论(0) 推荐(0)
摘要: 配置Java开发环境 主要参考官方教程:https://code.visualstudio.com/docs/java/java-tutorial 1.先安装JDK JDK下载地址:https://www.oracle.com/java/technologies/javase-downloads.h 阅读全文
posted @ 2020-07-08 20:00 木子欢儿 阅读(11416) 评论(1) 推荐(3)
摘要: 三种信息标记形式的比较 代码: <person> <firstname>Tian</firstname> <lastname>Song</lastname> <address> <streetAddr>中关村南大街5号</streetAddr> <city>北京市</city> <zipcode>1 阅读全文
posted @ 2020-07-08 15:14 木子欢儿 阅读(278) 评论(0) 推荐(0)
摘要: BeautifulSoup库的安装 安装 pip install beautifulsoup4 测试是否安装成功 Python 3.8.3 (tags/v3.8.3:6f8c832, May 13 2020, 22:37:02) [MSC v.1924 64 bit (AMD64)] on win3 阅读全文
posted @ 2020-07-06 11:36 木子欢儿 阅读(180) 评论(0) 推荐(0)
摘要: 1.京东商品页面爬取 打开某一个京东页面 https://item.jd.com/69336974189.html 代码: import requests url="https://item.jd.com/69336974189.html" try: r=requests.get(url) r.ra 阅读全文
posted @ 2020-07-05 12:39 木子欢儿 阅读(367) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2020-07-05 11:13 木子欢儿 阅读(181) 评论(0) 推荐(0)
摘要: 什么是爬虫? 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。 其实通俗的讲就是通过程序去获取web页面上自己想要的数据,也就是自动抓取数据。 阅读全文
posted @ 2020-07-05 10:40 木子欢儿 阅读(347) 评论(0) 推荐(0)
摘要: 不知不觉,基本上每年都是进入 footer.php 修改博客网站底部 Copyright © 年份,但是往往是在年后好久才想起来要改下这个可有可无的数值,那么为了更好的维护好这些网站,降低自己的工作量,今天与大家分享下自动更新的方法。 版权年份自动更新代码 这里有两种方案,一种是插入javasscr 阅读全文
posted @ 2020-07-03 13:28 木子欢儿 阅读(1304) 评论(0) 推荐(0)
上一页 1 ··· 44 45 46 47 48 49 50 51 52 ··· 86 下一页