随笔分类 - python
摘要:# 查看所有python版本 ls /usr/bin/python* # 查看python版本 python --version # 修改python版本 vi ~/.bashrc # 编辑文件添加内容 alias python='/usr/bin/python3.4' # 添加内容后,保存退出重新
阅读全文
摘要:''' 1、官网下载:https://github.com/tesseract-ocr/tessdata/tree/3.04.00,网上有相应的exe文件下载安装,安装完成后把安装目录加到环境变量中,需要重启电脑 。 可下载相应的语言训练包放到tessdata目录下chi_sim开头的是识别中文的训
阅读全文
摘要:''' Selenium 模拟浏览器爬取网页信息 一种是真实的浏览器,也即是在程序调用浏览器时,会打开相应的浏览器来显示, 如:chrome,ie,safari,firefox 一种是伪浏览器,没有浏览器界面,只负责处理html,js和cookie的功能。 如:htmlunit,phantomjs
阅读全文
摘要:# Author:toloy # 导入队列包 import queue # 导入线程包 import threading # 导入json处理包 import json # 导入xpath处理包 from lxml import etree # 导入请求处理包 import requests cla
阅读全文
摘要:# Author:toloy import requests import json from bs4 import BeautifulSoup # 创建session对象 sess = requests.session() # 登录的url url = "http://www.dfenqi.cn/
阅读全文
摘要:1、xpath解析网页源文件 from urllib import request from lxml import etree # 请求的url url = "http://www.dfenqi.cn/Product/Index" # 请求的头文件 headers = { "User-Agent"
阅读全文
摘要:from urllib import request import re # 请求的url url = "http://www.dfenqi.cn/Product/Index" # 请求的头文件 headers = { "User-Agent": "Mozilla/5.0 (Windows NT 1
阅读全文
摘要:from urllib import request # 导入需要引用cookie的包 from http import cookiejar import urllib.parse # 请求的url url = "http://www.jinri.com" # 请求的头文件 headers = {
阅读全文
摘要:from urllib import request # 请求的url url = "http://www.jinri.com" # 请求的头文件 headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/
阅读全文
摘要:from urllib import request url = "http://www.jinri.com" # 自定义handler handler = request.HTTPHandler() headers = { "User-Agent": "Mozilla/5.0 (Windows N
阅读全文
摘要:# python3导入request包 from urllib import request import sys import io # 如果需要用print打印时,如果出现异常可以先设置输出环境 sys.stdout = io.TextIOWrapper(sys.stdout.buffer, e
阅读全文

浙公网安备 33010602011771号