2020年3月9日
摘要: 运用selenium、urllib抓取51job上的python岗位任职要求,形成一个txt文本: import selenium #测试框架 import selenium.webdriver #模拟浏览器 import re import urllib import urllib.request 阅读全文
posted @ 2020-03-09 11:05 共感的艺术 阅读(308) 评论(0) 推荐(0) 编辑
摘要: 爬取的51job上的python岗位任职要求,形成了词云: # coding:utf-8 import jieba #分词 import matplotlib.pyplot as plt #数据可视化 import wordcloud from wordcloud import WordCloud, 阅读全文
posted @ 2020-03-09 10:58 共感的艺术 阅读(211) 评论(0) 推荐(0) 编辑
摘要: python3中的词云,通过添加文本,以及图片和字体路径,自定义生成词云: # coding:utf-8 import jieba #分词 import matplotlib.pyplot as plt #数据可视化 import wordcloud from wordcloud import Wo 阅读全文
posted @ 2020-03-09 10:56 共感的艺术 阅读(1337) 评论(0) 推荐(0) 编辑
摘要: python3中的词云,用到jieba来进行分词: import jieba mystr="我今天早上遇到一个美女要电话,美女说你有病,我回答正是因为你我才害了相思病" """ sg_list=jieba.cut(mystr,cut_all=True) #普通切割 print("/".join(sg 阅读全文
posted @ 2020-03-09 10:52 共感的艺术 阅读(310) 评论(0) 推荐(0) 编辑
摘要: python3中的matplotlib绘图,绘制51job上抓取的python各职位的树形图: import selenium #测试框架 import selenium.webdriver #模拟浏览器 import re import matplotlib import matplotlib.p 阅读全文
posted @ 2020-03-09 10:50 共感的艺术 阅读(364) 评论(0) 推荐(0) 编辑
摘要: python3中的绘图,用到 matplotlib,没有安装可以 pip install matplotlib 进行安装: import matplotlib import matplotlib.pyplot as plt #数据可视化 matplotlib.rcParams["font.sans- 阅读全文
posted @ 2020-03-09 10:47 共感的艺术 阅读(1271) 评论(0) 推荐(0) 编辑
  2020年3月8日
摘要: python3中的urllib库进行模拟登录人人网,这里主要是登录人人网成功后,把登录后的cookie复制到headers里,进行模拟登陆,然后保存到本地html。 from urllib import request url ="http://www.renren.com/967952300/pr 阅读全文
posted @ 2020-03-08 11:10 共感的艺术 阅读(215) 评论(0) 推荐(0) 编辑
摘要: python3中urllib库进行模拟登录,这里主要是保存cookie,以访问人人网为例: import http.cookiejar from urllib import parse #创建一个对象,存储cookie cookie = http.cookiejar.CookieJar() #创建一 阅读全文
posted @ 2020-03-08 11:06 共感的艺术 阅读(301) 评论(0) 推荐(0) 编辑
摘要: python3中的urllib库对于cookie使用,下面整理了四种方法: 一、readcookie import urllib.request import http.cookiejar URL_ROOT = "http://www.baidu.com" cookie = http.cookiej 阅读全文
posted @ 2020-03-08 11:03 共感的艺术 阅读(572) 评论(0) 推荐(0) 编辑
摘要: 之前访问百度的时候,代码总会出现请求超时,不知道什么原因,学了的https后,解决了这个问题: import urllib import urllib.request import ssl #导入Python SSL处理模块 #如果网站的SSL证书是经过CA认证,就需要单独处理SSL证书,让程序忽略 阅读全文
posted @ 2020-03-08 10:51 共感的艺术 阅读(1332) 评论(0) 推荐(0) 编辑