随笔分类 -  10.python

摘要:1.0 下载Python2.7x和Python3.5x版本 2.0 安装Python 3.0 配置环境变量,分别添加至path路径 4.0 只修改Python27文件中的.exe文件(这样系统默认为Python3.5) 将python.exe修改为python2.exe 5.0 如何在cmd中分别调 阅读全文
posted @ 2018-05-15 10:09 张老师的小黑屋 阅读(762) 评论(0) 推荐(0)
摘要:python实现微信接口——itchat模块 安装 sudo pip install itchat sudo pip install itchat 登录 itchat.auto_login() 这种方法将会通过微信扫描二维码登录,但是这种登录的方式确实短时间的登录,并不会保留登录的状态,也就是下次登 阅读全文
posted @ 2018-04-28 15:02 张老师的小黑屋 阅读(4088) 评论(0) 推荐(0)
摘要:背景 现在的登录系统几乎都是带验证手段的,至于验证的手段也是五花八门,当然用的最多的还是验证码。不过纯粹验证码识已经是很落后的东西了,现在比较多见的是滑动验证,滑动拼图验证(这个还能往里面加广告)、点击图片特定位置确认(同样能放广告),再或者谷歌的No-CAPTCHA。总之纯粹的验证码效果不好,成本 阅读全文
posted @ 2018-04-16 17:40 张老师的小黑屋 阅读(740) 评论(0) 推荐(0)
摘要:下面是split截取获得 >>> str = 'http://manualfile.s3.amazonaws.com/pdf/gti-chis-1-user-9fb-0-7a05a56f0b91.pdf'>>> print str.split()['http://manualfile.s3.amaz 阅读全文
posted @ 2018-04-16 14:50 张老师的小黑屋 阅读(12449) 评论(0) 推荐(0)
摘要:Cookie的使用 用 Python 来登录网站, 用Cookies记录登录信息, 然后就可以抓取登录之后才能看到的信息。 什么是cookies? Cookie,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密)。比如说有些网站需要登录后才能访问某个页面, 阅读全文
posted @ 2018-04-16 14:24 张老师的小黑屋 阅读(324) 评论(0) 推荐(0)
摘要:bs去除特定标签。 阅读全文
posted @ 2018-04-14 19:33 张老师的小黑屋 阅读(609) 评论(0) 推荐(0)
摘要:Python 模块EasyGui详细介绍 EasyGui 官网: EasyGui 官网: -http://easygui.sourceforge.net 官方的教学文档: 官方的教学文档: -easygui-docs-0.96\tutorial\index.html 小甲鱼翻译改编的教学文档: 小甲 阅读全文
posted @ 2018-04-14 15:47 张老师的小黑屋 阅读(13331) 评论(0) 推荐(0)
摘要:""" 1、读取文件的三个方法:read()、readline()、readlines() 2、三个方法均可接受一个变量用以限制每次读取的数据量,通常不使用该变量。 """ """ 关于read()方法: 1、读取整个文件,将文件内容放到一个字符串变量中 2、如果文件大于可用内存,不可能使用这种处理 """ file_object = open("test.py",'r') #创建一个文件对象... 阅读全文
posted @ 2018-03-30 22:54 张老师的小黑屋 阅读(1484) 评论(0) 推荐(0)
摘要:本篇文章主要写一下如何通过pycharm客户端来上传下载代码。 安装Git 在Windows上使用Git,可以从Git官网直接下载安装程序,(网速慢的同学请移步国内镜像),然后按默认选项安装即可。 安装完成后,在开始菜单里找到“Git”->“Git Bash”,蹦出一个类似命令行窗口的东西,就说明G 阅读全文
posted @ 2018-03-30 17:50 张老师的小黑屋 阅读(354) 评论(0) 推荐(0)
摘要:1.获取糗事百科url http://www.qiushibaike.com/hot/page/2/ 末尾2指第2页 2.分析页面,找到段子部分的位置, 需要一点CSS和HTML的知识 3、编写代码 4、执行以下,结果如下: 阅读全文
posted @ 2018-03-29 22:54 张老师的小黑屋 阅读(403) 评论(1) 推荐(0)
摘要:1 #-*-coding:utf-8-*- 2 3 #1、字典 4 dict = {'name': 'Zara', 'age': 7, 'class': 'First'} 5 6 #字典转为字符串,返回: {'age': 7, 'name': 'Zara', 'class': 'First'} 7 print type(str(dict)), str(dict) 8 9... 阅读全文
posted @ 2018-03-28 23:44 张老师的小黑屋 阅读(485) 评论(0) 推荐(0)
摘要:python使用代理访问服务器主要有一下3个步骤: 1.创建一个代理处理器ProxyHandler: proxy_support = urllib.request.ProxyHandler(),ProxyHandler是一个类,其参数是一个字典:{ '类型':'代理ip:端口号'} 什么是Handl 阅读全文
posted @ 2018-03-28 23:42 张老师的小黑屋 阅读(2455) 评论(0) 推荐(0)
摘要:1. Beautiful Soup 简介 简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下: Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的 阅读全文
posted @ 2018-03-26 18:36 张老师的小黑屋 阅读(45273) 评论(2) 推荐(4)
摘要:一、安装 pip install threadpool 二、使用介绍 (1)引入threadpool模块 (2)定义线程函数 (3)创建线程 池threadpool.ThreadPool() (4)创建需要线程池处理的任务即threadpool.makeRequests() (5)将创建的多个任务p 阅读全文
posted @ 2018-03-26 16:14 张老师的小黑屋 阅读(47947) 评论(1) 推荐(2)
摘要:自动 1、设置动态的user agent 2、设置代理池 阅读全文
posted @ 2018-03-26 10:44 张老师的小黑屋 阅读(618) 评论(0) 推荐(0)
摘要:下载beautifulsoup, 下载地址:https://www.crummy.com/software/BeautifulSoup/bs4/download/ 下载完成之后,解压到一个文件夹,用cmd控制台进入解压目录,输入: python setup.py install 安装成功 阅读全文
posted @ 2018-03-25 21:48 张老师的小黑屋 阅读(3187) 评论(0) 推荐(1)
摘要:问题: 执行下面的语句时 出现以下异常: 分析: 出现上面的异常是因为用 urllib.request.urlopen 方式打开一个URL,服务器端只会收到一个单纯的对于该页面访问的请求,但是服务器并不知道发送这个请求使用的浏览器,操作系统,硬件平台等信息,而缺失这些信息的请求往往都是非正常的访问, 阅读全文
posted @ 2018-03-24 15:28 张老师的小黑屋 阅读(14205) 评论(0) 推荐(0)
摘要:【总结】 使用正则解析HTML比较繁琐,以上代码时为了练习正则所以使用正则来解析html,更建议使用专门的库; 出于模块化思想,所以把下载网页、获取网页中全部的链接、找出我们需要的链接、以及下载小说用不同的方法来编写; 编写过程中报了很多错,其中最棘手的还是怎么用正则解析html的标签,最后取了一个 阅读全文
posted @ 2018-03-22 16:30 张老师的小黑屋 阅读(471) 评论(0) 推荐(0)
摘要:【问题】 在执行代码时,提示上述错误,源码如下: 【解决过程】 1. 再次确认其编码格式,确实是utf-8; 2.此问题觉得很诡异的是,本身调用UTF-8去decode,但是解码出错却提示的是GBK的,而不是UTF-8相关解码出错。 3.找了其他帖子,尝试在解码时添加ignore 属性,但没有解决。 阅读全文
posted @ 2018-03-22 16:00 张老师的小黑屋 阅读(2007) 评论(0) 推荐(0)
摘要:本文以有道翻译为例作为讲解,使用的 python 3.5.2 版本 ,涉及到反爬虫手段有 sign签名、时间戳,逆向解析 js 来确定签名算法。 研究有道词典的反爬虫机制 1、打开有道词典 http://fanyi.youdao.com/,按下F12,输入要翻译的内容进行翻译,观察network。 阅读全文
posted @ 2018-03-08 22:14 张老师的小黑屋 阅读(445) 评论(0) 推荐(0)