摘要: 第一方法用第三方库(requests):参考http://www.mamicode.com/info-detail-1839685.html 源代码分析 博客园的登录页面非常简单,查看网页源代码,可以发现两个输入框的id分别为input1、input2,复选框的id为remember_me,登录按钮 阅读全文
posted @ 2017-06-11 23:43 古怪的一阵风 阅读(4683) 评论(1) 推荐(1) 编辑
摘要: 第一个print输出: ef 第二个输出: A变到Z(没有换行,每次都是一个字母显示,下一个字母替换上一个字母) \r 默认表示将输出的内容返回到第一个指针,这样的话,后面的内容会覆盖前面的内容 PyCharm控制台中显示,\r真正实现了其回车的功能(回到某行开头,把前面的输出覆盖了,其实在PyCh 阅读全文
posted @ 2017-06-11 23:19 古怪的一阵风 阅读(3458) 评论(0) 推荐(0) 编辑
摘要: 新浪新闻内容采用的是ajax动态显示内容,通过抓包,发现如下规律: 每次请求下一页,js那一栏都会出现新的url: 阅读全文
posted @ 2017-06-11 14:24 古怪的一阵风 阅读(2705) 评论(0) 推荐(1) 编辑
摘要: 一、解决请求路径中含义中文或特殊字符(/n,/t等): 1 httpurl=urllib.parse.quote(new_url, safe=string.printable) 注意:new_url必须是只有一个单引号或者双引号,如果是下面这个既有单引号,也有双引号,就会出现urlerror: ne 阅读全文
posted @ 2017-06-11 14:12 古怪的一阵风 阅读(2144) 评论(0) 推荐(0) 编辑
摘要: python贪婪和非贪婪 正则表达式通常用于在文本中查找匹配的字符串。Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字符;非贪婪则相反,总是尝试匹配尽可能少的字符。在"*","?","+","{m,n}"后面加上?,使贪婪变成非贪婪。 >>> s="Thi 阅读全文
posted @ 2017-06-11 13:46 古怪的一阵风 阅读(30538) 评论(0) 推荐(0) 编辑
摘要: 原因在于:字符串里用单引号来标识字符。 解决办法如下:将字符串里的单引号替换成双引号 对于带u'的字符串,u也要去掉: 1 >>> c=f.read() 2 >>> c 3 "{u'meta': {u'code': 200, u'requestId': u'5815f6739fb6b77494061 阅读全文
posted @ 2017-06-11 12:57 古怪的一阵风 阅读(18819) 评论(0) 推荐(0) 编辑