随笔分类 -  python 爬虫 机器人

摘要:都在推荐用Requests库,而不是Urllib,但是读取网页的时候中文会出现乱码。 分析: r = requests.get(“http://www.baidu.com“) **r.text返回的是Unicode型的数据。 使用r.content返回的是bytes型的数据。 也就是说,如果你想取文 阅读全文
posted @ 2018-11-05 17:09 LLSix 阅读(1968) 评论(0) 推荐(0)
摘要:1 # coding:utf-8 2 3 4 class log(object): 5 6 def __init__(self, **kwargs): 7 ''' 8 ,:日志输出格式 9 #外层日志格式[时间,日志名,日志级别,日志信息] 10 #内层日志格式[函数名称,函数参数... 阅读全文
posted @ 2018-07-28 19:06 LLSix 阅读(778) 评论(0) 推荐(0)
摘要:1 # coding:utf-8 2 import os 3 4 cmd = {'arp': 'arp -a | find "', 5 'route': 'route PRINT ' 6 } 7 8 9 def win_mac_get(): 10 import socket 11 import re 12 s = soc... 阅读全文
posted @ 2018-07-27 17:28 LLSix 阅读(193) 评论(0) 推荐(0)
摘要:1.思维缜密的编程逻辑 2.满足明确的目的需求 3.运用现成的轮子加以改造 4.学会装饰自己的程序 5.化繁为简 6.多用配置文件作为入口 7.注意扩展兼容 阅读全文
posted @ 2018-07-12 10:32 LLSix 阅读(131) 评论(0) 推荐(0)
摘要:迭代器为类序列对象提供了一个类序列的接口。python的迭代无缝地支持序列对象,而且它还允许程序员迭代非序列类型,包括用户定义的对象。迭代器用起来很灵巧,你可以迭代不是序列但表现处序列行为的对象,例如字典的键、一个文件的行,等等。迭代器的作用如下: •提供了刻扩展的迭代器接口;•对列表迭代带来了性能 阅读全文
posted @ 2017-09-27 10:14 LLSix 阅读(164) 评论(0) 推荐(0)
摘要:实例: 阅读全文
posted @ 2017-09-26 18:10 LLSix 阅读(1338) 评论(0) 推荐(0)
摘要:例: 读取代码: 代码HTML需要进行decode('utf-8') 编译: 阅读全文
posted @ 2017-09-18 17:40 LLSix 阅读(781) 评论(0) 推荐(0)
摘要:例: 执行结果: Python 3.0中,exec是一个函数不是一个语句了,因此使用exec('字符串语句')的方式来调用 exec "print 'hello'"执行命令打印出hello 阅读全文
posted @ 2017-09-09 17:37 LLSix 阅读(531) 评论(0) 推荐(0)