会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
vivi~
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
6
7
8
9
10
11
12
13
14
下一页
2017年7月26日
pandas 处理 excel
摘要: 先写下来,以免后续忘记,有很多都是之前用过的, 依旧忘!!! 嘤嘤嘤 用0 或者 -- 或者任意你喜欢的东东替换掉nan,这个float类型的nan真的是好讨厌 直接去掉nan 也可以写成 data_file.loc[2:12,'T2']
阅读全文
posted @ 2017-07-26 14:24 vivi~
阅读(288)
评论(0)
推荐(0)
2017年7月15日
3.6的pprint写法改变了:pprint.pprint()
摘要: 要用pprint.pprint()
阅读全文
posted @ 2017-07-15 16:37 vivi~
阅读(259)
评论(0)
推荐(0)
2017年7月14日
版本优化-test
摘要: 版本优化 标签(空格分隔): 测试 需求经手人太多,直接提bug,开发不乐意,跟Leader确认不靠谱,跟PM确认,不熟悉流程,跟第三方PM确认靠谱了,结果被开发三言两语,变成了不改bug 而改需求 ————多沟通,除此之外,别无他法 目标对象包括素材、文字、图片、背景,不一样的场景,包含的目标对象
阅读全文
posted @ 2017-07-14 17:37 vivi~
阅读(183)
评论(0)
推荐(0)
2017年7月12日
python爬取豆瓣小组700+话题加回复啦啦啦python open file with a variable name
摘要: 需求:爬取豆瓣小组所有话题(话题title,内容,作者,发布时间),及回复(最佳回复,普通回复,回复_回复,翻页回复,0回复) 解决:1. 先爬取小组下,所有的主题链接,通过定位nextpage翻页获取总过700+条话题; 2. 访问700+ 链接,在内页+start=0中,获取话题相关的四部分(话
阅读全文
posted @ 2017-07-12 16:59 vivi~
阅读(864)
评论(2)
推荐(0)
爬豆瓣被封的解决方案
摘要: 之前settings.py 中下图是注释掉的,: 现在把它放开,赋值3(意思是3秒) 现在700多个话题的豆瓣小组,可以顺利爬下 比较懒,感觉代理池会不会很复杂呀,什么的。 不过,设置了爬取的时间间隔,确实慢了很多。 代理池还是要用起来
阅读全文
posted @ 2017-07-12 16:32 vivi~
阅读(1393)
评论(0)
推荐(0)
2017年7月9日
去除列表中字符串中的空格换行等
摘要: for x in topic_replay:# 去掉在x左右的空白,\t,\n和\r字符. x1 = x.strip(' \t\n\r') if x1 !='': topic_replay_end.append(x1) # 先将文章中的\r 都去掉,有些单独的'\r' 就变成了空的列表元素:'',再用if 来判断下就好了 artical...
阅读全文
posted @ 2017-07-09 17:19 vivi~
阅读(3028)
评论(0)
推荐(0)
scrapy 按顺序抓取text内容
摘要: 需求:获得如下li.clearfix 下的所有text,并且按顺序输出 1. x.css('div.reply-doc h4 a::text').extract(); 2. x.css('div.reply-doc h4::text').extract(); 3. x.css('div.reply-
阅读全文
posted @ 2017-07-09 17:13 vivi~
阅读(1237)
评论(0)
推荐(0)
2017年6月29日
LearnPython笔记:ex48 代码
摘要: 赶紧写上 ,一定有人着急要看,啊哈哈哈哈,嘻嘻 哈哈 不枉我起了个大早 利用什么碎片时间啊,真正能深入学习的,是需要大段大段不被打断的时间 1. 完全实现了如下几种输入数据; 2. 遗留:最后一个elif,而不是else,不知道咋写,先庆功;
阅读全文
posted @ 2017-06-29 18:17 vivi~
阅读(302)
评论(0)
推荐(0)
python3 判断大小写
摘要: 转自http://wangwei007.blog.51cto.com/68019/1134323# 一、pyhton字符串的大小写转换, 常用的有以下几种方法:# 1、对字符串中所有字符(仅对字母有效)的大小写转换, 有两个方法:print('just to test it'.upper()) #
阅读全文
posted @ 2017-06-29 11:57 vivi~
阅读(1672)
评论(0)
推荐(0)
2017年6月24日
for 循环新的写法==列表解析
摘要: 1. (for x in L1) 是一个可迭代对象; 2. 列表解析比for 循环快,列表解析的迭代在解释器内部是以C语言速度执行, 而不是手动python代码执行; (x+10 for x in L1) = for x in L1: L1.append(x+10) >>>for x in L1:
阅读全文
posted @ 2017-06-24 16:34 vivi~
阅读(1462)
评论(7)
推荐(0)
上一页
1
···
6
7
8
9
10
11
12
13
14
下一页
公告