上一页 1 ··· 18 19 20 21 22 23 24 25 26 ··· 41 下一页
摘要: 待续。。。 阅读全文
posted @ 2017-07-19 23:51 宝山方圆 阅读(1607) 评论(0) 推荐(0)
摘要: 数据来源:Python爬取新浪微博评论数据,写入csv文件中 本文等同:筛选出一段文字中的中文 阅读全文
posted @ 2017-07-19 23:46 宝山方圆 阅读(553) 评论(0) 推荐(0)
摘要: 因为新浪微博网页版爬虫比较困难,故采取用手机网页端爬取的方式 操作步骤如下: 1. 网页版登陆新浪微博 2.打开m.weibo.cn 3.查找自己感兴趣的话题,获取对应的数据接口链接 4.获取cookies和headers 至于爬出来的数据有非中文的数据,要提取中文请参考:筛选出一段文字中的中文 未 阅读全文
posted @ 2017-07-19 23:42 宝山方圆 阅读(7403) 评论(19) 推荐(1)
摘要: 取出文档中的中文 待续。。。 阅读全文
posted @ 2017-07-19 23:26 宝山方圆 阅读(2685) 评论(0) 推荐(0)
摘要: 偶然了解到 Python 里的 itchat 包,它已经完成了 wechat 的个人账号 API 接口,使爬取个人微信信息更加方便。 于是乎玩心一起,打算爬一下自己的微信。 步骤核心: 网页启动notebook pip安装itchat包 登录微信,扫描二维码 获取好友信息 有了上面的friends数 阅读全文
posted @ 2017-07-19 11:06 宝山方圆 阅读(1636) 评论(0) 推荐(0)
摘要: 当需要对表进行ddl操作如加索引、增删列时,数据量小时直接在线修改表结构影响不大当表达到百万、千万数据就不能直接在线修改表结构下面是具体的过程:1、备份数据select * from ih_order into outfile '/bak/order.txt';mysql> select * fro 阅读全文
posted @ 2017-07-17 17:30 宝山方圆 阅读(657) 评论(0) 推荐(0)
摘要: 使用命令:JPS #jps 报错了 df -h发现某一个满的分区 清理一些无关数据,恢复正常 【转自】:http://blog.csdn.net/u012965373/article/details/51984806 阅读全文
posted @ 2017-07-11 09:40 宝山方圆 阅读(3504) 评论(0) 推荐(0)
摘要: 修改kafka的partition分区 bin/kafka-topics.sh --zookeeper datacollect-2:2181 --alter --partitions 3 --topic client-agent-1 修改kafka副本数 官网解释如下: 准备json文件: 开始执行 阅读全文
posted @ 2017-07-08 17:22 宝山方圆 阅读(2689) 评论(0) 推荐(0)
摘要: Skill简介: 来源:好奇心、探索欲、趣味性; 资源:百度百科; 方式:实时获取,自动更新; 技能玩法: 想要进入历史上的今天这个skill,则对若琪说:若琪,打开历史上的今天。 想要了解某天的历史,则对若琪说:若琪,我想了解6月8号,若琪便会回复历史上6月8号的历史。 由于每天的历史相对较长,如 阅读全文
posted @ 2017-07-08 13:27 宝山方圆 阅读(1050) 评论(0) 推荐(0)
摘要: 1. DEL 直接加键名称 DEL key1 key2 key3 127.0.0.1:6379> DEL site_msg_99973 false site_msg_99974 false site_msg_99979false 2. 批量删除key 可用keys ‘str*’ 列出要删除的key, 阅读全文
posted @ 2017-07-07 10:53 宝山方圆 阅读(579) 评论(0) 推荐(0)
上一页 1 ··· 18 19 20 21 22 23 24 25 26 ··· 41 下一页