宝山方圆 - 博客园

2017年7月19日

摘要：待续。。。阅读全文

posted @ 2017-07-19 23:51 宝山方圆阅读(1609) 评论(0) 推荐(0)

摘要：数据来源：Python爬取新浪微博评论数据，写入csv文件中本文等同：筛选出一段文字中的中文阅读全文

posted @ 2017-07-19 23:46 宝山方圆阅读(555) 评论(0) 推荐(0)

摘要：因为新浪微博网页版爬虫比较困难，故采取用手机网页端爬取的方式操作步骤如下： 1. 网页版登陆新浪微博 2.打开m.weibo.cn 3.查找自己感兴趣的话题，获取对应的数据接口链接 4.获取cookies和headers 至于爬出来的数据有非中文的数据，要提取中文请参考：筛选出一段文字中的中文未阅读全文

posted @ 2017-07-19 23:42 宝山方圆阅读(7408) 评论(19) 推荐(1)

筛选出一段文字中的中文

摘要：取出文档中的中文待续。。。阅读全文

posted @ 2017-07-19 23:26 宝山方圆阅读(2688) 评论(0) 推荐(0)

【转】一件有趣的事：我用 Python 爬了爬自己的微信朋友

摘要：偶然了解到 Python 里的 itchat 包，它已经完成了 wechat 的个人账号 API 接口，使爬取个人微信信息更加方便。于是乎玩心一起，打算爬一下自己的微信。步骤核心：网页启动notebook pip安装itchat包登录微信，扫描二维码获取好友信息有了上面的friends数阅读全文

posted @ 2017-07-19 11:06 宝山方圆阅读(1637) 评论(0) 推荐(0)

2017年7月17日

【转】Mysql千万级数据表结构修改

摘要：当需要对表进行ddl操作如加索引、增删列时，数据量小时直接在线修改表结构影响不大当表达到百万、千万数据就不能直接在线修改表结构下面是具体的过程：1、备份数据select * from ih_order into outfile '/bak/order.txt';mysql> select * fro 阅读全文

posted @ 2017-07-17 17:30 宝山方圆阅读(658) 评论(0) 推荐(0)

2017年7月11日

【转】Java HotSpot(TM) 64-Bit Server VM warning: Insufficient space for shared memory file:

摘要：使用命令：JPS #jps 报错了 df -h发现某一个满的分区清理一些无关数据，恢复正常【转自】：http://blog.csdn.net/u012965373/article/details/51984806 阅读全文

posted @ 2017-07-11 09:40 宝山方圆阅读(3509) 评论(0) 推荐(0)

2017年7月8日

kafka之partition分区及副本replica升级

摘要：修改kafka的partition分区 bin/kafka-topics.sh --zookeeper datacollect-2:2181 --alter --partitions 3 --topic client-agent-1 修改kafka副本数官网解释如下：准备json文件：开始执行阅读全文

posted @ 2017-07-08 17:22 宝山方圆阅读(2690) 评论(0) 推荐(0)

Rokid开发者社区skill之【历史上的今天】之简介+玩法+设计+实现+心得

摘要： Skill简介：来源：好奇心、探索欲、趣味性；资源：百度百科；方式：实时获取，自动更新；技能玩法：想要进入历史上的今天这个skill，则对若琪说：若琪，打开历史上的今天。想要了解某天的历史，则对若琪说：若琪，我想了解6月8号，若琪便会回复历史上6月8号的历史。由于每天的历史相对较长，如阅读全文

posted @ 2017-07-08 13:27 宝山方圆阅读(1058) 评论(0) 推荐(0)

2017年7月7日

【转】批量删除redis中的key

摘要： 1. DEL 直接加键名称 DEL key1 key2 key3 127.0.0.1:6379> DEL site_msg_99973 false site_msg_99974 false site_msg_99979false 2. 批量删除key 可用keys ‘str*’ 列出要删除的key，阅读全文

posted @ 2017-07-07 10:53 宝山方圆阅读(582) 评论(0) 推荐(0)

zhzhang

精进自己，分享他人！

公告