会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
卧颜沉默
博客不常上 mail:1057160387@qq.com
博客园
首页
新随笔
联系
订阅
管理
2019年5月7日
cassandra百亿级数据库迁移实践
摘要: 迁移背景 cassandra集群隔段时间出现rt飙高的问题,带来的影响就是请求cassandra短时间内出现大量超时,这个问题发生已经达到了平均两周一次的频率,已经影响到正常业务了。而出现这些问题的原因主要有以下3点: 1. 当初设计表的时候partition key设计的不是很合理,当数据量上去(
阅读全文
posted @ 2019-05-07 09:48 卧颜沉默
阅读(4637)
评论(2)
推荐(1)
2019年3月27日
【java+selenium】网易云音乐刷累计听歌数
摘要: 背景 应该是在去年的时候,刷知乎看到一个问题,大概是说怎么刷网易云音乐个人累计听歌数,然后有一个高赞回答,贴了一段js代码,直接在浏览器console执行就可以了。当时试了下,直接一下子刷了有好几万。悲剧的是,第二天又回到原来的样子了,很明显这种方式被网易云音乐发现封掉了。而且后续网易云还针对累计听
阅读全文
posted @ 2019-03-27 09:04 卧颜沉默
阅读(5105)
评论(3)
推荐(2)
2019年3月15日
无界面Ubuntu服务器搭建selenium+chromedriver+VNC运行环境
摘要: 搭建背景 有时候我们需要把基于selenium的爬虫放到服务器上跑的时候,就需要这样一套运行环境,其中VNC是虚拟的显示模式,用于排查定位线上问题以及实时运行情况。 搭建流程 1. 安装虚拟输出设备: 2. 下载google chrome stable deb包,由于网上大部分链接没法下载,我这里下
阅读全文
posted @ 2019-03-15 10:01 卧颜沉默
阅读(4292)
评论(2)
推荐(0)
2019年3月11日
一次ygc越来越慢的问题排查过程
摘要: 问题发现场景 某天突然收到线上应用的gc时间过长的告警,刚开始只有一台机器偶尔报一下,后续其他机器也纷纷告警,具体告警的阈值是应用10分钟内ygc的总时长达到了6.6s。 初步排除过程 1. 按照gc问题常规排查流程,还是先保留现场,jmap dump:format=b,file=temp.dump
阅读全文
posted @ 2019-03-11 10:03 卧颜沉默
阅读(4243)
评论(4)
推荐(2)
2018年11月7日
一次频繁Full GC问题排查过程分享
摘要: 问题描述 应用收到频繁Full GC告警 问题排查 登录到对应机器上去,查看GC日志,发现YGC一分钟已经达到了15次,比Full GC还要频繁一些,其中Full GC平均10分钟超过了4次,如下图 使用jstat gcutil 5280 1000查看实时GC情况,年老代采用的是CMS收集器,发现触
阅读全文
posted @ 2018-11-07 09:31 卧颜沉默
阅读(19747)
评论(4)
推荐(0)
2018年6月29日
Apache HttpClient4使用教程
摘要: 基于HttpClient 4.5.2 1. 执行GET请求 2. 执行POST请求 1. 提交form表单参数 2. 提交payload参数 3. post上传文件 4. post提交multipart/form data类型参数 3. 设置User Agent 4. 设置重试处理器 当请求超时,
阅读全文
posted @ 2018-06-29 10:15 卧颜沉默
阅读(2121)
评论(2)
推荐(0)
2018年2月12日
SpringMVC源码之参数解析绑定原理
摘要: 摘要 本文从源码层面简单讲解SpringMVC的参数绑定原理 SpringMVC参数绑定相关组件的初始化过程 在理解初始化之前,先来认识一个接口 HandlerMethodArgumentResolver 方法参数解析器接口,这个接口是SpringMVC参数解析绑定的核心接口。不同的参数类型绑定都是
阅读全文
posted @ 2018-02-12 10:54 卧颜沉默
阅读(25177)
评论(3)
推荐(11)
2018年2月5日
SpringMVC源码之Controller查找原理
摘要: 摘要 本文从源码层面简单讲解SpringMVC的处理器映射环节,也就是查找Controller详细过程。 SpringMVC请求流程 Controller查找在上图中对应的步骤1至2的过程 SpringMVC初始化过程 理解初始化过程之前,先认识两个类 1. RequestMappingInfo类,
阅读全文
posted @ 2018-02-05 11:05 卧颜沉默
阅读(3516)
评论(1)
推荐(7)
2017年5月19日
从零实现一个高性能网络爬虫(二)应对反爬虫之前端数据混淆
摘要: 摘要 上一篇以知乎网为例简单分享网络请求分析。这一篇主要分享一种应对反爬虫的方法,前端数据混淆。 目的 之前写https://github.com/wycm/zhihu-crawler项目的时候,需要用到免费的http代理,然后找到了这个 http://www.goubanjia.com/ 这个网站
阅读全文
posted @ 2017-05-19 17:31 卧颜沉默
阅读(3802)
评论(12)
推荐(3)
2017年4月27日
从零实现一个高性能网络爬虫(一)网络请求分析及代码实现
摘要: 摘要 从零实现一个高性能网络爬虫系列教程第一篇,后续会有关于url去重、如何反爬虫、如何提高抓取效率、分布式爬虫系列文章。以我写的一个知乎爬虫为Demo讲解,github地址 (https://github.com/wycm/zhihu-crawler) ,有兴趣的朋友可以star下。网络请求的分析
阅读全文
posted @ 2017-04-27 11:05 卧颜沉默
阅读(4737)
评论(1)
推荐(5)
下一页
公告