随笔分类 - 网络爬虫
摘要:背景: 学校更换网页认证,限制多台设备的登录,后台记录发现会将账号封30min禁止登陆,于是想办法冲破这个限制。看到马丁大神的博客知道了学校的检测机制,只需要定时对账号进行认证下线即可实现,不被学校检测系统发现,并可以路由器共享。 已有方案: 手动断线重连速度太慢,于是考虑用程序实现,让服务后台一直
阅读全文
摘要:一、正则表达式: 用于字符串处理的一套完整的规则,字符串处理是比较常见的处理,在文本中,我们需要查找自己需要的字符,有时需要替换、删除的等等,有关正则表达式的规则。可以自己学习,这里记一下我的用法的心得 1、精通正则表达式的所有规则 正则的规则,很庞大,支持的语言也很多,Java、C#、Python
阅读全文
摘要:一、什么是网络爬虫? 信息时代,每天我们都在上网,每天我们都在浏览器上访问网站,我们打开一个网页,接着又跳转到另一个网页,看到喜欢的内容,或者是一段幽默的句子,或者是一张美女的图片,我们会选择将其保存下来,当数量很多的时候,我们就会选择用程序来实现这样一个过程,实现自动浏览网页,自动根据我们的要求,
阅读全文

浙公网安备 33010602011771号