博客园 - MoonXue
uuid:24b78886-0ed1-41c2-8670-e3f31dcf42c4;id=91449
2014-09-08T07:01:16Z
MoonXue
https://www.cnblogs.com/monxue/
feed.cnblogs.com
https://www.cnblogs.com/monxue/p/3961380.html
Redis设计与实现(一~五整合版)【搬运】 - MoonXue
Redis设计与实现(一~五整合版)by @飘过的小牛一前言项目中用到了redis,但用到的都是最最基本的功能,比如简单的slave机制,数据结构只使用了字符串。但是一直听说redis是一个很牛的开源项目,很多公司都在用。于是我就比较奇怪,这玩意不就和 memcache 差不多吗?仅仅是因为memc...
2014-09-08T07:01:00Z
2014-09-08T07:01:00Z
MoonXue
https://www.cnblogs.com/monxue/
【摘要】Redis设计与实现(一~五整合版)by @飘过的小牛一前言项目中用到了redis,但用到的都是最最基本的功能,比如简单的slave机制,数据结构只使用了字符串。但是一直听说redis是一个很牛的开源项目,很多公司都在用。于是我就比较奇怪,这玩意不就和 memcache 差不多吗?仅仅是因为memc... <a href="https://www.cnblogs.com/monxue/p/3961380.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/monxue/p/3485909.html
数据挖掘与机器学习笔记 - MoonXue
数据集资源索引del.icio.us 链接推荐系统MovieLens 电影评价系统 http://www.grouplens.org/73Zebo 偏好聚类 http://www.Zebo.com/上千份网页文件 http://kiwitobes.com/wikiKayak旅游类垂直搜索引擎 http://www.kayak.com/abs/api/search一:协同过滤数据集:用户对电影的评分算法:几何距离、皮尔逊系数要点:1.通过相关性加权给分数加权,得到用户对电影评分的预测2.协调过滤分为两种,基于用户和基于物品的。后者的相关性可以预先计算好,从而加快过滤速度。对于稀疏的数据集,基于物
2014-04-11T01:41:00Z
2014-04-11T01:41:00Z
MoonXue
https://www.cnblogs.com/monxue/
【摘要】数据集资源索引del.icio.us 链接推荐系统MovieLens 电影评价系统 http://www.grouplens.org/73Zebo 偏好聚类 http://www.Zebo.com/上千份网页文件 http://kiwitobes.com/wikiKayak旅游类垂直搜索引擎 http://www.kayak.com/abs/api/search一:协同过滤数据集:用户对电影的评分算法:几何距离、皮尔逊系数要点:1.通过相关性加权给分数加权,得到用户对电影评分的预测2.协调过滤分为两种,基于用户和基于物品的。后者的相关性可以预先计算好,从而加快过滤速度。对于稀疏的数据集,基于物 <a href="https://www.cnblogs.com/monxue/p/3485909.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/monxue/p/3300803.html
web安全学习笔记 - MoonXue
论坛&资讯http://www.metasploit.cnhttp://www.freebuf.comhttp://www.backtrack.org.cn/http://www.hackforums.net工具包工具大全http://sectools.orgXSSORhttps://github.com/evilcos/xssorxss和csrf攻击辅助工具XSSEE 3.0 Beta,Monyer开发的,加解密最好用神器;Online JavaScript beautifier,js美化工具,分析js常用;AWVS,不仅漏扫方便,自带的一些小工具也好用;sqlmap,SQL注入利用
2013-12-22T06:51:00Z
2013-12-22T06:51:00Z
MoonXue
https://www.cnblogs.com/monxue/
【摘要】论坛&资讯http://www.metasploit.cnhttp://www.freebuf.comhttp://www.backtrack.org.cn/http://www.hackforums.net工具包工具大全http://sectools.orgXSSORhttps://github.com/evilcos/xssorxss和csrf攻击辅助工具XSSEE 3.0 Beta,Monyer开发的,加解密最好用神器;Online JavaScript beautifier,js美化工具,分析js常用;AWVS,不仅漏扫方便,自带的一些小工具也好用;sqlmap,SQL注入利用 <a href="https://www.cnblogs.com/monxue/p/3300803.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/monxue/p/why-programmer-should-use-mac.html
写程序该选Mac 还是PC ?(转) - MoonXue
一个竞争的市场,就会有对立的产生,这世界存在着很多不同的领域,领域好比是个江湖的缩影,因此就有许多门派的纷争,例如说浏览器领域有着最大宗的IE 派,门派成长速度飞快,武功版号跳的跟台湾物价指数一样快的Chrome 门,不断被模仿,一直被超越的Opera 派;韧性极强,一直对抗几大势力的Firefox 派等等,程式语言也有自己的领域纷争,社群网站也有社群网站领域的战争,这根本就是一个战火永不停止的战国时代,但是其中持续最久,冲突最大最激烈,当然以作业系统这块领域为最,因此,让我们来谈谈这个江湖。
2013-08-11T09:52:00Z
2013-08-11T09:52:00Z
MoonXue
https://www.cnblogs.com/monxue/
【摘要】一个竞争的市场,就会有对立的产生,这世界存在着很多不同的领域,领域好比是个江湖的缩影,因此就有许多门派的纷争,例如说浏览器领域有着最大宗的IE 派,门派成长速度飞快,武功版号跳的跟台湾物价指数一样快的Chrome 门,不断被模仿,一直被超越的Opera 派;韧性极强,一直对抗几大势力的Firefox 派等等,程式语言也有自己的领域纷争,社群网站也有社群网站领域的战争,这根本就是一个战火永不停止的战国时代,但是其中持续最久,冲突最大最激烈,当然以作业系统这块领域为最,因此,让我们来谈谈这个江湖。 <a href="https://www.cnblogs.com/monxue/p/why-programmer-should-use-mac.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/monxue/p/sae_research.html
sae评测报告-2013最新版 - MoonXue
Author:MoonXue上线时间:2009年9月,国内最早。支持语言:PHP、JAVA、PYTHON版本管理:SVN可选数据库:MySQ、KVDB(非关系型)特色服务:Web服务器配置工具appconfig、轻量级调试工具XHProf、临时IO读写TmFs、应用防火墙(详情)提供的其他服务:短信接入、邮件群发、分布式文件存储、memcache、计数服务(详情)、排名服务(详情)、计划任务、图片处理、网页抓取、消息队列、离线消息队列资质:自上线以来,在内测期间曾出现偶发性故障,最近一次大规模故障出现在2011年11月28日系DNS服务器导致。总体看来稳定性较好,已经有很多成熟的合作案例。(百
2013-08-09T15:19:00Z
2013-08-09T15:19:00Z
MoonXue
https://www.cnblogs.com/monxue/
【摘要】Author:MoonXue上线时间:2009年9月,国内最早。支持语言:PHP、JAVA、PYTHON版本管理:SVN可选数据库:MySQ、KVDB(非关系型)特色服务:Web服务器配置工具appconfig、轻量级调试工具XHProf、临时IO读写TmFs、应用防火墙(详情)提供的其他服务:短信接入、邮件群发、分布式文件存储、memcache、计数服务(详情)、排名服务(详情)、计划任务、图片处理、网页抓取、消息队列、离线消息队列资质:自上线以来,在内测期间曾出现偶发性故障,最近一次大规模故障出现在2011年11月28日系DNS服务器导致。总体看来稳定性较好,已经有很多成熟的合作案例。(百 <a href="https://www.cnblogs.com/monxue/p/sae_research.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/monxue/p/seo_note.html
SEO学习笔记-误区和经验总结 - MoonXue
记录SEO常见误区,经验总结,如何拓展关键词,推荐SEO学习资料,不断更新
2013-08-09T09:07:00Z
2013-08-09T09:07:00Z
MoonXue
https://www.cnblogs.com/monxue/
【摘要】记录SEO常见误区,经验总结,如何拓展关键词,推荐SEO学习资料,不断更新 <a href="https://www.cnblogs.com/monxue/p/seo_note.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/monxue/p/get_random_code.html
如何用python搞定验证码中的噪点 - MoonXue
背景:朋友在为"关山口男子职业技术学校"写一款校园应用,于是找我写一个学生选课系统的登录接口.为了搞定这个接口,我不得不先搞定这个系统的验证码.
验证码大概是这个样子
看上去不怎么难,没有干扰线没有粘连没有扭曲.但我还是没能用pytesser直接将它识别出来,因为当中有噪点和其他背景噪声的存在.我的工作就是去掉这些讨厌的东西
先介绍一下,我们的工具:
2013-07-28T17:22:00Z
2013-07-28T17:22:00Z
MoonXue
https://www.cnblogs.com/monxue/
【摘要】背景:朋友在为"关山口男子职业技术学校"写一款校园应用,于是找我写一个学生选课系统的登录接口.为了搞定这个接口,我不得不先搞定这个系统的验证码.
验证码大概是这个样子
看上去不怎么难,没有干扰线没有粘连没有扭曲.但我还是没能用pytesser直接将它识别出来,因为当中有噪点和其他背景噪声的存在.我的工作就是去掉这些讨厌的东西
先介绍一下,我们的工具: <a href="https://www.cnblogs.com/monxue/p/get_random_code.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/monxue/archive/2013/05/06/3063053.html
linux网络安全工具 - MoonXue
Arpoison 软件。此软件为开源软件,主代码只有 200 多行 , 主要是制造 ARP 包。编译此软件需要系统中安装 Libnet 库。如果感觉根据作者的代码编译的 arpoison 发包太慢(默认延迟一秒)不爽。可以自己把 sleep(wait) 一行注释掉。再进行编译 , 速度绝对会让你爽到发呆^_^Arpspoof而 arpspoof 软件对于 debian / ubuntu 系统来说就要爽很多。只要记住它是dsniff 软件包中的组件。#apt-get install dsniff当然也可以自己到开发网站上下载源码编译。但是不知道为什么 , 开发者的库都很老,依赖关系很头疼。Nma
2013-05-06T08:35:00Z
2013-05-06T08:35:00Z
MoonXue
https://www.cnblogs.com/monxue/
【摘要】Arpoison 软件。此软件为开源软件,主代码只有 200 多行 , 主要是制造 ARP 包。编译此软件需要系统中安装 Libnet 库。如果感觉根据作者的代码编译的 arpoison 发包太慢(默认延迟一秒)不爽。可以自己把 sleep(wait) 一行注释掉。再进行编译 , 速度绝对会让你爽到发呆^_^Arpspoof而 arpspoof 软件对于 debian / ubuntu 系统来说就要爽很多。只要记住它是dsniff 软件包中的组件。#apt-get install dsniff当然也可以自己到开发网站上下载源码编译。但是不知道为什么 , 开发者的库都很老,依赖关系很头疼。Nma <a href="https://www.cnblogs.com/monxue/archive/2013/05/06/3063053.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/monxue/archive/2013/05/06/3063016.html
怎么处理requests中的乱码问题 - MoonXue
长期专注于写爬虫,受够了urllib、urllib2甚至是urllib3。最后选择了更人性化的requests。可是requsests对中文的支持并不太好,时常会出现乱码问题。研究源码之后现给出解决方案。乱码的由来:requests的字符检测借用了一个名为chardet的第三方库,如果运行环境缺少这个库的话系统会从别的地方想办法猜测字符集,比如header中的是声明。其实这个第三库和补救的办法往往都不靠谱,而在转换unicode的过程又是通过str方法强制执行的。于是可恶的乱码就这么出现了。解决方案1:直接使用requests中response对象的content属性,content是未被转换
2013-05-06T08:20:00Z
2013-05-06T08:20:00Z
MoonXue
https://www.cnblogs.com/monxue/
【摘要】长期专注于写爬虫,受够了urllib、urllib2甚至是urllib3。最后选择了更人性化的requests。可是requsests对中文的支持并不太好,时常会出现乱码问题。研究源码之后现给出解决方案。乱码的由来:requests的字符检测借用了一个名为chardet的第三方库,如果运行环境缺少这个库的话系统会从别的地方想办法猜测字符集,比如header中的是声明。其实这个第三库和补救的办法往往都不靠谱,而在转换unicode的过程又是通过str方法强制执行的。于是可恶的乱码就这么出现了。解决方案1:直接使用requests中response对象的content属性,content是未被转换 <a href="https://www.cnblogs.com/monxue/archive/2013/05/06/3063016.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/monxue/archive/2013/05/06/3062991.html
学习python标准库SocketServer - MoonXue
导语:大牛们常常说阅读源码是很低效的学习方法。但对我辈初学者而言,阅读源码却是掌握编程思想、编码规范的好途径。简而言之,读源码不是万能的,不读源码是万万不能的。
SocketServer是标准库中一个很具有代表性的库。它基于socket提供一套快速建立socket服务器的框架,并可以通过Mix-in的技巧让单线程服务器进化为多线程或多进程服务器。Socketserver.py里面的类很多,下面一个一个介绍并介绍它们之间关系。
2013-05-06T08:09:00Z
2013-05-06T08:09:00Z
MoonXue
https://www.cnblogs.com/monxue/
【摘要】导语:大牛们常常说阅读源码是很低效的学习方法。但对我辈初学者而言,阅读源码却是掌握编程思想、编码规范的好途径。简而言之,读源码不是万能的,不读源码是万万不能的。
SocketServer是标准库中一个很具有代表性的库。它基于socket提供一套快速建立socket服务器的框架,并可以通过Mix-in的技巧让单线程服务器进化为多线程或多进程服务器。Socketserver.py里面的类很多,下面一个一个介绍并介绍它们之间关系。 <a href="https://www.cnblogs.com/monxue/archive/2013/05/06/3062991.html" target="_blank">阅读全文</a>