2014年9月8日
正文内容加载中...
posted @ 2014-09-08 15:01 MoonXue 阅读(82) 评论(0) 编辑
  2014年4月11日
摘要: 数据集资源索引del.icio.us 链接推荐系统MovieLens 电影评价系统 http://www.grouplens.org/73Zebo 偏好聚类 http://www.Zebo.com/上千份网页文件 http://kiwitobes.com/wikiKayak旅游类垂直搜索引擎 http://www.kayak.com/abs/api/search一:协同过滤数据集:用户对电影的评分算法:几何距离、皮尔逊系数要点:1.通过相关性加权给分数加权,得到用户对电影评分的预测2.协调过滤分为两种,基于用户和基于物品的。后者的相关性可以预先计算好,从而加快过滤速度。对于稀疏的数据集,基于物阅读全文
posted @ 2014-04-11 09:41 MoonXue 阅读(85) 评论(0) 编辑
  2013年12月22日
摘要: 论坛&资讯http://www.metasploit.cnhttp://www.freebuf.comhttp://www.backtrack.org.cn/http://www.hackforums.net工具包工具大全http://sectools.orgXSSORhttps://github.com/evilcos/xssorxss和csrf攻击辅助工具XSSEE 3.0 Beta,Monyer开发的,加解密最好用神器;Online JavaScript beautifier,js美化工具,分析js常用;AWVS,不仅漏扫方便,自带的一些小工具也好用;sqlmap,SQL注入利用阅读全文
posted @ 2013-12-22 14:51 MoonXue 阅读(176) 评论(0) 编辑
  2013年8月11日
摘要: 一个竞争的市场,就会有对立的产生,这世界存在着很多不同的领域,领域好比是个江湖的缩影,因此就有许多门派的纷争,例如说浏览器领域有着最大宗的IE 派,门派成长速度飞快,武功版号跳的跟台湾物价指数一样快的Chrome 门,不断被模仿,一直被超越的Opera 派;韧性极强,一直对抗几大势力的Firefox 派等等,程式语言也有自己的领域纷争,社群网站也有社群网站领域的战争,这根本就是一个战火永不停止的战国时代,但是其中持续最久,冲突最大最激烈,当然以作业系统这块领域为最,因此,让我们来谈谈这个江湖。阅读全文
posted @ 2013-08-11 17:52 MoonXue 阅读(446) 评论(0) 编辑
  2013年8月9日
摘要: Author:MoonXue上线时间:2009年9月,国内最早。支持语言:PHP、JAVA、PYTHON版本管理:SVN可选数据库:MySQ、KVDB(非关系型)特色服务:Web服务器配置工具appconfig、轻量级调试工具XHProf、临时IO读写TmFs、应用防火墙(详情)提供的其他服务:短信接入、邮件群发、分布式文件存储、memcache、计数服务(详情)、排名服务(详情)、计划任务、图片处理、网页抓取、消息队列、离线消息队列资质:自上线以来,在内测期间曾出现偶发性故障,最近一次大规模故障出现在2011年11月28日系DNS服务器导致。总体看来稳定性较好,已经有很多成熟的合作案例。(百阅读全文
posted @ 2013-08-09 23:19 MoonXue 阅读(140) 评论(0) 编辑
摘要: 记录SEO常见误区,经验总结,如何拓展关键词,推荐SEO学习资料,不断更新阅读全文
posted @ 2013-08-09 17:07 MoonXue 阅读(378) 评论(0) 编辑
  2013年7月29日
摘要: 背景:朋友在为"关山口男子职业技术学校"写一款校园应用,于是找我写一个学生选课系统的登录接口.为了搞定这个接口,我不得不先搞定这个系统的验证码. 验证码大概是这个样子 看上去不怎么难,没有干扰线没有粘连没有扭曲.但我还是没能用pytesser直接将它识别出来,因为当中有噪点和其他背景噪声的存在.我的工作就是去掉这些讨厌的东西 先介绍一下,我们的工具:阅读全文
posted @ 2013-07-29 01:22 MoonXue 阅读(4291) 评论(5) 编辑
  2013年5月6日
摘要: Arpoison 软件。此软件为开源软件,主代码只有 200 多行 , 主要是制造 ARP 包。编译此软件需要系统中安装 Libnet 库。如果感觉根据作者的代码编译的 arpoison 发包太慢(默认延迟一秒)不爽。可以自己把 sleep(wait) 一行注释掉。再进行编译 , 速度绝对会让你爽到发呆^_^Arpspoof而 arpspoof 软件对于 debian / ubuntu 系统来说就要爽很多。只要记住它是dsniff 软件包中的组件。#apt-get install dsniff当然也可以自己到开发网站上下载源码编译。但是不知道为什么 , 开发者的库都很老,依赖关系很头疼。Nma阅读全文
posted @ 2013-05-06 16:35 MoonXue 阅读(152) 评论(0) 编辑
摘要: 长期专注于写爬虫,受够了urllib、urllib2甚至是urllib3。最后选择了更人性化的requests。可是requsests对中文的支持并不太好,时常会出现乱码问题。研究源码之后现给出解决方案。乱码的由来:requests的字符检测借用了一个名为chardet的第三方库,如果运行环境缺少这个库的话系统会从别的地方想办法猜测字符集,比如header中的是声明。其实这个第三库和补救的办法往往都不靠谱,而在转换unicode的过程又是通过str方法强制执行的。于是可恶的乱码就这么出现了。解决方案1:直接使用requests中response对象的content属性,content是未被转换阅读全文
posted @ 2013-05-06 16:20 MoonXue 阅读(241) 评论(3) 编辑
摘要: 导语:大牛们常常说阅读源码是很低效的学习方法。但对我辈初学者而言,阅读源码却是掌握编程思想、编码规范的好途径。简而言之,读源码不是万能的,不读源码是万万不能的。 SocketServer是标准库中一个很具有代表性的库。它基于socket提供一套快速建立socket服务器的框架,并可以通过Mix-in的技巧让单线程服务器进化为多线程或多进程服务器。Socketserver.py里面的类很多,下面一个一个介绍并介绍它们之间关系。阅读全文
posted @ 2013-05-06 16:09 MoonXue 阅读(333) 评论(0) 编辑

公告