摘要: 获取类bean中的所有属性: @Test //获取类bean中的所有属性 public void test1() throws Exception{ BeanInfo info = Introspector.getBeanInfo(Person.class); PropertyDescriptor[] decriptors = info.getPropertyDescrip... 阅读全文
posted @ 2016-10-03 23:15 玮仔Wayne 阅读(272) 评论(0) 推荐(0)
摘要: 示例类 @SuppressWarnings("unused") public class Person { public String Name; private int Age; public Gender Gender; private static String Species = "人类"; public Person(){ ... 阅读全文
posted @ 2016-10-03 19:11 玮仔Wayne 阅读(372) 评论(0) 推荐(0)
摘要: 使用Chromium时会遇到 “缺少google api密钥,因此chromium的部分功能将无法使用”提示,google了一下 setx Google_API_KEY 和 chromium portable google api keys are missing 找到了解决办法。 打开windows的cmd命令提示符,依次输入以下命令: setx G... 阅读全文
posted @ 2016-10-01 14:27 玮仔Wayne 阅读(3049) 评论(0) 推荐(0)
摘要: Url Seen用来做url去重。对于一个大的爬虫系统,它可能已经有百亿或者千亿的url,新来一个url如何能快速的判断url是否已经出现过非常关键。因为大的爬虫系统可能一秒钟就会下载几千个网页,一个网页一般能够抽取出几十个url,而每个url都需要执行去重操作,可想每秒需要执行大量的去重操作。因此Url Seen是整个爬虫系统中非常有技术含量的一个部分。 为了提... 阅读全文
posted @ 2016-09-26 21:50 玮仔Wayne 阅读(456) 评论(0) 推荐(0)
摘要: Url Filter则是对提取出来的URL再进行一次筛选。不同的应用筛选的标准是不一样的,比如对于baidu/google的搜索,一般不进行筛选,但是对于垂直搜索或者定向抓取的应用,那么它可能只需要满足某个条件的url,比如不需要图片的url,比如只需要某个特定网站的url等等。Url Filter是一个和应用密切相关的模块。 using System; us... 阅读全文
posted @ 2016-09-26 20:50 玮仔Wayne 阅读(696) 评论(0) 推荐(0)
摘要: Extractor的工作是从下载的网页中将它包含的所有URL提取出来。这是个细致的工作,你需要考虑到所有可能的url的样式,比如网页中常常会包含相对路径的url,提取的时候需要将它转换成绝对路径。这里我们选择使用正则表达式来完成链接的提取。 html标签中的链接地址通常会出现在href属性或者src属性中,所以我们采用两个正则表达式来匹配网页中的所有链接地... 阅读全文
posted @ 2016-09-25 00:55 玮仔Wayne 阅读(338) 评论(0) 推荐(0)
摘要: [MVC学习笔记]1.项目结构搭建及单个类在各个层次中的实现 [MVC学习笔记]2.使用T4模板生成其他类的具体实现 [MVC学习笔记]3.使用Spring.Net应用IOC(依赖倒置) [MVC学习笔记]4.使用Log4Net来进行错误日志的记录 [MVC学习笔记]5.使用Controller来代替Filter完成登录验证(Session校验) ... 阅读全文
posted @ 2016-09-23 21:10 玮仔Wayne 阅读(221) 评论(0) 推荐(0)
摘要: 最近DotNetCore更新到了1.0.1,Azure tools也更新到了2.9.5,尝试更新时发现,DotNetCore更新失败,提示:0x80072f8a未指定的错误,而Azure Tools中也包含了DotNetCore的更新,0x80072f8a问题,导致两个软件都不能成功地完成更新。 研究安装的错误日志后才发现,原来使因为证书过期导致的无法下载微软... 阅读全文
posted @ 2016-09-21 13:08 玮仔Wayne 阅读(1575) 评论(7) 推荐(1)
摘要: 普里姆算法(Prim算法),图论中的一种算法,可在加权连通图里搜索最小生成树。意即由此算法搜索到的边子集所构成的树中,不但包括了连通图里的所有顶点(英语:Vertex (graph theory)),且其所有边的权值之和亦为最小。该算法于1930年由捷克数学家沃伊捷赫·亚尔尼克(英语:Vojtěch Jarník)发现;并在1957年由美国计算机科学家罗伯特·普里姆(英语:Ro... 阅读全文
posted @ 2016-09-20 21:04 玮仔Wayne 阅读(3477) 评论(0) 推荐(0)
摘要: 在之前的项目中,如果有需要使用验证码,基本都是自己用GDI+画图出来,简单好用,但是却也存在了一些小问题,首先若较少干扰线,则安全性不是很高,验证码容易被机器识别,若多画太多干扰线条,机器人识别率下降的同时,人眼的识别率也同步下降(震惊哭)。更为重要的是,GDI+绘制的验证码一般来说也不会很美观,如果做一个炫酷的登陆界面却配了这样一个验证码,画风诡异,丑到极致。 ... 阅读全文
posted @ 2016-09-20 20:15 玮仔Wayne 阅读(1542) 评论(0) 推荐(5)