2014年6月8日
摘要: 中文分词插件很多,当然都有各自的优缺点,近日刚接触自然语言处理这方面的,初步体验中文分词。首先感谢harry.guo楼主提供的学习资源,博文链接http://www.cnblogs.com/harryguo/archive/2007/09/26/906965.html,在此基础上进行深入学习和探讨。... 阅读全文
posted @ 2014-06-08 11:46 云上2014 阅读(224) 评论(0) 推荐(0) 编辑
摘要: SASS是一种 CSS 的开发工具,提供了许多便利的写法,大大节省了设计者的时间,使得 CSS 的开发,变得简单和可维护。 SASS 提供四个编译风格的选项:* nested:嵌套缩进的 css 代码,它是默认值。* expanded:没有缩进的、扩展的 css 代码。* compact:简洁格式... 阅读全文
posted @ 2014-06-08 11:45 云上2014 阅读(184) 评论(0) 推荐(0) 编辑
摘要: 最近在弄网页爬虫这方面的,上网看到关于htmlagilitypack搭配scrapysharp的文章,于是决定试一试~于是到https://www.nuget.org/packages/ScrapySharp去看看,看到这句下载提示:To install ScrapySharp, run the f... 阅读全文
posted @ 2014-06-08 11:43 云上2014 阅读(287) 评论(0) 推荐(0) 编辑
摘要: 这是我的第一个爬虫代码。。。算是一份测试版的代码。大牛大神别喷。。。通过给定一个初始的地址startPiont然后对网页进行捕捉,然后通过正则表达式对网址进行匹配。List todo:进行抓取的网址的集合List visited :已经访问过的网址的集合下面实现的是,给定一个初始地址,然后进行爬虫,... 阅读全文
posted @ 2014-06-08 11:41 云上2014 阅读(741) 评论(0) 推荐(0) 编辑
摘要: 读取选取的文件夾下的所有.txt文件private void button1_Click(object sender, EventArgs e){ if (folderBrowserDialog1.ShowDialog() == DialogResult.OK) { str... 阅读全文
posted @ 2014-06-08 11:40 云上2014 阅读(260) 评论(0) 推荐(0) 编辑
摘要: 由于最近在做毕业设计,需要用到一些简单的浏览器功能,于是学习了一下,顺便写篇博客~~大牛请勿喷,菜鸟练练手~实现界面如下:(简单朴素版@_@||)button_go实现如下:private void button_go_Click(object sender, EventArgs e){ st... 阅读全文
posted @ 2014-06-08 11:39 云上2014 阅读(1030) 评论(0) 推荐(0) 编辑
摘要: 菜鸟HtmlAgilityPack初体验。。。弱弱的代码。。。Html Agility Pack是一个开源项目,为网页提供了标准的DOM API和XPath导航。使用WebBrowser和HttpWebRequest下载的网页可以用Html Agility Pack来解析。HtmlAgilityPa... 阅读全文
posted @ 2014-06-08 11:38 云上2014 阅读(4220) 评论(0) 推荐(0) 编辑
摘要: 今天看了个验证码识别的代码,其中引用到了mshtml.dll,找了半天原来就是microsoft.mshtml.dll。查这个dll的时候还发现了好几篇关于这个dll添加问题的文章。顺便看了下,原来这个dll有三个,添加引用时要注意了。 第一篇文章: 1.添加引用的问题 一般在开发环境下会在三个地... 阅读全文
posted @ 2014-06-08 11:37 云上2014 阅读(228) 评论(0) 推荐(0) 编辑
摘要: IE浏览器是当前使用人数最广的浏览器, 本文主要来讲述如何来打造我们自己特色的浏览器, 自定义工具栏按钮, 自定义网页的右击菜单, BHO技术与IE浏览器. 本文写作过程中参考不少网络上的相关资料, 我将在最后的参考资料中列出这些文章.自定义工具栏按钮我们经常看到迅雷, 网际快车(FlashGet... 阅读全文
posted @ 2014-06-08 11:30 云上2014 阅读(326) 评论(0) 推荐(0) 编辑
摘要: 最近忽然突发奇想,想统计一下我最经常上的网站是哪些,并且在这些网站上都停留了多久。为此决定写一个BHO插件来做这件事。BHO(Browser Help Objects)是实现了特定接口(IObjectWithSite)的COM组件。开发好的BHO插件除了要在注册表中注册为COM Server外,还必... 阅读全文
posted @ 2014-06-08 11:29 云上2014 阅读(1071) 评论(0) 推荐(0) 编辑