随笔分类 - 互联网编程01:网页下载与分析
webclient 和HttpWebRequest采集的区别
摘要:http://topic.csdn.net/u/20100508/10/6a47dabd-23b1-4e4c-b6bb-f2de58dc8d98.htmlwebclient 和HttpWebRequest采集的区别都是一样的,WebClient调用HttpWebRequest进行下载因为WebClient就是通过创建WebRequest(它会自动根据url来识别是FTP还是Http)来操作的。可以说,与其你费劲去创建HttpWebRequest,再创建WebResponse,最后才读取数据,当然不如直接使用WebClient方便啦!但是这只是方便程度不同,对于你的这个问题没有差别。WebCli
阅读全文
c#抓取网页分析
摘要:http://blog.csdn.net/tianykun/article/details/2994815c#抓取网页分析2008-09-29 10:501148人阅读评论(0)收藏举报目的:抓取网页,分析网页内容,进行处理获取信息。例子:抓km169上的adsl用户的费用信息,分析存储到本地数据库。步骤:1、抓取。2、分析。3、存储。王暴徒2006-2-13 05:481抓取 public string GetPage(string url, string postData, out string err) { err = ""; Stream outstre...
阅读全文
命名空间“System.Web”中不存在类型或命名空间名称“HttpUtility”。是否缺少程序集引用?
摘要:http://hi.baidu.com/suxue_2004/blog/item/11c960955a00dd1f7af48007.htmlvs2010下解决方案:1、右击项目选择“属性”,目标框架选择“.net FrameWord 4”;2、右击项目中的引用,添加引用,在.net下选择System.Web,确定OK。
阅读全文
C#抓取和分析网页的类
摘要:http://www.cnblogs.com/justwannaloveyou/archive/2010/10/24/1859645.html抓取和分析网页的类。主要功能有:1、提取网页的纯文本,去所有html标签和javascript代码2、提取网页的链接,包括href和frame及iframe3、提取网页的title等(其它的标签可依此类推,正则是一样的)4、可以实现简单的表单提交及cookie保存/** Author:Sunjoy at CCNU* 如果您改进了这个类请发一份代码给我(ccnusjy 在gmail.com)*/usingSystem;usingSystem.Data;us
阅读全文
IHTMLDocument2 浏览
摘要:用 MSHTML 的一点经验 http://it.china-b.com/cxsj/vc/20090612/100604_1.html如何提取网页中所有链接http://www.vckbase.com/document/viewdoc/?id=646!!!显示 HTML 样式的对话窗http://www.vckbase.com/document/viewdoc/?id=1472!!!IE里的探索之定制浏览器好助手http://tech.china.com/zh_cn/netschool/softwares/ie/628/20010306/01_08.htmlbaidu "IE里的探索
阅读全文
使用IHTMLDocument2分析Html
摘要:http://hi.baidu.com/ahstudy2010/blog/item/102d7df3468f3ca4a40f52be.html利用CWebBrowser2获取IHTMLDocument2接口,IHTMLDocument2接口是mshtml中最重要的接口之一,取得这个接口,就可以开始分析html代码下面的代码将获取特定的html 文本标签Code// 从ctlBrowser当前html文档选中区域中获取名为strTagName的标签,存入*ppElement中BOOL GetCrntHtmlElement(CWebBrowser2&ctlBrowser, const CS
阅读全文
VC HTML IHtmlDocument相关代码片段
摘要:http://blog.csdn.net/demon_evil/archive/2008/03/21/2201976.aspx据说是根据InternetExplorer_Server窗口得到IHtmlDocument2接口#include <mshtml.h>#include <atlbase.h>#include <oleacc.h>BOOL CALLBACK EnumChildProc(HWND hwnd,LPARAM lParam){TCHAR buf[100];::GetClassName( hwnd, (LPTSTR)&buf, 100 )
阅读全文