• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
张纯睿
博客园    首页    新随笔    联系   管理    订阅  订阅

随笔分类 -  互联网编程01:网页下载与分析

上一页 1 2
webclient 和HttpWebRequest采集的区别

摘要:http://topic.csdn.net/u/20100508/10/6a47dabd-23b1-4e4c-b6bb-f2de58dc8d98.htmlwebclient 和HttpWebRequest采集的区别都是一样的,WebClient调用HttpWebRequest进行下载因为WebClient就是通过创建WebRequest(它会自动根据url来识别是FTP还是Http)来操作的。可以说,与其你费劲去创建HttpWebRequest,再创建WebResponse,最后才读取数据,当然不如直接使用WebClient方便啦!但是这只是方便程度不同,对于你的这个问题没有差别。WebCli 阅读全文
posted @ 2011-11-21 14:34 张纯睿 阅读(325) 评论(0) 推荐(0)
c#抓取网页分析

摘要:http://blog.csdn.net/tianykun/article/details/2994815c#抓取网页分析2008-09-29 10:501148人阅读评论(0)收藏举报目的:抓取网页,分析网页内容,进行处理获取信息。例子:抓km169上的adsl用户的费用信息,分析存储到本地数据库。步骤:1、抓取。2、分析。3、存储。王暴徒2006-2-13 05:481抓取 public string GetPage(string url, string postData, out string err) { err = ""; Stream outstre... 阅读全文
posted @ 2011-10-21 17:42 张纯睿 阅读(213) 评论(0) 推荐(0)
命名空间“System.Web”中不存在类型或命名空间名称“HttpUtility”。是否缺少程序集引用?

摘要:http://hi.baidu.com/suxue_2004/blog/item/11c960955a00dd1f7af48007.htmlvs2010下解决方案:1、右击项目选择“属性”,目标框架选择“.net FrameWord 4”;2、右击项目中的引用,添加引用,在.net下选择System.Web,确定OK。 阅读全文
posted @ 2011-10-20 15:37 张纯睿 阅读(941) 评论(0) 推荐(0)
C#抓取和分析网页的类

摘要:http://www.cnblogs.com/justwannaloveyou/archive/2010/10/24/1859645.html抓取和分析网页的类。主要功能有:1、提取网页的纯文本,去所有html标签和javascript代码2、提取网页的链接,包括href和frame及iframe3、提取网页的title等(其它的标签可依此类推,正则是一样的)4、可以实现简单的表单提交及cookie保存/** Author:Sunjoy at CCNU* 如果您改进了这个类请发一份代码给我(ccnusjy 在gmail.com)*/usingSystem;usingSystem.Data;us 阅读全文
posted @ 2011-10-18 13:18 张纯睿 阅读(133) 评论(0) 推荐(0)
IHTMLDocument2 浏览

摘要:用 MSHTML 的一点经验 http://it.china-b.com/cxsj/vc/20090612/100604_1.html如何提取网页中所有链接http://www.vckbase.com/document/viewdoc/?id=646!!!显示 HTML 样式的对话窗http://www.vckbase.com/document/viewdoc/?id=1472!!!IE里的探索之定制浏览器好助手http://tech.china.com/zh_cn/netschool/softwares/ie/628/20010306/01_08.htmlbaidu "IE里的探索 阅读全文
posted @ 2011-06-29 15:00 张纯睿 阅读(115) 评论(0) 推荐(0)
使用IHTMLDocument2分析Html

摘要:http://hi.baidu.com/ahstudy2010/blog/item/102d7df3468f3ca4a40f52be.html利用CWebBrowser2获取IHTMLDocument2接口,IHTMLDocument2接口是mshtml中最重要的接口之一,取得这个接口,就可以开始分析html代码下面的代码将获取特定的html 文本标签Code// 从ctlBrowser当前html文档选中区域中获取名为strTagName的标签,存入*ppElement中BOOL GetCrntHtmlElement(CWebBrowser2&ctlBrowser, const CS 阅读全文
posted @ 2011-06-29 14:57 张纯睿 阅读(480) 评论(0) 推荐(0)
VC HTML IHtmlDocument相关代码片段

摘要:http://blog.csdn.net/demon_evil/archive/2008/03/21/2201976.aspx据说是根据InternetExplorer_Server窗口得到IHtmlDocument2接口#include <mshtml.h>#include <atlbase.h>#include <oleacc.h>BOOL CALLBACK EnumChildProc(HWND hwnd,LPARAM lParam){TCHAR buf[100];::GetClassName( hwnd, (LPTSTR)&buf, 100 ) 阅读全文
posted @ 2011-06-29 14:55 张纯睿 阅读(276) 评论(0) 推荐(0)
VC HTML IHtmlDocument相关代码

摘要:1、从IE窗体获得IHTMLDocument2 接口 2、获得 IHTMLDocument2 全部文本内容 阅读全文
posted @ 2011-06-25 15:46 张纯睿 阅读(531) 评论(0) 推荐(0)

上一页 1 2
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3