随笔分类 -  网页抓取技术

摘要:原文网址:http://www.crifan.com/summary_about_flow_process_of_fetch_webpage_simulate_login_website_and_some_notice/ 这里只是做为小结和吸收要点 去访问一个URL地址,获得对应的网页的过程,其对应 阅读全文
posted @ 2016-05-27 10:21 张荣建 阅读(2791) 评论(0) 推荐(0)
摘要:AcsII- 最原始的 127个字符 GK2312--中国基本汉字 60000多吧 GBK--扩展了少数民族字 GB13000 --再次扩展 ISO-8859-1 日文,朝鲜等 UNICODE 统一编码,世界通用了 UTF-8 一个字节 表示 兼容ACSII? UTF-16 两个字节 60000多字 阅读全文
posted @ 2016-05-21 11:05 张荣建 阅读(139) 评论(0) 推荐(0)