随笔分类 - 网页抓取技术
摘要:原文网址:http://www.crifan.com/summary_about_flow_process_of_fetch_webpage_simulate_login_website_and_some_notice/ 这里只是做为小结和吸收要点 去访问一个URL地址,获得对应的网页的过程,其对应
阅读全文
摘要:AcsII- 最原始的 127个字符 GK2312--中国基本汉字 60000多吧 GBK--扩展了少数民族字 GB13000 --再次扩展 ISO-8859-1 日文,朝鲜等 UNICODE 统一编码,世界通用了 UTF-8 一个字节 表示 兼容ACSII? UTF-16 两个字节 60000多字
阅读全文

浙公网安备 33010602011771号