摘要: 用requests获取源代码时,如果是中文网页,就可能会出现乱码,下面我以中关村的网站为例: 执行上面这个脚本你会看到中文部分都变成乱码。 通过上面的代码你会发现从requests获取到的编码是ISO-8859-1,而该网页的编码是gb2312,所以打印出来的编码就都变成乱码了,那么该如何解决这个问 阅读全文
posted @ 2016-05-12 15:43 昨、夜星辰 阅读(4245) 评论(0) 推荐(0)
摘要: 环境 操作系统:CentOS 6.7 32-bit Python:2.6.6 安装 阅读全文
posted @ 2016-05-12 14:44 昨、夜星辰 阅读(224) 评论(0) 推荐(0)
摘要: 环境 操作系统:CentOS 6.7 32-bit Python:2.6.6 安装 先安装setuptools和wget 下载pip 解压、安装 阅读全文
posted @ 2016-05-12 14:36 昨、夜星辰 阅读(573) 评论(0) 推荐(0)
摘要: 环境 操作系统:CentOS 6.7 32-bit Python:2.6.6 安装 安装依赖软件 安装lxml第三方库 注:如果没装pip,请先根据《CentOS安装pip》进行安装。 阅读全文
posted @ 2016-05-12 14:17 昨、夜星辰 阅读(293) 评论(0) 推荐(0)
摘要: 题目 罗马数字来源于古罗马编码系统。它们是基于字母表的特定字母的组合,所表示的数等于这些数字相加(或者是相减)得到的数。前十位的罗马数字是: I,II,III,IV,V,VI,VII,VIII,IX和X。 罗马记数系统不是直接的十进制为基础,它没有零。罗马数字是根据这七个符号的组合: 符号值 I 1 阅读全文
posted @ 2016-05-12 12:21 昨、夜星辰 阅读(797) 评论(0) 推荐(0)