FlyingCode

导航

 

2017年6月9日

摘要: 为了和艺恩网的数据作比较,让结果更精确,在昨天又写了一个时光网信息的爬取,这次的难度比艺恩网的大不少,话不多说,先放代码 时光网信息爬取的难点主要在于他的正则不好写 大部分电影首日票房与首周票房都有 部分电影有首日票房,没有首周票房 还有一部分电影首日票房首周票房都没有 比较好的解决办法就是在网页中 阅读全文
posted @ 2017-06-09 19:39 hhbeast 阅读(1996) 评论(0) 推荐(0)
 
摘要: 前两天用python2写的一个小爬虫 主要实现了从http://www.cbooo.cn/Alltimedomestic这么个网页中爬取每一部电影的票房信息等,以及在豆瓣上该电影的评分信息 代码如下 爬取过程还算顺利,期间遇到了一些小麻烦: 一部分导演的名字带有空格,由于编码的问题输出结果会变成&# 阅读全文
posted @ 2017-06-09 19:21 hhbeast 阅读(3573) 评论(0) 推荐(0)