代码改变世界

团队-爬取豆瓣电影TOP250-需求分析

2017-09-08 19:57  张文博1995  阅读(341)  评论(0编辑  收藏  举报

团队-爬取豆瓣电影TOP250-需求分析


需求:爬取豆瓣电影TOP250

*向用户展示电影的排名,分数,名字,简介,导演,演员,前10条影评信息,链接信息

实现思路:

  • 分析豆瓣电影TOP250的url规则, 编写模块获取相关url
  • 获取全部相关页面的html代码
  • 分析html中有关"排名,分数,名字,简介,导演,演员,前10条影评信息,链接信息"的标签
  • 结合第三方工具包实现信息的提取
  • 编写将"搜集信息"展示出来的模块