摘要: 爬取多页电影信息及简介 爬取标题,评分,排名,摘要,剧情简介 使用 Feed exports 保存爬取的数据 代码: 阅读全文
posted @ 2019-10-22 15:42 淡然。 阅读(432) 评论(0) 推荐(0) 编辑
摘要: 数据持久化的需求: 与其他系统交互的需求 数据持久化的方式: 保存为文件: json csv 保存到数据库中: mysql MongoDB 将数据保存在文件中的方法: Feed exports:将数据导出成常用格式的方法 默认支持的格式: JSON、JSON line、CSV、XML 使用方法: 在 阅读全文
posted @ 2019-10-22 14:58 淡然。 阅读(137) 评论(0) 推荐(0) 编辑
摘要: 优势: 更加通用(适应任何语言) 可以提取文本中的指定信息 可以提取非HTML中的信息 劣势: 语法比较晦涩 常用方法: 正则表达式符号: 阅读全文
posted @ 2019-10-22 11:18 淡然。 阅读(157) 评论(0) 推荐(0) 编辑