会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
周凯莉
博客园
首页
新随笔
联系
订阅
管理
随笔 - 2
文章 - 0
评论 - 0
阅读 -
3307
2020年4月11日
爬取豆瓣电影 Top 250 数据
摘要: 一.主题式网络主题式网络爬虫设计方案 1.爬虫名称:爬取豆瓣电影 Top 250 数据 2.爬取内容:爬取电影排名,评分,介绍 3.网络爬虫设计方案概述: 思路:通过分析网页源代码,找出数据所在的标签,通过爬虫读取数据保存到csv文件中,读取文件,对数据进行清洗和处理,数据分析与可视化处理。 技术难
阅读全文
posted @ 2020-04-11 21:06 周凯莉
阅读(1236)
评论(0)
推荐(0)
2020年3月19日
Python爬虫收集今日热榜数据:聚合全网热点排行榜
摘要: 主要使用request库和beautifulSoup库爬取今日热榜的数据。 具体代码实现: 1 import requests 2 from bs4 import BeautifulSoup 3 import time 4 import pandas 5 import re 6 7 def get_
阅读全文
posted @ 2020-03-19 12:58 周凯莉
阅读(2071)
评论(0)
推荐(0)
公告
昵称:
周凯莉
园龄:
5年4个月
粉丝:
0
关注:
0
<
2025年7月
>
日
一
二
三
四
五
六
29
30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
6
7
8
9
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
随笔档案
2020年4月(1)
2020年3月(1)
阅读排行榜
1. Python爬虫收集今日热榜数据:聚合全网热点排行榜(2071)
2. 爬取豆瓣电影 Top 250 数据(1236)
点击右上角即可分享