随风小屋 - 博客园

2024年8月12日

摘要：豆瓣影评数据抓取创建时间：2024-08-12 抓取豆瓣影评相关数据的代码，包括封面、标题、评论内容以及影评详情页的数据。一、完整代码 ''' https://movie.douban.com/review/best/ 抓取封面标题评论內容抓取完整的评论内容也就是点击展开后的完整的抓取阅读全文

posted @ 2024-08-12 22:58 随风小屋阅读(112) 评论(0) 推荐(0)

2024年8月11日

使用 Python 爬取豆瓣电影 Top250 多页数据

摘要：使用 Python 爬取豆瓣电影 Top250 多页数据创建时间：2024-08-11 一、完整代码 ''' 抓取单贞数据中的评分简介评价人数将上面的改为多页 https://movie.douban.com/top250?start=0 ''' import requests from 阅读全文

posted @ 2024-08-11 13:51 随风小屋阅读(141) 评论(0) 推荐(0)

彼岸网壁纸抓取

摘要：彼岸网壁纸抓取创建时间：2024-08-11 一、代码 1.1 代码 import os import random import time import requests from lxml import etree url = 'http://pic.netbian.com/' header 阅读全文

posted @ 2024-08-11 13:40 随风小屋阅读(133) 评论(0) 推荐(0)

豆瓣短评榜单短评下载

摘要：豆瓣短评榜单短评下载创建时间：2024-08-07 一、完整代码 import requests from lxml import etree def get_html(main_url): header = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10. 阅读全文

posted @ 2024-08-11 13:17 随风小屋阅读(43) 评论(0) 推荐(0)

2024年8月9日

按照第一列拆分excel为单独文件

摘要：按照第一列拆分excel为单独文件创建时间：2024-08-09 一、使用方法 1.1 修改 config.json 文件里面的地址 {"excelPATH": "E:\\downloads\\无标题 (2).xls"} 修改为后面文件的具体位置 1.2 双击运行程序二、使用实例 2.1 数据准阅读全文

posted @ 2024-08-09 16:48 随风小屋阅读(117) 评论(0) 推荐(0)

2024年8月7日

三国演义内容抓取（诗词名句网）

摘要：三国演义内容抓取（诗词名句网）时间：2024-08-06 一、完整代码 import random import time import requests from lxml import etree four_famous_novels = 'https://www.shicimingju.co 阅读全文

posted @ 2024-08-07 00:15 随风小屋阅读(55) 评论(0) 推荐(0)

中信证券抓取（页码范围）

摘要：中信证券抓取（页码范围）创建时间：2024年8月5日一、完整代码 import re import requests from lxml import etree headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x6 阅读全文

posted @ 2024-08-07 00:13 随风小屋阅读(44) 评论(0) 推荐(0)

腾牛网抓取（单页）

摘要：腾牛网抓取（单页）创建时间：2024-08-05 一、完整代码 import requests from lxml import etree url = 'https://www.qqtn.com/wm/meinvtp_1.html' header = { 'User-Agent': 'Mozil 阅读全文

posted @ 2024-08-07 00:10 随风小屋阅读(109) 评论(0) 推荐(0)

表情党抓取（单页） (网站已转移)

摘要：表情党抓取（单页） (网站已转移) 创建时间：2024-08-06 一、完整代码 import requests from lxml import etree url = 'https://qq.yh31.com/xq/wq/' header = { 'User-Agent': 'Mozilla/5 阅读全文

posted @ 2024-08-07 00:06 随风小屋阅读(139) 评论(0) 推荐(0)

抓取金投网文本数据（xpath练习）

摘要：抓取金投网文本数据（xpath练习）创建时间：2024年8月5日一、完整代码 import requests from lxml import etree header = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) Ap 阅读全文

posted @ 2024-08-07 00:00 随风小屋阅读(49) 评论(0) 推荐(0)

随风

爱意随风起风止意难平

公告

随风

爱意随风起 风止意难平

公告

爱意随风起风止意难平