摘要:
package com.java.hadoop.hive; import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet; 阅读全文
posted @ 2024-09-02 09:00
记得关月亮
阅读(7)
评论(0)
推荐(0)
摘要:
import time from selenium import webdriver import requests # 请求URL url = '<https://weibo.com/>' # 请求头部 headers = { 'User-Agent': 'Mozilla/5.0 (Windows 阅读全文
posted @ 2024-09-02 08:59
记得关月亮
阅读(9)
评论(0)
推荐(0)
摘要:
import requests import re # 请求URL url = '<http://www.zuihaodaxue.com/zuihaodaxuepaiming2019.html>' # 请求头部 headers = { 'User-Agent': 'Mozilla/5.0 (Wind 阅读全文
posted @ 2024-09-02 08:58
记得关月亮
阅读(6)
评论(0)
推荐(0)
摘要:
import requests from bs4 import BeautifulSoup import csv # 请求URL url = '<https://movie.douban.com/top250>' # 请求头部 headers = { 'User-Agent': 'Mozilla/5 阅读全文
posted @ 2024-09-02 08:56
记得关月亮
阅读(12)
评论(0)
推荐(0)
摘要:
本周学习python爬虫所出现的问题: 1、设置请求头 Headers 的问题 一般 headers 设置 user-Agent 即可,如果有的数据是登陆后才能看到的话,还需要添加 cookies 参数(先登陆账号后,在浏览器的开发者工具中,拷贝 Cookies 即可)。这些参数都可以在浏览器的开发 阅读全文
posted @ 2024-09-02 08:54
记得关月亮
阅读(9)
评论(0)
推荐(0)
摘要:
# -*- codeing = utf-8 -*- from bs4 import BeautifulSoup # 网页解析,获取数据 import re # 正则表达式,进行文字匹配` import urllib.request, urllib.error # 制定URL,获取网页数据 impor 阅读全文
posted @ 2024-09-02 08:46
记得关月亮
阅读(19)
评论(0)
推荐(0)