会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
lin513
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
9
10
···
58
下一页
2024年2月23日
数据解析简介
摘要: 数据解析分类: --正则 --bs4 --xpath 数据解析的原理: --解析的局部的文本内容都会在标签之间或者标签对应的属性中进行存储 --1.进行指定标签的定位 --2.标签或者标签对应的属性中存储的数据值进行提取(解析)
阅读全文
posted @ 2024-02-23 14:05 会秃头的小白
阅读(7)
评论(0)
推荐(0)
2024年2月22日
爬取豆瓣电影分类排行榜 https://movie.douban.com/中的电影详情数据
摘要: import requests import json if __name__ == '__main__': #制定url url = 'https://movie.douban.com/j/chart/top_list' params = { 'type':'24', 'interval_id':
阅读全文
posted @ 2024-02-22 15:20 会秃头的小白
阅读(233)
评论(0)
推荐(0)
破解百度翻译
摘要: --需求:破解百度翻译 --对应的请求是post请求 (携带了参数) --响应数据是一组json数据 代码 import requests import json if __name__ == '__main__': #制定url post_url = 'https://fanyi.baidu.co
阅读全文
posted @ 2024-02-22 14:57 会秃头的小白
阅读(70)
评论(0)
推荐(0)
爬取搜狗指定词条对应的搜索结果页面(简易网页采集器)
摘要: #UA检测:门户网站的服务器会检测对应请求的载体身份标识,如果检测到请求载体的身份标识为某一款浏览器,说明是正常用户通过浏览器发起的正常的请求 # 如果检测到非浏览器发起的请求,则表示请求可能为不正常的请求(爬虫),那么有可能就会拒绝该请求 #UA:User-Agent:(请求身份载体的身份标识)
阅读全文
posted @ 2024-02-22 14:17 会秃头的小白
阅读(67)
评论(0)
推荐(0)
requests基础
摘要: 笔记 requests模块 - urllib模块 - requests模块 request模块:python中原生的一款基于网络请求的模块,功能非常强大,简单便捷,效率极高。 作用:模拟浏览器发请求。 如何使用:(requests模块的编码流程) - 指定url - 发起请求 - 获取响应数据 -
阅读全文
posted @ 2024-02-22 13:46 会秃头的小白
阅读(10)
评论(0)
推荐(0)
爬虫简介
摘要: 爬虫分类: 通用爬虫:抓取系统重要组成部分,抓取的是一个整张页面的数据 聚焦爬虫:是建立在通用爬虫的基础之上。抓取的是页面中特定的局部内容 增量式爬虫:检测网站中数据更新的情况,指挥抓取网站中最新更新出来的数据 爬虫的矛与盾: 反爬机制 门户网站,可以通过制定相应的策略或者技术手段,防止爬虫程序进行
阅读全文
posted @ 2024-02-22 13:16 会秃头的小白
阅读(10)
评论(0)
推荐(0)
2024年2月1日
7
摘要: 今天学了会机器学习+深入学习 做了spark的实验
阅读全文
posted @ 2024-02-01 23:11 会秃头的小白
阅读(5)
评论(0)
推荐(0)
3. 统计学生成绩
摘要: object test3 { case class student(id: String, gender: String, score: Map[String, Int]) //读取文件的方法: def inputStudentList(filename: String): List[student
阅读全文
posted @ 2024-02-01 21:11 会秃头的小白
阅读(22)
评论(0)
推荐(0)
2. 模拟图形绘制
摘要: case class Point(var x:Double,var y:Double) extends Drawable{ def shift(deltaX:Double,deltaY:Double): Unit = { x+=deltaX; y+=deltaY } } trait Drawable
阅读全文
posted @ 2024-02-01 17:28 会秃头的小白
阅读(24)
评论(0)
推荐(0)
1. 计算级数
摘要: import scala.io.StdIn.readLine object test1 { def main(args: Array[String]): Unit = { val q = readLine("请输入一个大于0的数:").toDouble val result = calculateS
阅读全文
posted @ 2024-02-01 16:28 会秃头的小白
阅读(11)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
9
10
···
58
下一页
公告