一头钻进被窝里

2023年2月4日

摘要：数据解析聚焦爬虫：在通用爬虫的基础之上，可以将一张页面中局部指定的数据进行爬取。可以通过数据解析的方式将一张页面中局部的数据进行解析或者提取。数据解析方式：正则 bs4 xpath（重点） pyquery 聚焦爬虫编码流程：指定url 发起请求获取响应数据数据解析持久化存储数据解析的阅读全文

posted @ 2023-02-04 13:15 一头钻进被窝里阅读(203) 评论(0) 推荐(0)

2023年1月31日

爬虫基础-request模块使用

摘要： requests基本操作 requests作用：就是一个基于网络请求的模块，可以用来模拟浏览器发请求。环境安装： pip install requests requests模块的使用流程：指定一个字符串形式url 发起请求获取响应数据持久化存储 #需求：爬取搜狗首页的页面源码数据 impo 阅读全文

posted @ 2023-01-31 13:03 一头钻进被窝里阅读(80) 评论(0) 推荐(0)

2023年1月30日

爬虫基础-爬虫介绍及环境准备

摘要：什么是爬虫通过编写程序，让其模拟浏览器上网，然后去互联网上爬取数据的过程关键字：模拟：所谓的浏览器就是一款纯天然爬虫工具。爬取：抓取到一张页面的一整张数据抓取页面中的局部数据爬虫在使用场景中的分类? 通用爬虫需要将一整张数据进行爬取聚焦爬虫需要将页面中局部的指定数据进行爬取关联阅读全文

posted @ 2023-01-30 16:54 一头钻进被窝里阅读(57) 评论(0) 推荐(0)

2022年12月21日

docker安装及基本命令

摘要： Docker官网：https://docs.docker.com/ Docker的github地址：https://github.com/moby/moby Dockerhub官网 https://registry.hub.docker.com 如果docker官方registry拉取镜像速度很慢，阅读全文

posted @ 2022-12-21 11:32 一头钻进被窝里阅读(716) 评论(0) 推荐(0)

公告