文章分类 -  Python爬虫

摘要:Python爬虫-数据采集应用 网络数据采集模块库 一、B/S程序的工作原理 浏览器/服务器 其主要通过 资源请求-相应 的模式运行 网络所有资源的定位均通过网络地址(即 url,uniform resource location 统一资源定位) HTTP协议: 用户 会向 Internet 发送  阅读全文

posted @ 2021-04-28 19:22 MissRong 阅读(267) 评论(0) 推荐(0) |

摘要:Python爬虫(二)【“新浪科技”爬虫】 一、MySQL 1、登陆MySQL mysql -u root -p 2、新建数据库、表 mysql> CREATE DATABASE sina_spider CHARACTER SET utf8; mysql> use sina_spiderDataba 阅读全文

posted @ 2021-02-11 23:13 MissRong 阅读(110) 评论(0) 推荐(0) |

摘要:Python爬虫(一)规则、知识储备、Python简介、原理和流程 一、爬虫需要遵循的规则 robots.txt文件中含有一些爬虫的限制 二、知识储备 1、Python/Java/Shell/R/... 2、HTML 3、深度优先、广度优先、OCR、分布式、Hash、Oracle、Redis、... 阅读全文

posted @ 2021-02-10 14:51 MissRong 阅读(160) 评论(0) 推荐(0) |

博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3