摘要: python爬虫(第四阶段13天,爬虫,大数据hadoop,数据结构) 1 爬虫介绍 爬虫可以爬取数据,进行分析统计 爬虫不可以干扰企业正常运行,不可以采取个人信息 爬虫分类: (1)通用网络爬虫,搜索引擎使用,遵守robots协议 (2)聚焦网络爬虫:自己写的爬虫程序 2 爬虫请求模块 2.1 r 阅读全文
posted @ 2022-02-07 20:38 zxinlog 阅读(200) 评论(0) 推荐(0)
摘要: 简单概括一下HTML的内容。 首先介绍一下HTML是个什么东西。 什么是 HTML? HTML,是用来描述网页的一种语言。,超文本标记语言,信息可以用文本,图片,声音,图像等等表示,用html语言编写文档,就可以包含其他形式的信息。使用大量的标签来描述网页。 基本标签: 结束标签需要加一个/。例如: 阅读全文
posted @ 2022-02-07 16:41 zxinlog 阅读(84) 评论(0) 推荐(0)
摘要: conda 此软件相当于一个对python的管理机制。可以创建不同版本的python 并且可以通过conda进行安装扩展三方库。 创建环境 conda create -n python36 python=3.6 python36是指设置的名称,-n也就是该环境的名称,python3.6表示创建的py 阅读全文
posted @ 2022-02-07 16:04 zxinlog 阅读(34) 评论(0) 推荐(0)
摘要: 文件传输 lrzsz 下载工具: sudo apt install lrzsz 然后使用rz就是接受文件。 sz就是发送文件。所以要使用sz + 文件名进行传输。 vnc传输 或者使用vnc图形化界面传输。 配置编译环境 python和C 安装python库: sudo apt install py 阅读全文
posted @ 2022-02-07 10:48 zxinlog 阅读(350) 评论(0) 推荐(0)