摘要: 使用lxml解析网页和自动化测试 1 使用lxml解析网页 lxml库结合libxml2快速强大的特性,使用xpath语法来进行文件格式解析,与Beautiful相比,效率更高 1.1 XPath XPath,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的 阅读全文
posted @ 2021-11-20 12:05 你是我的生命之源 阅读(632) 评论(0) 推荐(0)
摘要: 基于爬取的数据进行分析-生成统计词云 本篇是通过生成词云来介绍相关库及相关知识,不讲解生成词云的具体操作 生成词云步骤: 1 分词处理--Jieba库 Jieba是一个用于中文分词处理的第三方库 Jieba分词的原理 利用中文词库,确定汉字之间的关联概率 汉字间概率大的组成词组,形成分词结果 除了分 阅读全文
posted @ 2021-11-20 11:49 你是我的生命之源 阅读(518) 评论(0) 推荐(0)
页脚