点击此处浏览总目录
摘要:第二章 掌握临界知识的底层思维与方法 跳出"低水平勤奋陷阱" 阅读全文
posted @ 2019-11-16 15:15 立业的博客 阅读 (3) 评论 (0) 编辑
摘要:《好好学习--个人知识管理精进指南》 阅读全文
posted @ 2019-11-16 15:11 立业的博客 阅读 (3) 评论 (0) 编辑
摘要:通常的导入方式 from lxml import etree python有自带的ElementTree库,但lxml在其基础上新增了特有的功能 如果代码仅使用ElementTree API,不依赖于lxml.etree特有的任何功能,那么还可使用(以下导入链的任何部分)作为回到原始ElementT 阅读全文
posted @ 2019-11-14 10:16 立业的博客 阅读 (6) 评论 (0) 编辑
摘要:ElementTree库附带了一个简单的类似XPath的路径语言ElementPath主要区别在于,可以在ElementPath表达式中使用{namespace}标记符号但是,诸如值比较和函数之类的高级功能不可用 只要树没有被修改,这个路径表达式就表示一个给定元素的标识符,以后可以用它在同一棵树中找 阅读全文
posted @ 2019-11-13 16:43 立业的博客 阅读 (4) 评论 (0) 编辑
摘要:E-factory为生成XML和HTML提供了一种简单而紧凑的语法 # coding:utf-8 from lxml.builder import E def CLASS(*args): # class is a reserved word in Python return {"class":' ' 阅读全文
posted @ 2019-11-13 16:13 立业的博客 阅读 (0) 评论 (0) 编辑
摘要:ElementTree API尽可能避免使用前缀,而是使用命名空间(URI) 创建带前缀和命名空间的xml树 # coding:utf-8 from lxml import etree #当使用命名空间http://www.w3.org/1999/xhtml时,会自动创建前缀html,并让其与之关联 阅读全文
posted @ 2019-11-13 15:43 立业的博客 阅读 (5) 评论 (0) 编辑
摘要:关于命名空间 阅读全文
posted @ 2019-11-12 17:38 立业的博客 阅读 (2) 评论 (0) 编辑
摘要:命名空间的作用是为了避免元素命名冲突 命名冲突 在XML中,元素名称是自定义的,当两个不同的XML树在同一个文档中使用相同的元素名时,就会发生命名冲突,如下:它们都使用到了<table>,XML解析器无法确定如何处理这类冲突 <!--以下表示HTML表格的信息--> <table> <tr> <td 阅读全文
posted @ 2019-11-12 17:37 立业的博客 阅读 (8) 评论 (0) 编辑
摘要:有时我们需要的只是树内某个地方的一小部分,因此将整个树解析到内存中,全体遍历并进行相关操作造成的内存开销会很大因此,etree提供了两个事件驱动的解析器接口一个是在构建树时,生成解析器事件(iterparse)另一个根本不构建树,而是以类似SAX的方式调用目标对象的反馈方法 some_file_li 阅读全文
posted @ 2019-11-11 16:18 立业的博客 阅读 (3) 评论 (0) 编辑
摘要:etree支持以多种方式和所有重要来源解析XML,即字符串、文件、url(http/ftp)和类文件对象主要的解析函数是fromstring()和parse(),都是以源作为第一个参数调用的默认情况下,它们使用标准解析器,但您始终可以将不同的解析器作为第二个参数传递 fromstring()函数 s 阅读全文
posted @ 2019-11-11 15:35 立业的博客 阅读 (4) 评论 (0) 编辑