摘要: lxml是一个非常方便的解析工具,首先了解一下lxml在整个爬虫开发流程中的作用。 爬虫可简单可复杂,视爬虫对象、任务不同而不同。我们的目标是用最简单最有效的方法来快速获取想要的信息。 这里给出一个简单例子:爬取 "信用信息公示系统" 中,企业信息详情。 如下图所示: 1 实例 首先确定lxml规则阅读全文
posted @ 2018-05-06 15:36 畑鹿驚 阅读(12) 评论(0) 编辑
摘要: golang http://www.cnblogs.com/golove/p/3269099.html阅读全文
posted @ 2018-03-28 00:04 畑鹿驚 阅读(3) 评论(0) 编辑
摘要: 依赖项 http://unix.stackexchange.com/questions/291737/zipimport zipimporterror cant decompress data zlib not available 安装 注意make install完成后不应该出现Ignoring 阅读全文
posted @ 2018-03-21 00:02 畑鹿驚 阅读(98) 评论(0) 编辑
摘要: sed是以行为单位的文本处理工具,awk则以列为单位。 文件都是结构化的,都是有单词和空白字符组成的。 空白字符包括空格、tab以及连续的空格和tab。每个非空白部分叫做域, 表示 全部域, 表示第1个域等等…… 默认以空白字符为分隔符,打印前两列 指定其他分割符,打印前两列 内部变量NF表示每行有阅读全文
posted @ 2017-12-16 21:26 畑鹿驚 阅读(20) 评论(0) 编辑
摘要: 安装 docker加速器 https://cr.console.aliyun.com/ /accelerator sh sudo mkdir p /etc/docker sudo tee /etc/docker/daemon.json阅读全文
posted @ 2017-12-02 22:39 畑鹿驚 阅读(18) 评论(0) 编辑
摘要: JPA(Java Persistence API)是一个基于O/R映射(Object Relational Mapping)的标准规范,主要实现包括Hibernate、EclipseLink和OpenJPA等。 orm框架的本质是简化编程中操作数据库的编码[2],JPA 方便程序员不写sql语句,而阅读全文
posted @ 2017-12-02 22:35 畑鹿驚 阅读(54) 评论(0) 编辑
摘要: JavaScript是一门脚本语言,并不包含编译器,所以无法保证类型安全。 单元测试可以弥补编译器的缺乏,找出潜在的缺陷。 1 Jasmine测试框架 "Jasmine" 是一种测试框架,定义了测试用例的语法、API、如何编写断言等等。类似的产品还包括Mocha等。 或者直接用浏览器打开browse阅读全文
posted @ 2017-11-11 17:23 畑鹿驚 阅读(75) 评论(0) 编辑
摘要: 问题描述 输出报表的项目中有一个需求是把多级菜单输出到excel中。比如菜单“5”下面包含子菜单“1”和“2”。子菜单下面又有菜单。一共三级。 我们很容易把菜单数据直接输出,如图(a)所示。 合并冗余项之后如图(b)所示。 具体如何合并菜单呢? 已经有函数可以把给定区域序号之间的单元格合并。合并之后阅读全文
posted @ 2017-11-05 19:38 畑鹿驚 阅读(22) 评论(0) 编辑
摘要: Spring框架概述 Spring大约包含了20个模块,这些模块组成了核心容器(Core Container)、数据访问/集成(Data Access/Integration)、Web、AOP(面向切面编程,Aspect Oriented Programming)、Instrumentation、消阅读全文
posted @ 2017-10-14 15:28 畑鹿驚 阅读(1192) 评论(0) 编辑
摘要: 从一个用户导出导入到另一个用户 问题 环境:oracle 11g; redhat 6 usera是具有DBA权限,密码为usera 全量导出usera用户下的所有内容,并导入到新建的userb用户 解决 创建Directory: 1、重新测试之前要恢复环境 2、创建表空间和用户及赋权 3、schem阅读全文
posted @ 2017-09-28 19:27 畑鹿驚 阅读(46) 评论(0) 编辑