摘要: 边学边写代码,记录下来。这段代码用于批量抓取主站下所有子网页中符合特定尺寸要求的的图片文件,支持中断。原理很简单:使用BeautifulSoup4分析网页,获取网页和元素,对集合反复弹栈入栈,对集合进行筛选下载。具体代码如下:import osimport sysimport timeimport ... 阅读全文
posted @ 2014-11-07 15:16 xshrim 阅读(2405) 评论(0) 推荐(0) 编辑
摘要: 今天看Python CookBook中关于“求list中最大(最小)的N个元素”的内容,介绍了直接使用python的heapq模块的nlargest和nsmallest函数的解决方式,记得学习数据结构的时候有个堆排序算法,所以顺便研究了一下“堆”结构(这里特指二叉堆)。概念所谓二叉堆(binary ... 阅读全文
posted @ 2014-11-06 17:32 xshrim 阅读(8105) 评论(0) 推荐(0) 编辑
摘要: 根据http://www.oschina.net/code/snippet_70229_2407修改而来的增强版。貌似原版源自Axel这个多线程下载工具。'''Created on 2014-10-24@author: Maple'''import sysimport osimport timeim... 阅读全文
posted @ 2014-10-24 13:47 xshrim 阅读(747) 评论(0) 推荐(0) 编辑
摘要: 引言一直用的Ubuntu 32位系统(准备下次用Fedora,Ubuntu越来越不适合学习了),今天准备学习一下Hadoop,结果下载Apache官网上发布的最新的封装好的2.5.1版,配置完了根本启动不起来,查看错误日志发现是native库的版本和系统不一致,使用file命令可以发现封装版的nat... 阅读全文
posted @ 2014-10-22 18:00 xshrim 阅读(525) 评论(0) 推荐(0) 编辑
摘要: 最近在Kubuntu14.04上安装Eclipse,由于Ubuntu软件中心中的版本太老(3.8),而且会自动安装OpenJDK,于是到官网下载最新的4.4版。(Luna,代号很有亲切感有木有,女神万岁,暗月万岁,懂的都懂)问题Eclipse谈不上什么安装,非要说安装也就是创建一下启动快捷方式吧:s... 阅读全文
posted @ 2014-10-18 11:32 xshrim 阅读(955) 评论(0) 推荐(0) 编辑
摘要: 引言找了很多Python GUI工具集,还是觉得PyQt比较理想,功能强大跨平台,还支持界面设计器。花一天时间折腾了Ubuntu14.04(32位)+ Python3.4 + Qt5.3.2 + PyQt5.3.2 + Eric6.0 的完整开发平台的搭建,各种出错差点放弃了,好在终于一一解决了,记... 阅读全文
posted @ 2014-10-14 14:49 xshrim 阅读(1309) 评论(3) 推荐(0) 编辑
摘要: 这两天在Ubuntu上安装Oracle把人折腾毁了,即使照着网上的教程来,还是出了很多问题。好在最后终于搞定了。写出来总结一下,免得以后忘了。标题注明32位是因为网上教程几乎全是以64位安装为例的,32位系统下照着做是绝对会安装失败的。出现的问题主要有两方面,一个是安装过程中出现的,另一个是安装完成... 阅读全文
posted @ 2013-06-06 18:50 xshrim 阅读(454) 评论(0) 推荐(0) 编辑
摘要: 引言考虑下面的情况:一张表T,有列C1,C2,C3,C4,C5。其中C1上有索引C1X,C2上有索引C2X,C3,C4,C5上有索引C345X。表中有100000000行数据。查询语句:Select * From T Where C1=20 And C2=5 And C3=11;前面介绍过,对于一张... 阅读全文
posted @ 2012-11-17 15:42 xshrim 阅读(502) 评论(0) 推荐(0) 编辑
摘要: 在《DB2数据库查询过程(Query Processing)----简单索引访问(Simple Indexed Access)》一文中已经对索引访问的各种形式作了详细介绍,本文重点讨论匹配索引扫描对于复合索引的种种情况应该如何进行索引的选择。复合索引(Composite Index)索引列(搜索码)... 阅读全文
posted @ 2012-11-17 12:58 xshrim 阅读(561) 评论(0) 推荐(0) 编辑
摘要: 在 DB2 优化器中使用分布统计信息简介为了执行查询或 DML 语句(INSERT、UPDATE、DELETE),DB2 必须创建一个访问计划(access plan)。访问计划定义按什么顺序访问表,使用哪些索引,以及用何种连接(join)方法来关联数据。好的访问计划对于 SQL 语句的快速执行至关... 阅读全文
posted @ 2012-11-17 12:50 xshrim 阅读(531) 评论(0) 推荐(0) 编辑