2013年8月26日

摘要: 今早看到了一个bisect 算法,觉得很有意思,想研究一下。这是一个python 的标准库函数,他能帮我们一直维护一个有序的列表,即使是有新的元素插入。主要使用了bisection 算法来完成这一功能。听起来很炫,仔细一想,其实就是二分查找法,和原来的插入排序中使用二分查找的方式确定后一个元素的插入位置是一个道理的。wiki上的解释也是如此。The method is also called thebinary search method[2]or thedichotomy method.[3] This module provides support for maintaining a l. 阅读全文
posted @ 2013-08-26 10:13 Harveyaot 阅读(461) 评论(0) 推荐(0)

2013年8月21日

摘要: >>> d{'1': '3', '3': '1', '2': '2'}>>> zip(sorted(d.items()))[(('1', '3'),), (('2', '2'),), (('3', '1'),)]>>> zip(*sorted(d.items()))[('1', '2', '3'), (& 阅读全文
posted @ 2013-08-21 09:05 Harveyaot 阅读(3610) 评论(0) 推荐(0)

2013年8月5日

摘要: 在Excel中,如果需要统计数值的在指定区间内出现频率,可以使用FREQUENCY函数统计数值的在指定区间内出现频率。Excel2007可使用FREQUENCY函数统计数值的在指定区间内出现频率。如上图所示,选中“D2:D6”单元格区域,在编辑栏输入公式:=FREQUENCY(A2:A11,B2:B5)按“Ctrl+Shift+回车”组合键输入数组公式即可统计数值的在指定区间内出现频率。返回学生成绩在各成绩区间的人数。Excel2007可使用FREQUENCY函数统计数值的在指定区间内出现频率。相关说明:FREQUENCY函数语法:FREQUENCY(data_array,bins_array 阅读全文
posted @ 2013-08-05 16:50 Harveyaot 阅读(1865) 评论(0) 推荐(0)

2013年8月2日

摘要: 1,灵活的复制,删除,选中ci'、ci"、ci(、ci[、ci{、ci< - 分别更改这些配对标点符号中的文本内容di'、di"、di(或dib、di[、di{或diB、di< - 分别删除这些配对标点符号中的文本内容yi'、yi"、yi(、yi[、yi{、yi< - 分别复制这些配对标点符号中的文本内容vi'、vi"、vi(、vi[、vi{、vi< - 分别选中这些配对标点符号中的文本内容2,撤销 和恢复撤销u 撤销上一步的操作Ctrl+r 恢复上一步被撤销的操作3,灵活移动光标 你还可以按百分比 阅读全文
posted @ 2013-08-02 14:58 Harveyaot 阅读(240) 评论(0) 推荐(0)

2013年8月1日

摘要: 1,motivation: 需要将多个零散的统一格式文件中一行抽取出来(ex:所有文件第三行都是描述url信息)2,trial 使用sed -n ‘3p’ * 发现 只能打印出一行,多次实验后不明原因之后放弃,改用shell脚本#!/bin/bashfor file in `ls ./`do echo $file if [[ $file == std* ]] then sed -n '3p' $file >> tmp1 fidone虽然该方案能够解决问题,但不是最优方案。3,optimal solution 再次 search sed 的相关信息,ma... 阅读全文
posted @ 2013-08-01 18:04 Harveyaot 阅读(1663) 评论(0) 推荐(0)

2013年7月26日

摘要: 本文转自 longriver.me 最近使用朋友的一台centos的服务器,没有root权限,已有mysql也没有创建数据库的权限,因此想自己安装一个新的mysql,没想到安装起来颇费一番周折。下文将安装过程中出现的问题总结一下,让诸位看官可以少走弯路。 1,下载源码包,cmake,cmake 编译安装主要参考http://blog.csdn.net/westmaniac/article/details/6535000一文。但是注意,cmake . / -DCMAKE_INSTALL_PREFIX=/usr/local/mysql / -DINSTALL_DATADIR=/usr/local. 阅读全文
posted @ 2013-07-26 00:18 Harveyaot 阅读(210) 评论(0) 推荐(0)

2013年7月22日

摘要: 1,首先要确保hadoop上的python 版本和自己开发机器上最好是统一版本。2,在hadoop上引入第三方库时,可以将job 依赖的所有第三方的third-party package都放进 ./lib 中 使用tar 打包 成 tgz格式(注意如果此处没有使用 -z而命名为tgz,使用--archives提交该文件的时候,会引起job的失败 )3, --archives 参数 参考hadoop streaming的指南文档,会自动上传到job 的task目录并且自动解压缩,可以使用#表示解压缩后的文件夹名称4,注意在python 脚本中添加sys.path.insert(0,'li 阅读全文
posted @ 2013-07-22 15:22 Harveyaot 阅读(1526) 评论(0) 推荐(0)

2013年7月18日

摘要: 1,解决broke pipe 问题,当程序内部出现swallowed exceoption 的时候,stdout 就关闭了,此时再输出,就有broken pipe 问题 阅读全文
posted @ 2013-07-18 17:15 Harveyaot 阅读(139) 评论(0) 推荐(0)
摘要: 如果g++ -o 制定目标名字-c 表示不生成 可执行代码。 阅读全文
posted @ 2013-07-18 11:14 Harveyaot 阅读(175) 评论(0) 推荐(0)

2013年7月17日

摘要: $? :比目标的修改时间更晚的那些依赖模块表。$@ :当前目标的全路径名。可用于用户定义的目标名的相关行中。$< :比给定的目标文件时间标记更新的依赖文件名。$* :去掉后缀的当前目标名。例如,若当前目标是pro.o,则$*表示pro。make默认寻找叫makefile或Makefile的文件,自己指定的话用 make -f 文件名"#": 注释符命令行首的"@":取消本行命令回显1.规则的基本格式:目标:依赖[tab]命令 <----------命令开头要一个[tab]键例0:hello:main.o func1.o func2.o gcc 阅读全文
posted @ 2013-07-17 11:07 Harveyaot 阅读(197) 评论(0) 推荐(0)

导航