博客园 - 百小度治哥
uuid:24b78886-0ed1-41c2-8670-e3f31dcf42c4;id=95592
2016-12-15T05:25:45Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
feed.cnblogs.com
https://www.cnblogs.com/xupeizhi/p/6182838.html
解决python字典结构内存暴涨问题 - 百小度治哥
背景:当读取一个key value数据的时候,python的字典结构会造成内存使用扩10倍左右,无可容忍。此文解决这个问题 数据:word2vec训练的结果,word对应400维的词向量。词表共1.6G左右 解决方案:利用python的class array进行解决。 步骤:1、将原始数据,转化成k
2016-12-15T05:24:00Z
2016-12-15T05:24:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】背景:当读取一个key value数据的时候,python的字典结构会造成内存使用扩10倍左右,无可容忍。此文解决这个问题 数据:word2vec训练的结果,word对应400维的词向量。词表共1.6G左右 解决方案:利用python的class array进行解决。 步骤:1、将原始数据,转化成k <a href="https://www.cnblogs.com/xupeizhi/p/6182838.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/p/3804491.html
Python 程序员经常犯的 10 个错误 - 百小度治哥
关于PythonPython是一种解释性、面向对象并具有动态语义的高级程序语言。它内建了高级的数据结构,结合了动态类型和动态绑定的优点,这使得...关于PythonPython是一种解释性、面向对象并具有动态语义的高级程序语言。它内建了高级的数据结构,结合了动态类型和动态绑定的优点,这使得它在快速应...
2014-06-23T09:43:00Z
2014-06-23T09:43:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】关于PythonPython是一种解释性、面向对象并具有动态语义的高级程序语言。它内建了高级的数据结构,结合了动态类型和动态绑定的优点,这使得...关于PythonPython是一种解释性、面向对象并具有动态语义的高级程序语言。它内建了高级的数据结构,结合了动态类型和动态绑定的优点,这使得它在快速应... <a href="https://www.cnblogs.com/xupeizhi/p/3804491.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/p/3341294.html
python操作mysql数据库的相关操作实例 - 百小度治哥
python操作mysql数据库的相关操作实例# -*- coding: utf-8 -*-#python operate mysql databaseimport MySQLdb #数据库名称DATABASE_NAME = ''#host = 'localhost' or '172.0.0.1'HOST = ''#端口号PORT = ''#用户名称USER_NAME = ''#数据库密码PASSWORD = ''#数据库编码CHAR_SET = '' #初始化参数d
2013-09-26T10:00:00Z
2013-09-26T10:00:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】python操作mysql数据库的相关操作实例# -*- coding: utf-8 -*-#python operate mysql databaseimport MySQLdb #数据库名称DATABASE_NAME = ''#host = 'localhost' or '172.0.0.1'HOST = ''#端口号PORT = ''#用户名称USER_NAME = ''#数据库密码PASSWORD = ''#数据库编码CHAR_SET = '' #初始化参数d <a href="https://www.cnblogs.com/xupeizhi/p/3341294.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/p/3207976.html
如何成为python高手 - 百小度治哥
本文是从 How to become a proficient Python programmer 这篇文章翻译而来。这篇文章主要是对我收集的一些文章的摘要。因为已经有很多比我有才华的人写出了大量关于如何成为优秀Python程序员的好文章。我的总结主要集中在四个基本题目上:函数式编程,性能,测试,编码规范。如果一个程序员能将这四个方面的内容知识都吸收消化,那他/她不管怎样都会有巨大的收获。函数式编程命令式的编程风格已经成为事实上的标准。命令式编程的程序是由一些描述状态转变的语句组成。虽然有时候这种编程方式十分的有效,但有时也不尽如此(比如复杂性) —— 而且,相对于声明式编程方式,它可能会显得
2013-07-23T01:15:00Z
2013-07-23T01:15:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】本文是从 How to become a proficient Python programmer 这篇文章翻译而来。这篇文章主要是对我收集的一些文章的摘要。因为已经有很多比我有才华的人写出了大量关于如何成为优秀Python程序员的好文章。我的总结主要集中在四个基本题目上:函数式编程,性能,测试,编码规范。如果一个程序员能将这四个方面的内容知识都吸收消化,那他/她不管怎样都会有巨大的收获。函数式编程命令式的编程风格已经成为事实上的标准。命令式编程的程序是由一些描述状态转变的语句组成。虽然有时候这种编程方式十分的有效,但有时也不尽如此(比如复杂性) —— 而且,相对于声明式编程方式,它可能会显得 <a href="https://www.cnblogs.com/xupeizhi/p/3207976.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/p/3196001.html
最大熵工具包的使用 - 百小度治哥
最大熵是自然语言处理中经常用到的一种统计方 法。网上也有很多最大熵方面的工具包,目前大家用得最多的应该是张乐博士写的最大熵工具包了。该工具包既可以采用命令行形式运行,也可以直接调用接口函 数,为大家的研究工作带来了很大的方便。但是,对于刚接触到该工具包的人来说,使用起来还是有些麻烦的。一、命令行形式使用方法 1、利用命令行形式,首先要准备好特征文件。特征文件的格式在最大熵工具包的使用说明书(manual20041229.pdf)的P24。 特征文件中,一行就是一个事件(event),其格式首先是该event对应的类别label,然后是特征feature,两者都是string类型的。如果feat
2013-07-17T07:49:00Z
2013-07-17T07:49:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】最大熵是自然语言处理中经常用到的一种统计方 法。网上也有很多最大熵方面的工具包,目前大家用得最多的应该是张乐博士写的最大熵工具包了。该工具包既可以采用命令行形式运行,也可以直接调用接口函 数,为大家的研究工作带来了很大的方便。但是,对于刚接触到该工具包的人来说,使用起来还是有些麻烦的。一、命令行形式使用方法 1、利用命令行形式,首先要准备好特征文件。特征文件的格式在最大熵工具包的使用说明书(manual20041229.pdf)的P24。 特征文件中,一行就是一个事件(event),其格式首先是该event对应的类别label,然后是特征feature,两者都是string类型的。如果feat <a href="https://www.cnblogs.com/xupeizhi/p/3196001.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/p/3195088.html
克隆列表 - 百小度治哥
如果要修改列表,但是要保留原来列表的一份拷贝,就需要列表自我复制,这过程叫做克隆。克隆的结果是产生两个值一样,但却有不同标识符的列表。克隆的方法是利用列表的片断操作符:>>> x = [1, 3, 5, 7]>>> y = x[:]>>> print y[1, 3, 5, 7]>>> y[0] = 9>>> print y[9, 3, 5, 7]>>> print x[1, 3, 5, 7]>>> id(x)13161832>>> id(y)13075
2013-07-17T01:33:00Z
2013-07-17T01:33:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】如果要修改列表,但是要保留原来列表的一份拷贝,就需要列表自我复制,这过程叫做克隆。克隆的结果是产生两个值一样,但却有不同标识符的列表。克隆的方法是利用列表的片断操作符:>>> x = [1, 3, 5, 7]>>> y = x[:]>>> print y[1, 3, 5, 7]>>> y[0] = 9>>> print y[9, 3, 5, 7]>>> print x[1, 3, 5, 7]>>> id(x)13161832>>> id(y)13075 <a href="https://www.cnblogs.com/xupeizhi/p/3195088.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/p/3174703.html
scikit-learn使用笔记与sign prediction简单小结 - 百小度治哥
经Edwin Chen的推荐,认识了scikit-learn这个非常强大的python机器学习工具包。这个帖子作为笔记。(其实都没有笔记的意义,因为他家文档做的太好了,不过还是为自己记记吧,为以后节省若干分钟)。如果有幸此文被想用scikit-learn的你看见,也还是非常希望你去它们的主页看文档。主页中最值得关注的几个部分:User Guide几乎是machine learning的索引,各种方法如何使用都有,Reference是各个类的用法索引。S1. 导入数据大多数数据的格式都是M个N维向量,分为训练集和测试集。所以,知道如何导入向量(矩阵)数据是最为关键的一点。这里要用到numpy来协
2013-07-05T15:50:00Z
2013-07-05T15:50:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】经Edwin Chen的推荐,认识了scikit-learn这个非常强大的python机器学习工具包。这个帖子作为笔记。(其实都没有笔记的意义,因为他家文档做的太好了,不过还是为自己记记吧,为以后节省若干分钟)。如果有幸此文被想用scikit-learn的你看见,也还是非常希望你去它们的主页看文档。主页中最值得关注的几个部分:User Guide几乎是machine learning的索引,各种方法如何使用都有,Reference是各个类的用法索引。S1. 导入数据大多数数据的格式都是M个N维向量,分为训练集和测试集。所以,知道如何导入向量(矩阵)数据是最为关键的一点。这里要用到numpy来协 <a href="https://www.cnblogs.com/xupeizhi/p/3174703.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/p/3173510.html
python数据结构 - 百小度治哥
. 数据结构¶.1. 深入列表¶链表类型有很多方法,这里是链表类型的所有方法:list.append(x)把一个元素添加到链表的结尾,相当于 a[len(a):] = [x] 。list.extend(L)将一个给定列表中的所有元素都添加到另一个列表中,相当于 a[len(a):] = L 。list.insert(i, x)在指定位置插入一个元素。第一个参数是准备插入到其前面的那个元素的索引,例如 a.insert(0, x) 会插入到整个链表之前,而 a.insert(len(a), x) 相当于 a.append(x) 。list.remove(x)删除链表中值为 x
2013-07-05T05:01:00Z
2013-07-05T05:01:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】. 数据结构¶.1. 深入列表¶链表类型有很多方法,这里是链表类型的所有方法:list.append(x)把一个元素添加到链表的结尾,相当于 a[len(a):] = [x] 。list.extend(L)将一个给定列表中的所有元素都添加到另一个列表中,相当于 a[len(a):] = L 。list.insert(i, x)在指定位置插入一个元素。第一个参数是准备插入到其前面的那个元素的索引,例如 a.insert(0, x) 会插入到整个链表之前,而 a.insert(len(a), x) 相当于 a.append(x) 。list.remove(x)删除链表中值为 x <a href="https://www.cnblogs.com/xupeizhi/p/3173510.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/p/3155776.html
给大家推荐PYTHON网站 - 百小度治哥
有些比较知名的,像 资源汇总的http://bbs.linuxtone.org/forum.php?mod=viewthread&tid=2133google的https://code.google.com/intl/zh-CN/edu/languages/google-python-class/社区之http://bbs.chinaunix.net/forum.php?mod=forumdisplay&fid=55IT公司面试手册:http://www.mianwww.com/上面三个名气应该比较大了,下面可能就不是这么知名了,从网上逛出来的:纯PYTHON练习网站:http
2013-06-25T14:58:00Z
2013-06-25T14:58:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】有些比较知名的,像 资源汇总的http://bbs.linuxtone.org/forum.php?mod=viewthread&tid=2133google的https://code.google.com/intl/zh-CN/edu/languages/google-python-class/社区之http://bbs.chinaunix.net/forum.php?mod=forumdisplay&fid=55IT公司面试手册:http://www.mianwww.com/上面三个名气应该比较大了,下面可能就不是这么知名了,从网上逛出来的:纯PYTHON练习网站:http <a href="https://www.cnblogs.com/xupeizhi/p/3155776.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/archive/2013/06/07/3124182.html
简洁的bash编程技巧 - 百小度治哥
下面这几条是我自己在写shell代码的时候,比较喜欢的几种写法,抛砖引玉。 1) 检查命令执行是否成功 第一种写法,比较常见:1234567echo abcdee | grep -q abcdif [ $? -eq 0 ]; thenecho "Found"elseecho "Not found"fi 简洁的写法:12345if echo abcdee | grep -q abc; thenecho "Found"elseecho "Not found"fi 当然你也可以不要if/else,不过这样可读性比较差:1
2013-06-07T08:53:00Z
2013-06-07T08:53:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】下面这几条是我自己在写shell代码的时候,比较喜欢的几种写法,抛砖引玉。 1) 检查命令执行是否成功 第一种写法,比较常见:1234567echo abcdee | grep -q abcdif [ $? -eq 0 ]; thenecho "Found"elseecho "Not found"fi 简洁的写法:12345if echo abcdee | grep -q abc; thenecho "Found"elseecho "Not found"fi 当然你也可以不要if/else,不过这样可读性比较差:1 <a href="https://www.cnblogs.com/xupeizhi/archive/2013/06/07/3124182.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/archive/2013/05/20/3088779.html
linux中强大的screen命令 - 百小度治哥
今天发现了一个“宝贝”,就是Linux的screen命令,对于远程登录来说,不仅提供了类似于nohup的功能,而且提供了我非常喜欢的“多个桌面”的功能。平常开一个putty远程登录,经常需要在两个程序之间来回切换,怎么办?ctrl-z和fg、bg?这些太麻烦了。其实我们可以借助screen命令来实现轻松便捷的切换。我主要是参考了下面的两篇文章(附在结尾),我自己总结的方法是:“首先用screen [-S]命令建立一个session,然后就可以在这个session中建立多个window了。使用screen [-S]可以建立多个session,而每个session又可以建立多个window。在不同
2013-05-20T08:10:00Z
2013-05-20T08:10:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】今天发现了一个“宝贝”,就是Linux的screen命令,对于远程登录来说,不仅提供了类似于nohup的功能,而且提供了我非常喜欢的“多个桌面”的功能。平常开一个putty远程登录,经常需要在两个程序之间来回切换,怎么办?ctrl-z和fg、bg?这些太麻烦了。其实我们可以借助screen命令来实现轻松便捷的切换。我主要是参考了下面的两篇文章(附在结尾),我自己总结的方法是:“首先用screen [-S]命令建立一个session,然后就可以在这个session中建立多个window了。使用screen [-S]可以建立多个session,而每个session又可以建立多个window。在不同 <a href="https://www.cnblogs.com/xupeizhi/archive/2013/05/20/3088779.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/archive/2013/05/13/3076269.html
python汇总 - 百小度治哥
Python是一种面向对象的解释性的计算机程序设计语言,也是一种功能强大且完善的通用型语言,已经有十多年的发展历史,成熟且稳定。Python 具有脚本语言中最丰富和强大的类库,足以支持绝大多数日常应用。Python语言有非常简捷、清晰的语法特点,适合完成各种高层任务,可以在所有操作系统中运行。目前,基于这种语言的相关技术正在飞速的发展,用户数量急剧扩大,相关的资源非常多。Python的创始人为Guido van Rossum。1989年圣诞节期间,在阿姆斯特丹,Guido为了打发圣诞节的无趣,决心开发一个新的脚本解释程序,做为 ABC 语言的一种继承。之所以选中 Python(大蟒蛇的意思)作
2013-05-13T10:43:00Z
2013-05-13T10:43:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】Python是一种面向对象的解释性的计算机程序设计语言,也是一种功能强大且完善的通用型语言,已经有十多年的发展历史,成熟且稳定。Python 具有脚本语言中最丰富和强大的类库,足以支持绝大多数日常应用。Python语言有非常简捷、清晰的语法特点,适合完成各种高层任务,可以在所有操作系统中运行。目前,基于这种语言的相关技术正在飞速的发展,用户数量急剧扩大,相关的资源非常多。Python的创始人为Guido van Rossum。1989年圣诞节期间,在阿姆斯特丹,Guido为了打发圣诞节的无趣,决心开发一个新的脚本解释程序,做为 ABC 语言的一种继承。之所以选中 Python(大蟒蛇的意思)作 <a href="https://www.cnblogs.com/xupeizhi/archive/2013/05/13/3076269.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/archive/2013/05/05/3060605.html
Linux必学的命令 - 百小度治哥
Linux必学的命令Linux提供了大量的命令,利用它可以有效地完成大量的工作,如磁盘操作、文件存取、目录操作、进程管理、文件权限设定等。所以,在Linux系统上工作离不开使用系统提供的命令。要想真正理解Linux系统,就必须从Linux命令学起,通过基础的命令学习可以进一步理解Linux系统。不同Linux发行版的命令数量不一样,但Linux发行版本最少的命令也有200多个。这里笔者把比较重要和使用频率最多的命令,按照它们在系统中的作用分成下面六个部分一一介绍。◆ 安装和登录命令:login、shutdown、halt、reboot、install、mount、umount、chsh、exi
2013-05-05T01:39:00Z
2013-05-05T01:39:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】Linux必学的命令Linux提供了大量的命令,利用它可以有效地完成大量的工作,如磁盘操作、文件存取、目录操作、进程管理、文件权限设定等。所以,在Linux系统上工作离不开使用系统提供的命令。要想真正理解Linux系统,就必须从Linux命令学起,通过基础的命令学习可以进一步理解Linux系统。不同Linux发行版的命令数量不一样,但Linux发行版本最少的命令也有200多个。这里笔者把比较重要和使用频率最多的命令,按照它们在系统中的作用分成下面六个部分一一介绍。◆ 安装和登录命令:login、shutdown、halt、reboot、install、mount、umount、chsh、exi <a href="https://www.cnblogs.com/xupeizhi/archive/2013/05/05/3060605.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/archive/2013/04/22/3035862.html
Python 的列表排序 - 百小度治哥
在 Python 中, 当需要对一个 list 排序时, 一般可以用 list.sort() 或者 sorted(iterable[, cmp[, key[, reverse]]]).其中:cmp(e1, e2) 是带两个参数的比较函数, 返回值: 负数: e1 < e2, 0: e1 == e2, 正数: e1 > e2. 默认为 None, 即用内建的比较函数.key 是带一个参数的函数, 用来为每个元素提取比较值. 默认为 None, 即直接比较每个元素.reverse 是一个布尔值, 表示是否反转比较结果.我以前在做比较复杂的排序时, 喜欢写一个定制的 cmp 函数. 当我
2013-04-22T08:47:00Z
2013-04-22T08:47:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】在 Python 中, 当需要对一个 list 排序时, 一般可以用 list.sort() 或者 sorted(iterable[, cmp[, key[, reverse]]]).其中:cmp(e1, e2) 是带两个参数的比较函数, 返回值: 负数: e1 < e2, 0: e1 == e2, 正数: e1 > e2. 默认为 None, 即用内建的比较函数.key 是带一个参数的函数, 用来为每个元素提取比较值. 默认为 None, 即直接比较每个元素.reverse 是一个布尔值, 表示是否反转比较结果.我以前在做比较复杂的排序时, 喜欢写一个定制的 cmp 函数. 当我 <a href="https://www.cnblogs.com/xupeizhi/archive/2013/04/22/3035862.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/archive/2013/04/03/2997357.html
shell——tr的用法 - 百小度治哥
tr(translate缩写)主要用于删除文件中的控制字符,或进行字符转换。语法:tr [–c/d/s/t] [SET1] [SET2]SET1: 字符集1SET2:字符集2-c:complement,用SET2替换SET1中没有包含的字符-d:delete,删除SET1中所有的字符,不转换-s: squeeze-repeats,压缩SET1中重复的字符-t: truncate-set1,将SET1用SET2转换,一般缺省为-t 1、去除重复的字符#将连续的几个相同字符压缩为一个字符$ echo aaacccddd | tr -s [a-z]acd$ echo aaacccddd | tr -
2013-04-03T02:22:00Z
2013-04-03T02:22:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】tr(translate缩写)主要用于删除文件中的控制字符,或进行字符转换。语法:tr [–c/d/s/t] [SET1] [SET2]SET1: 字符集1SET2:字符集2-c:complement,用SET2替换SET1中没有包含的字符-d:delete,删除SET1中所有的字符,不转换-s: squeeze-repeats,压缩SET1中重复的字符-t: truncate-set1,将SET1用SET2转换,一般缺省为-t 1、去除重复的字符#将连续的几个相同字符压缩为一个字符$ echo aaacccddd | tr -s [a-z]acd$ echo aaacccddd | tr - <a href="https://www.cnblogs.com/xupeizhi/archive/2013/04/03/2997357.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/archive/2013/04/02/2995265.html
python中随机数的查找 - 百小度治哥
1. random.random() 用于生成一个0到1的随机符点数: 0 <= n < 1.02. random.uniform(a,b) 用于生成一个指定范围内的随机符点数,两个参数其中一个是上限,一个是下限。如果a > b,则生成的随机数n: a <= n <= b。如果 a <b, 则 b <= n <= a。print random.uniform(10, 20) print random.uniform(20, 10) 3. random.randint(a,b) 用于生成sa一个指定范围内的整数。其中参数a是下限,参数b是上限,生成
2013-04-02T05:01:00Z
2013-04-02T05:01:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】1. random.random() 用于生成一个0到1的随机符点数: 0 <= n < 1.02. random.uniform(a,b) 用于生成一个指定范围内的随机符点数,两个参数其中一个是上限,一个是下限。如果a > b,则生成的随机数n: a <= n <= b。如果 a <b, 则 b <= n <= a。print random.uniform(10, 20) print random.uniform(20, 10) 3. random.randint(a,b) 用于生成sa一个指定范围内的整数。其中参数a是下限,参数b是上限,生成 <a href="https://www.cnblogs.com/xupeizhi/archive/2013/04/02/2995265.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/archive/2013/04/02/2995122.html
Python中几个操作列表的内置函数filter(),map(),reduce(),lambda - 百小度治哥
Python内置了一些非常有趣但非常有用的函数,充分体现了Python的语言魅力!filter(function, sequence):对sequence中的item依次执行function(item),将执行结果为True的item组成一个List/String/Tuple(取决于sequence的类型)返回:>>> def f(x): return x % 2 != 0 and x % 3 != 0 >>> filter(f, range(2, 25)) [5, 7, 11, 13, 17, 19, 23]>>> def f(x): r
2013-04-02T03:31:00Z
2013-04-02T03:31:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】Python内置了一些非常有趣但非常有用的函数,充分体现了Python的语言魅力!filter(function, sequence):对sequence中的item依次执行function(item),将执行结果为True的item组成一个List/String/Tuple(取决于sequence的类型)返回:>>> def f(x): return x % 2 != 0 and x % 3 != 0 >>> filter(f, range(2, 25)) [5, 7, 11, 13, 17, 19, 23]>>> def f(x): r <a href="https://www.cnblogs.com/xupeizhi/archive/2013/04/02/2995122.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/archive/2013/04/01/2993773.html
python--删除list中重复的元素 - 百小度治哥
1 lists=[35,20,12,34,12,24,34,55,27]2 print list(set(lists))3 #保留原list顺序4 sorted(set(lists),key=lists.index)
2013-04-01T08:36:00Z
2013-04-01T08:36:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】1 lists=[35,20,12,34,12,24,34,55,27]2 print list(set(lists))3 #保留原list顺序4 sorted(set(lists),key=lists.index) <a href="https://www.cnblogs.com/xupeizhi/archive/2013/04/01/2993773.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/archive/2013/03/30/2991028.html
Hello hadoop——使用hadoop进行大规模数据的全局排序 - 百小度治哥
导读:Hadoop实际是一种以数据为驱动的计算模型,结合MapReduce和HDFS,将任务运行在数据存放的计算节点上,充分利用了计算节点的存储和计算资源,同时也大大节省了网络传输数据的开销。Hadoop(某人儿子的一只虚拟大象的名字)是一个复杂到极致,又简单到极致的东西。说它复杂,是因为一个hadoop集群往往有几十台甚至成百上千台low cost的计算机组成,你运行的每一个任务都要在这些计算机上做任务的分发,执行中间数据排序以及最后的汇总,期间还包含节点发现,任务的重试,故障节点替换等等等等的维护以及异常情况处理。谁叫hadoop集群往往都是由一些平民计算机组成,没事儿罢个工什么的,实在是
2013-03-30T14:17:00Z
2013-03-30T14:17:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】导读:Hadoop实际是一种以数据为驱动的计算模型,结合MapReduce和HDFS,将任务运行在数据存放的计算节点上,充分利用了计算节点的存储和计算资源,同时也大大节省了网络传输数据的开销。Hadoop(某人儿子的一只虚拟大象的名字)是一个复杂到极致,又简单到极致的东西。说它复杂,是因为一个hadoop集群往往有几十台甚至成百上千台low cost的计算机组成,你运行的每一个任务都要在这些计算机上做任务的分发,执行中间数据排序以及最后的汇总,期间还包含节点发现,任务的重试,故障节点替换等等等等的维护以及异常情况处理。谁叫hadoop集群往往都是由一些平民计算机组成,没事儿罢个工什么的,实在是 <a href="https://www.cnblogs.com/xupeizhi/archive/2013/03/30/2991028.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xupeizhi/archive/2013/03/18/2966892.html
hadoop 常存问题 - 百小度治哥
经常遇到的exception是:PipeMapRed.waitOutputThreads(): subprocess failed with code N"OS error code 1: Operation not permitted""OS error code 2: No such file or directory""OS error code 3: No such process""OS error code 4: Interrupted system call""OS error code 5
2013-03-18T14:04:00Z
2013-03-18T14:04:00Z
百小度治哥
https://www.cnblogs.com/xupeizhi/
【摘要】经常遇到的exception是:PipeMapRed.waitOutputThreads(): subprocess failed with code N"OS error code 1: Operation not permitted""OS error code 2: No such file or directory""OS error code 3: No such process""OS error code 4: Interrupted system call""OS error code 5 <a href="https://www.cnblogs.com/xupeizhi/archive/2013/03/18/2966892.html" target="_blank">阅读全文</a>