2016年6月7日

使用python进行汉语分词-乾颐堂

摘要: 目前我常常使用的分词有结巴分词、NLPIR分词等等 最近是在使用结巴分词,稍微做一下推荐,还是蛮好用的。 一、结巴分词简介 利用结巴分词进行中文分词,基本实现原理有三: 基于Trie树结构实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG) 采用了动态规划查找最大概率路径, 阅读全文

posted @ 2016-06-07 15:07 乾颐堂 阅读(1062) 评论(0) 推荐(0) 编辑

Python 序列与映射的解包操作-乾颐堂

摘要: 解包就是把序列或映射中每个元素单独提取出来,序列解包的一种简单用法就是把首个或前几个元素与后面几个元素分别提取出来,例如: first, seconde, *rest = sequence 如果sequence里至少有三个元素,那么执行完上述代码后,first == sequence[0], sec 阅读全文

posted @ 2016-06-07 15:05 乾颐堂 阅读(276) 评论(0) 推荐(0) 编辑

注意for循环中变量的作用域-乾颐堂

摘要: 1 2 for e in collections: pass 在for 循环里, 最后一个对象e一直存在在上下文中。就是在循环外面,接下来对e的引用仍然有效。 这里有个问题容易被忽略,如果在循环之前已经有一个同名对象存在,这个对象是被覆盖的。 如果在有代码感知的IDE中, IDE会提示变量是“被重新 阅读全文

posted @ 2016-06-07 15:03 乾颐堂 阅读(206) 评论(0) 推荐(0) 编辑

用 python 实现各种排序算法-乾颐堂

摘要: 总结了一下常见集中排序的算法 归并排序 归并排序也称合并排序,是分治法的典型应用。分治思想是将每个问题分解成个个小问题,将每个小问题解决,然后合并。 具体的归并排序就是,将一组无序数按n/2递归分解成只有一个元素的子项,一个元素就是已经排好序的了。然后将这些有序的子元素进行合并。 合并的过程就是 对 阅读全文

posted @ 2016-06-07 15:02 乾颐堂 阅读(259) 评论(0) 推荐(0) 编辑

Python 解析配置模块之ConfigParser详解-乾颐堂

摘要: 1.基本的读取配置文件 -read(filename) 直接读取ini文件内容 -sections() 得到所有的section,并以列表的形式返回 -options(section) 得到该section的所有option -items(section) 得到该section的所有键值对 -get 阅读全文

posted @ 2016-06-07 14:37 乾颐堂 阅读(909) 评论(0) 推荐(0) 编辑

朴素贝叶斯算法的python实现-乾颐堂

摘要: 算法优缺点 优点:在数据较少的情况下依然有效,可以处理多类别问题 缺点:对输入数据的准备方式敏感 适用数据类型:标称型数据 算法思想: 朴素贝叶斯 比如我们想判断一个邮件是不是垃圾邮件,那么我们知道的是这个邮件中的词的分布,那么我们还要知道:垃圾邮件中某些词的出现是多少,就可以利用贝叶斯定理得到。 阅读全文

posted @ 2016-06-07 14:34 乾颐堂 阅读(432) 评论(0) 推荐(0) 编辑

python中执行命令的3种方法小结-乾颐堂

摘要: 目前我使用到的python中执行cmd的方式有三种: 1. 使用os.system("cmd") 特点是执行的时候程序会打出cmd在linux上执行的信息。 import os os.system("ls") 2. 使用Popen模块产生新的process 现在大部分人都喜欢使用Popen。Pope 阅读全文

posted @ 2016-06-07 14:29 乾颐堂 阅读(34321) 评论(0) 推荐(1) 编辑

Python代码规范利器Flake8

摘要: 写代码其实是需要规范的,团队中更是如此;不然 Google 也不会发布各种编码规范,耳熟能详的有Google C++ 风格指南,Google Python 风格指南,等等。 这些规范有用吗?有用也没用,除非你脑子好使,一边 coding,一边将规范运用的发紫;否则我们终须还是需要一种工具来做这件事情 阅读全文

posted @ 2016-06-07 14:26 乾颐堂 阅读(1559) 评论(0) 推荐(0) 编辑

python时间处理详解-乾颐堂

摘要: 1.获取当前时间的两种方法: import datetime,time now = time.strftime("%Y-%m-%d %H:%M:%S") print now now = datetime.datetime.now() print now 2.获取上个月最后一天的日期(本月的第一天减去 阅读全文

posted @ 2016-06-07 14:21 乾颐堂 阅读(1353) 评论(0) 推荐(0) 编辑

深入理解yield-乾颐堂

摘要: yield的英文单词意思是生产,刚接触Python的时候感到非常困惑,一直没弄明白yield的用法。 只是粗略的知道yield可以用来为一个函数返回值塞数据,比如下面的例子: 1 2 3 def addlist(alist): for i in alist: yield i + 1 def addl 阅读全文

posted @ 2016-06-07 14:18 乾颐堂 阅读(176) 评论(0) 推荐(0) 编辑

导航