08 2016 档案
iconv将文件编码从gb2312 转换为utf-8
摘要:iconv命令用于转换指定文件的编码,默认输出到标准输出设备,亦可指定输出文件。 用法: iconv [选项...] [文件...] 有如下选项可用: 输入/输出格式规范:-f, --from-code=名称 原始文本编码-t, --to-code=名称 输出编码 信息:-l, --list 列举所 阅读全文
posted @ 2016-08-17 14:17 绽放的四叶草 阅读(1814) 评论(0) 推荐(0)
linux下python调用c模块
摘要:在C调用Python模块时需要初始化Python解释器,导入模块等,但Python调用C模块却比较简单,下面还是以helloWorld.c 和 main.py 做一说明: (1)编写C代码,hello.c代码很简单,只是输出“Hello World!”: (2)将编写的C代码编译成动态链接库的形式, 阅读全文
posted @ 2016-08-15 18:59 绽放的四叶草 阅读(2192) 评论(0) 推荐(0)
将搜狗词库.scel格式转化为.txt格式
摘要:由于项目中要用到词库,而下载的搜狗词库是.scel格式,所以就用python脚本将搜狗词库.scel格式文件转化为.txt格式文件。 阅读全文
posted @ 2016-08-04 13:00 绽放的四叶草 阅读(19726) 评论(2) 推荐(3)
python集合(set)操作
摘要:1 python的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算. 2 3 sets 支持 x in set, len(set),和 for x in set。作为一个无序... 阅读全文
posted @ 2016-08-04 09:17 绽放的四叶草 阅读(803) 评论(0) 推荐(0)
Textrank算法介绍
摘要:先说一下自动文摘的方法。自动文摘(Automatic Summarization)的方法主要有两种:Extraction和Abstraction。其中Extraction是抽取式自动文摘方法,通过提取文档中已存在的关键词,句子形成摘要;Abstraction是生成式自动文摘方法,通过建立抽象的语意表 阅读全文
posted @ 2016-08-03 11:26 绽放的四叶草 阅读(52114) 评论(1) 推荐(3)