摘要:
利用xlrd读取excel筛选0值超过99%的列,并删除import xlrdworkbook=xlrd.open_workbook(r"123.xlsx")table = workbook.sheet_by_name('Sheet1')nrows=table.nrowsncols=table.nc 阅读全文
posted @ 2018-03-10 16:57
circle元
阅读(7804)
评论(1)
推荐(0)
摘要:
中文分词(Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。 分词模块jieba,它是python比较好用的分词模块。待分词的字符串可以是 unicode 或 UTF-8 字符串、GBK 字符串。注意:不建议直接输入 GBK 字符串,可能无法预料地错误 阅读全文
posted @ 2018-03-10 16:29
circle元
阅读(8520)
评论(0)
推荐(0)
摘要:
查找最大的N个元素——堆数据结构 给出序列,求出TopK大的元素,使用小顶堆,heapq模块实现 阅读全文
posted @ 2018-03-10 15:56
circle元
阅读(1893)
评论(0)
推荐(0)
摘要:
在python中,有个好用的模块linecache,该模块允许从任何文件里得到任何的行,并且使用缓存进行优化,常见的情况是从单个文件读取多行。linecache.getline(filename,lineno)从名为filename的文件中得到第lineno行示例:从final.txt文件中读取数据 阅读全文
posted @ 2018-03-10 15:24
circle元
阅读(1218)
评论(0)
推荐(1)

浙公网安备 33010602011771号