2018 年 3月 10 日随笔档案 - circle元

2018年3月10日

摘要：利用xlrd读取excel筛选0值超过99%的列，并删除import xlrdworkbook=xlrd.open_workbook(r"123.xlsx")table = workbook.sheet_by_name('Sheet1')nrows=table.nrowsncols=table.nc 阅读全文

posted @ 2018-03-10 16:57 circle元阅读(7810) 评论(1) 推荐(0)

python利用jieba进行中文分词去停用词

摘要：中文分词(Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词模块jieba，它是python比较好用的分词模块。待分词的字符串可以是 unicode 或 UTF-8 字符串、GBK 字符串。注意：不建议直接输入 GBK 字符串，可能无法预料地错误阅读全文

posted @ 2018-03-10 16:29 circle元阅读(8534) 评论(0) 推荐(0)

python利用heapq实现小顶堆(查找最大的N个元素）

摘要：查找最大的N个元素——堆数据结构给出序列，求出TopK大的元素，使用小顶堆，heapq模块实现阅读全文

posted @ 2018-03-10 15:56 circle元阅读(1897) 评论(0) 推荐(0)

python根据索引删除内容并写入文本

摘要：在python中，有个好用的模块linecache，该模块允许从任何文件里得到任何的行，并且使用缓存进行优化，常见的情况是从单个文件读取多行。linecache.getline(filename,lineno)从名为filename的文件中得到第lineno行示例：从final.txt文件中读取数据阅读全文

posted @ 2018-03-10 15:24 circle元阅读(1221) 评论(0) 推荐(1)

circle元

谁说女生不能编程

公告