随笔分类 - Python
摘要:来做一个NLP任务 步骤为: 1.读取文件; 2.去除所有标点符号和换行符,并把所有大写变成小写; 3.合并相同的词,统计每个词出现的频率,并按照词频从大到小排序; 4.将结果按行输出到文件 out.txt。 代码: import re import os,sys # 你不用太关心这个函数 def
阅读全文
摘要:字符串的常用操作 字符串与数组一样,支持索引操作、切片与遍历 索引、切片操作: 遍历: python的字符串是不可变的(immutable),因此不能直接改变字符串内部的字符 python2.5以后的+=操作符 python2.5以前,改变字符串的字符时其实是重新创建了一个新的字符串。如: 会重新创
阅读全文
摘要:查找场景下与列表的性能对比 字典与集合之所以高效的原因是:内部结构都是一张哈希表。 平均情况下插入、查找和删除的时间复杂度为 O(1). 假设有数量100,000的产品列表: 要统计出总共有多少种不同的价格,分别用列表list与集合set来作为存储的数据结构,来对比下性能。 用列表作为数据结构: 用
阅读全文
摘要:学一门语言,可以用对比其他语言方法加深对这门语言特点的理解。 一、定义:列表和元组,都是一个可以放置任意数据类型的有序集合。 mutable的列表:动态的,可以改变元素 immutable的元组:静态的,不可以改变元素 二、支持负数索引,支持切片,支持嵌套 切片操作: 接着比较下list 与 tup
阅读全文
摘要:香港电台的节目素质都比较不错,其中有个《中华五千年》的节目是以情景剧与旁白的形式来展示历史故事,由传说时代一直到民国,1983年首播至2000年,非常长寿的一个节目。网上能找到版本声音非常模糊,不过在其《网上中华五千年》的网站上可以在线收听所有节目。虽然可以在线听,但要science上网,而且在线听
阅读全文
浙公网安备 33010602011771号