随笔分类 - python
1
摘要:import re import re x1='I' x2='she' x='I will meet you.' print(re.search(x1,x)) #在x中寻找x1 print(re.search(x2,x)) print(re.search(r"m[A-Z]t", "I met you
阅读全文
摘要:1. 安装时出现超时read time out 的错误如下: 因为下载太慢导致,解决方法:利用国内的镜像源来加速,下面是使用的豆瓣源: pip install XXX -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com 注
阅读全文
摘要:pipeline类本身具有fit、predict和score方法,其行为与Scikit-Learn中的其他模型相同。 例:使用Pipeline类来表示在使用MinMaxScaler缩放数据之后再训练一个SVM的工作流程 from sklearn.pipeline import Pipeline pi
阅读全文
摘要:一、sklearn.cross_validation.cross_val_score sklearn.cross_validation.cross_val_score(estimator, X, y=None, scoring=None,cv=None, n_jobs=1, verbose=0, f
阅读全文
摘要:jupyter notebook默认打开的是C盘的文件,若要实现打开任意文件夹,步骤如下: 打开Anaconda Prompt,改变你的当前路径到你想打开的那个文件夹的路径: cd/d E:\\0602 jupyter notebook
阅读全文
摘要:Example of how to read a compressed file: import gzip with gzip.open('file.txt.gz', 'rb') as f: file_content = f.read() Example of how to create a com
阅读全文
摘要:filter的作用是过滤 在python2中filter直接返回过滤后的结果 而python3中filter返回迭代器,有助于节约内存: #filter(function, iterable) x = filter(lambda x: x % 2 == 0, range(10)) print(" "
阅读全文
摘要:方法一、 import datetime start = datetime.datetime.now() end = datetime.datetime.now() print(end-start)
阅读全文
摘要:1. 当uninstall或者upgrade包时遇到类似下面的问题时: It is a distutils installed project and thus we cannot accurately determine which files belong to it which would l
阅读全文
摘要:改变python的工作目录: import os os.getcwd() os.chdir('D:\data') os.getcwd() 另外如果是spyder还可以通过设置的方式:
阅读全文
摘要:python中的re库用于正则化,相当于一个过滤器,可以过滤掉不需要的字符,得到自己想要的。 运行结果是: 其中,\u4e00-\u9fa5表示匹配中文字符,\u4e00是在编码中中文字符开始的值,\u9fa5是中文字符结束的值。 jieba.posseg.cut(text) 可以对段落进行词的划分
阅读全文
摘要:jieba是中文文本用于分词的库,有3种模式:精确模式、全模式(所有可能的分割)、搜索引擎模式(在精确模式基础上再进行分割) 具体参考PYPI 注:1.txt 得到的分词结果,统计次数的前5个答案如下,可以看出,这个中文文本分割只是简单分割,有一定的缺点:不能根据语义进行分割,文本的意思是大枣不好吃
阅读全文
摘要:import math def isPrime(num): if num==5 or num==7: return True elif num%5==0 and num%7==0: return False else: for n in range(3,int(math.sqrt(num))+1): ...
阅读全文
摘要:sklearn #划分训练集和测试集 #from sklearn import train_test_split #py2 from sklearn import sklearn.model_selection #py3 train_X,test_X,train_y,test_y = train_t
阅读全文
摘要:一、标准化Standardization(z-score方法): 利用公式:( x-mean(x) ) / std(x) 对具有S相同属性的数据(即一列)做标准化处理,使数据服从零均值标准差的高斯分布。这种方法一般要求原数据的分布近似高斯分布。 涉及距离度量、协方差计算时可以应用这种方法。将有量纲数
阅读全文
摘要:python的集合运算 交: x&y 并: x|y 差: x-y 对称差集:x^y 判断两个集合是否相交:x.isdisjoint(y) 若相交则返回False 判断包含和被包含的关系: y0.issubset(y) ; y.issuperset(y0) 集合的操作: x.add(obj) #往集合
阅读全文
摘要:使用@property装饰器的好处是既可以保护类的封装性,又可以使用“类.属性”来对私有属性进行操作。 使用@property装饰器可以直接通过方法名来访问方法,不需要再在后面使用"()". 上面的例子分别展示了: 使用@property 直接调用 age() 方法,这样就使得该方法变成了 age
阅读全文
1