随笔分类 -  python

1
摘要:import re import re x1='I' x2='she' x='I will meet you.' print(re.search(x1,x)) #在x中寻找x1 print(re.search(x2,x)) print(re.search(r"m[A-Z]t", "I met you 阅读全文
posted @ 2020-06-23 15:53 熊猫blue 阅读(137) 评论(0) 推荐(0)
摘要:1. 安装时出现超时read time out 的错误如下: 因为下载太慢导致,解决方法:利用国内的镜像源来加速,下面是使用的豆瓣源: pip install XXX -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com 注 阅读全文
posted @ 2020-03-04 21:46 熊猫blue 阅读(224) 评论(0) 推荐(0)
摘要:pipeline类本身具有fit、predict和score方法,其行为与Scikit-Learn中的其他模型相同。 例:使用Pipeline类来表示在使用MinMaxScaler缩放数据之后再训练一个SVM的工作流程 from sklearn.pipeline import Pipeline pi 阅读全文
posted @ 2020-03-04 16:09 熊猫blue 阅读(617) 评论(0) 推荐(0)
摘要:一、sklearn.cross_validation.cross_val_score sklearn.cross_validation.cross_val_score(estimator, X, y=None, scoring=None,cv=None, n_jobs=1, verbose=0, f 阅读全文
posted @ 2019-12-25 22:22 熊猫blue 阅读(214) 评论(0) 推荐(0)
摘要:jupyter notebook默认打开的是C盘的文件,若要实现打开任意文件夹,步骤如下: 打开Anaconda Prompt,改变你的当前路径到你想打开的那个文件夹的路径: cd/d E:\\0602 jupyter notebook 阅读全文
posted @ 2019-12-10 20:40 熊猫blue 阅读(1767) 评论(0) 推荐(0)
摘要:Example of how to read a compressed file: import gzip with gzip.open('file.txt.gz', 'rb') as f: file_content = f.read() Example of how to create a com 阅读全文
posted @ 2019-12-02 11:07 熊猫blue 阅读(839) 评论(0) 推荐(0)
摘要:filter的作用是过滤 在python2中filter直接返回过滤后的结果 而python3中filter返回迭代器,有助于节约内存: #filter(function, iterable) x = filter(lambda x: x % 2 == 0, range(10)) print(" " 阅读全文
posted @ 2019-11-26 20:24 熊猫blue 阅读(149) 评论(0) 推荐(0)
摘要:方法一、 import datetime start = datetime.datetime.now() end = datetime.datetime.now() print(end-start) 阅读全文
posted @ 2019-11-24 00:43 熊猫blue 阅读(366) 评论(0) 推荐(0)
摘要:1. 当uninstall或者upgrade包时遇到类似下面的问题时: It is a distutils installed project and thus we cannot accurately determine which files belong to it which would l 阅读全文
posted @ 2019-11-15 19:39 熊猫blue 阅读(874) 评论(0) 推荐(0)
摘要:改变python的工作目录: import os os.getcwd() os.chdir('D:\data') os.getcwd() 另外如果是spyder还可以通过设置的方式: 阅读全文
posted @ 2019-11-09 11:02 熊猫blue 阅读(234) 评论(0) 推荐(0)
只有注册用户登录后才能阅读该文。
posted @ 2019-10-26 17:48 熊猫blue 阅读(0) 评论(0) 推荐(0)
摘要:python中的re库用于正则化,相当于一个过滤器,可以过滤掉不需要的字符,得到自己想要的。 运行结果是: 其中,\u4e00-\u9fa5表示匹配中文字符,\u4e00是在编码中中文字符开始的值,\u9fa5是中文字符结束的值。 jieba.posseg.cut(text) 可以对段落进行词的划分 阅读全文
posted @ 2019-10-26 11:17 熊猫blue 阅读(398) 评论(0) 推荐(0)
摘要:中文停用词,可以参考这个下载来创建适合自己的停用词 阅读全文
posted @ 2019-10-24 14:31 熊猫blue 阅读(2616) 评论(0) 推荐(1)
摘要:jieba是中文文本用于分词的库,有3种模式:精确模式、全模式(所有可能的分割)、搜索引擎模式(在精确模式基础上再进行分割) 具体参考PYPI 注:1.txt 得到的分词结果,统计次数的前5个答案如下,可以看出,这个中文文本分割只是简单分割,有一定的缺点:不能根据语义进行分割,文本的意思是大枣不好吃 阅读全文
posted @ 2019-10-24 14:08 熊猫blue 阅读(2149) 评论(0) 推荐(0)
摘要:import math def isPrime(num): if num==5 or num==7: return True elif num%5==0 and num%7==0: return False else: for n in range(3,int(math.sqrt(num))+1): ... 阅读全文
posted @ 2019-10-21 20:54 熊猫blue 阅读(152) 评论(0) 推荐(0)
摘要:sklearn #划分训练集和测试集 #from sklearn import train_test_split #py2 from sklearn import sklearn.model_selection #py3 train_X,test_X,train_y,test_y = train_t 阅读全文
posted @ 2019-10-20 18:36 熊猫blue 阅读(154) 评论(0) 推荐(0)
摘要:一、标准化Standardization(z-score方法): 利用公式:( x-mean(x) ) / std(x) 对具有S相同属性的数据(即一列)做标准化处理,使数据服从零均值标准差的高斯分布。这种方法一般要求原数据的分布近似高斯分布。 涉及距离度量、协方差计算时可以应用这种方法。将有量纲数 阅读全文
posted @ 2019-10-14 21:11 熊猫blue 阅读(2758) 评论(0) 推荐(1)
只有注册用户登录后才能阅读该文。
posted @ 2019-10-08 13:15 熊猫blue 阅读(186) 评论(0) 推荐(0)
摘要:python的集合运算 交: x&y 并: x|y 差: x-y 对称差集:x^y 判断两个集合是否相交:x.isdisjoint(y) 若相交则返回False 判断包含和被包含的关系: y0.issubset(y) ; y.issuperset(y0) 集合的操作: x.add(obj) #往集合 阅读全文
posted @ 2019-10-07 06:10 熊猫blue 阅读(2550) 评论(0) 推荐(0)
摘要:使用@property装饰器的好处是既可以保护类的封装性,又可以使用“类.属性”来对私有属性进行操作。 使用@property装饰器可以直接通过方法名来访问方法,不需要再在后面使用"()". 上面的例子分别展示了: 使用@property 直接调用 age() 方法,这样就使得该方法变成了 age 阅读全文
posted @ 2019-09-29 17:14 熊猫blue 阅读(2028) 评论(0) 推荐(0)

1
点击右上角即可分享
微信分享提示