python - 随笔分类 - 熊猫blue

正则表达式（1） python

摘要：import re import re x1='I' x2='she' x='I will meet you.' print(re.search(x1,x)) #在x中寻找x1 print(re.search(x2,x)) print(re.search(r"m[A-Z]t", "I met you 阅读全文

posted @ 2020-06-23 15:53 熊猫blue 阅读(140) 评论(0) 推荐(0)

pip问题

摘要：1. 安装时出现超时read time out 的错误如下：因为下载太慢导致，解决方法：利用国内的镜像源来加速，下面是使用的豆瓣源： pip install XXX -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com 注阅读全文

posted @ 2020-03-04 21:46 熊猫blue 阅读(231) 评论(0) 推荐(0)

构建管道sklearn.pipeline

摘要：pipeline类本身具有fit、predict和score方法，其行为与Scikit-Learn中的其他模型相同。例：使用Pipeline类来表示在使用MinMaxScaler缩放数据之后再训练一个SVM的工作流程 from sklearn.pipeline import Pipeline pi 阅读全文

posted @ 2020-03-04 16:09 熊猫blue 阅读(640) 评论(0) 推荐(0)

交叉验证

摘要：一、sklearn.cross_validation.cross_val_score sklearn.cross_validation.cross_val_score(estimator, X, y=None, scoring=None,cv=None, n_jobs=1, verbose=0, f 阅读全文

posted @ 2019-12-25 22:22 熊猫blue 阅读(217) 评论(0) 推荐(0)

jupyter notebook打开任意文件

摘要：jupyter notebook默认打开的是C盘的文件，若要实现打开任意文件夹，步骤如下：打开Anaconda Prompt，改变你的当前路径到你想打开的那个文件夹的路径: cd/d E:\\0602 jupyter notebook 阅读全文

posted @ 2019-12-10 20:40 熊猫blue 阅读(1780) 评论(0) 推荐(0)

gzip压缩和解压

摘要：Example of how to read a compressed file: import gzip with gzip.open('file.txt.gz', 'rb') as f: file_content = f.read() Example of how to create a com 阅读全文

posted @ 2019-12-02 11:07 熊猫blue 阅读(843) 评论(0) 推荐(0)

filter python

摘要：filter的作用是过滤在python2中filter直接返回过滤后的结果而python3中filter返回迭代器，有助于节约内存: #filter(function, iterable) x = filter(lambda x: x % 2 == 0, range(10)) print(" " 阅读全文

posted @ 2019-11-26 20:24 熊猫blue 阅读(152) 评论(0) 推荐(0)

python 计时

摘要：方法一、 import datetime start = datetime.datetime.now() end = datetime.datetime.now() print(end-start) 阅读全文

posted @ 2019-11-24 00:43 熊猫blue 阅读(368) 评论(0) 推荐(0)

包的安装问题——python

摘要：1. 当uninstall或者upgrade包时遇到类似下面的问题时： It is a distutils installed project and thus we cannot accurately determine which files belong to it which would l 阅读全文

posted @ 2019-11-15 19:39 熊猫blue 阅读(879) 评论(0) 推荐(0)

改变工作目录python

摘要：改变python的工作目录： import os os.getcwd() os.chdir('D:\data') os.getcwd() 另外如果是spyder还可以通过设置的方式：阅读全文

posted @ 2019-11-09 11:02 熊猫blue 阅读(236) 评论(0) 推荐(0)

TF-IDF、CountVectorizer

只有注册用户登录后才能阅读该文。

posted @ 2019-10-26 17:48 熊猫blue 阅读(0) 评论(0) 推荐(0)

re

摘要：python中的re库用于正则化，相当于一个过滤器，可以过滤掉不需要的字符，得到自己想要的。运行结果是：其中，\u4e00-\u9fa5表示匹配中文字符，\u4e00是在编码中中文字符开始的值，\u9fa5是中文字符结束的值。 jieba.posseg.cut(text) 可以对段落进行词的划分阅读全文

posted @ 2019-10-26 11:17 熊猫blue 阅读(404) 评论(0) 推荐(0)

常用的中文停用词

摘要：中文停用词，可以参考这个下载来创建适合自己的停用词阅读全文

posted @ 2019-10-24 14:31 熊猫blue 阅读(2623) 评论(0) 推荐(1)

jieba库对中文文本进行切割 python

摘要：jieba是中文文本用于分词的库，有3种模式：精确模式、全模式（所有可能的分割）、搜索引擎模式（在精确模式基础上再进行分割）具体参考PYPI 注：1.txt 得到的分词结果，统计次数的前5个答案如下，可以看出，这个中文文本分割只是简单分割，有一定的缺点：不能根据语义进行分割，文本的意思是大枣不好吃阅读全文

posted @ 2019-10-24 14:08 熊猫blue 阅读(2170) 评论(0) 推荐(0)

判断素数（质数）

摘要：import math def isPrime(num): if num==5 or num==7: return True elif num%5==0 and num%7==0: return False else: for n in range(3,int(math.sqrt(num))+1): ... 阅读全文

posted @ 2019-10-21 20:54 熊猫blue 阅读(155) 评论(0) 推荐(0)

sklearn

摘要：sklearn #划分训练集和测试集 #from sklearn import train_test_split #py2 from sklearn import sklearn.model_selection #py3 train_X,test_X,train_y,test_y = train_t 阅读全文

posted @ 2019-10-20 18:36 熊猫blue 阅读(157) 评论(0) 推荐(0)

利用sklearn对数据预处理：标准化，归一化，正则化

摘要：一、标准化Standardization（z-score方法）：利用公式：( x-mean(x) ) / std(x) 对具有S相同属性的数据（即一列）做标准化处理，使数据服从零均值标准差的高斯分布。这种方法一般要求原数据的分布近似高斯分布。涉及距离度量、协方差计算时可以应用这种方法。将有量纲数阅读全文

posted @ 2019-10-14 21:11 熊猫blue 阅读(2771) 评论(0) 推荐(1)

利用python获取股票数据

只有注册用户登录后才能阅读该文。

posted @ 2019-10-08 13:15 熊猫blue 阅读(187) 评论(0) 推荐(0)

python的集合运算和set相关操作

摘要：python的集合运算交: x&y 并: x|y 差: x-y 对称差集：x^y 判断两个集合是否相交：x.isdisjoint(y) 若相交则返回False 判断包含和被包含的关系： y0.issubset(y) ; y.issuperset(y0) 集合的操作： x.add(obj) #往集合阅读全文

posted @ 2019-10-07 06:10 熊猫blue 阅读(2558) 评论(0) 推荐(0)

python中的@property

摘要：使用@property装饰器的好处是既可以保护类的封装性，又可以使用“类.属性”来对私有属性进行操作。使用@property装饰器可以直接通过方法名来访问方法，不需要再在后面使用"()". 上面的例子分别展示了：使用＠property 直接调用 age() 方法，这样就使得该方法变成了 age 阅读全文

posted @ 2019-09-29 17:14 熊猫blue 阅读(2032) 评论(0) 推荐(0)

熊猫blue

随笔分类 - python

公告