会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
python我的最爱
坚持每天分享一个深度学习的知识点
博客园
首页
新随笔
联系
订阅
管理
我的随笔
上一页
1
···
21
22
23
24
25
26
27
28
29
···
48
下一页
机器学习入门-文本数据-构造Tf-idf词袋模型(词频和逆文档频率) 1.TfidfVectorizer(构造tf-idf词袋模型)
python我的最爱 2019-01-26 19:54
阅读:988
评论:0
推荐:0
机器学习入门-文本数据-构造Ngram词袋模型 1.CountVectorizer(ngram_range) 构建Ngram词袋模型
python我的最爱 2019-01-26 19:37
阅读:5267
评论:0
推荐:1
机器学习入门-文本数据-构造词频词袋模型 1.re.sub(进行字符串的替换) 2.nltk.corpus.stopwords.words(获得停用词表) 3.nltk.WordPunctTokenizer(对字符串进行分词操作) 4.np.vectorize(对函数进行向量化) 5. CountVectorizer(构建词频的词袋模型)
python我的最爱 2019-01-26 18:50
阅读:2156
评论:0
推荐:0
机器学习入门-数值特征-时间特征处理
python我的最爱 2019-01-26 10:05
阅读:2760
评论:0
推荐:0
机器学习入门-数值特征-对数据进行log变化
python我的最爱 2019-01-25 22:27
阅读:7034
评论:1
推荐:1
机器学习入门-数值特征-数据四分位特征 1.quantile(用于求给定分数位的数值) 2.plt.axvline(用于画出竖线) 3.pd.pcut(对特征进行分位数切分,生成新的特征)
python我的最爱 2019-01-25 22:05
阅读:1416
评论:0
推荐:2
机器学习入门-数值特征-连续数据离散化(进行分段标记处理) 1.hist(Dataframe格式直接画直方图)
python我的最爱 2019-01-25 19:44
阅读:1780
评论:0
推荐:0
机器学习入门-数值特征-进行多项式变化(将特征投影到高维度上) 1.PolynomialFeatures(将数据变化为多项式特征)
python我的最爱 2019-01-25 19:13
阅读:2833
评论:0
推荐:0
机器学习入门-数值特征-进行二值化变化 1.Binarizer(进行数据的二值化操作)
python我的最爱 2019-01-25 18:32
阅读:1470
评论:0
推荐:0
机器学习入门-数值特征-数字映射和one-hot编码 1.LabelEncoder(进行数据自编码) 2.map(进行字典的数字编码映射) 3.OnehotEncoder(进行one-hot编码) 4.pd.get_dummies(直接对特征进行one-hot编码)
python我的最爱 2019-01-25 16:30
阅读:1342
评论:0
推荐:0
上一页
1
···
21
22
23
24
25
26
27
28
29
···
48
下一页