返回博主主页
摘要: 计算细节:参见知乎文章“sklearn-TfidfVectorizer彻底说清楚” 1.根据训练集语料库,计算出tfidf值 2.计算出测试语句每个词语的tfidf值(只有当测试语句的词语在训练语料库的dictionary中,测试语句的词语才会计算tfidf值) import jieba from 阅读全文
posted @ 2020-05-23 15:44 懒惰的星期六 阅读(1487) 评论(0) 推荐(0)
摘要: 1.自定义聚合函数,结合agg使用 2. 同时使用多个聚合函数 3. 指定某一列使用某些聚合函数 4.merge与transform使用 import pandas as pd import numpy as np np.random.seed(1) dict_data = { 'k1': ['a' 阅读全文
posted @ 2020-05-23 11:32 懒惰的星期六 阅读(590) 评论(0) 推荐(0)