摘要:
计算细节:参见知乎文章“sklearn-TfidfVectorizer彻底说清楚” 1.根据训练集语料库,计算出tfidf值 2.计算出测试语句每个词语的tfidf值(只有当测试语句的词语在训练语料库的dictionary中,测试语句的词语才会计算tfidf值) import jieba from 阅读全文
posted @ 2020-05-23 15:44
懒惰的星期六
阅读(1487)
评论(0)
推荐(0)
摘要:
1.自定义聚合函数,结合agg使用 2. 同时使用多个聚合函数 3. 指定某一列使用某些聚合函数 4.merge与transform使用 import pandas as pd import numpy as np np.random.seed(1) dict_data = { 'k1': ['a' 阅读全文
posted @ 2020-05-23 11:32
懒惰的星期六
阅读(590)
评论(0)
推荐(0)

浙公网安备 33010602011771号