摘要:
1、TF-IDF(Term Frequency-Inverse Document Frequency, 词频-逆文件频率).(逆文档词频) 2、自我理解: 公式TF = $$\frac{语料库中关键词出现的次数}{总词数量}$$ ##权重w (词频) 或者 TF = $$\frac{某个词在文章中出 阅读全文
posted @ 2018-11-01 23:03
bug_x
阅读(205)
评论(0)
推荐(0)
摘要:
dt = searchfor = ['og', 'at'] dt = '|'.join(dt) 阅读全文
posted @ 2018-11-01 11:55
bug_x
阅读(95)
评论(0)
推荐(0)
摘要:
1、排序 DataFrame 按照Index排序 Series.order()进行排序,而DataFrame则用sort或者sort_index或者sort_values 2、去重, 阅读全文
posted @ 2018-11-01 11:53
bug_x
阅读(2334)
评论(0)
推荐(0)
摘要:
1、 2、 2、copy and value_counts 3, add del 4、筛选: 阅读全文
posted @ 2018-11-01 11:05
bug_x
阅读(197)
评论(0)
推荐(0)