20250120打卡——信息领域热词分析05

TF-IDF 关键词提取
做了什么:计算文本的 TF-IDF 值,提取最重要的热词。
学到什么:理解 TF-IDF 算法的基本原理,掌握 sklearn.feature_extraction.text.TfidfVectorizer。
遇到的问题:高频词干扰结果,TF-IDF 不能捕捉语义关系。

posted @ 2025-01-25 19:39  丰川扬子  阅读(10)  评论(0)    收藏  举报