20250120打卡——信息领域热词分析05
TF-IDF 关键词提取
做了什么:计算文本的 TF-IDF 值,提取最重要的热词。
学到什么:理解 TF-IDF 算法的基本原理,掌握 sklearn.feature_extraction.text.TfidfVectorizer。
遇到的问题:高频词干扰结果,TF-IDF 不能捕捉语义关系。
TF-IDF 关键词提取
做了什么:计算文本的 TF-IDF 值,提取最重要的热词。
学到什么:理解 TF-IDF 算法的基本原理,掌握 sklearn.feature_extraction.text.TfidfVectorizer。
遇到的问题:高频词干扰结果,TF-IDF 不能捕捉语义关系。