摘要: 词袋模型是一种表征文本数据的方法,可以从文本数据中提取出特征并用向量表示.词袋模型主要包括两件事 构建词汇表 确定度量单词出现的方法 词袋模型不考虑单词在文本中出现的顺序,只考虑单词是否出现. 具体以"双城记"开头为例 收集数据 It was the best of times, it was th 阅读全文
posted @ 2020-06-27 12:42 老张哈哈哈 阅读(1391) 评论(0) 推荐(0) 编辑