摘要: 一、基础知识 假设有一份文本数据如下,数据量很大,现在要对整个语料库进行文本分析,category代表新闻种类,theme代表新闻主题,URL代表新闻链接地址,content代表新闻主题内容 停用词:在content这一列,在数据量很大的情况,很容易发现某些似乎与新闻本身意义不大的词大量出现,而我们 阅读全文
posted @ 2019-09-03 15:47 |旧市拾荒| 阅读(4388) 评论(0) 推荐(4) 编辑