摘要: 在完成PDF文件格式转换后,论文PDF文件由一个一个TXT文件保存 然后在逐个对论文文件进行清洗工作 然后有利于之后的关键词抽取和词云图生成 首先清洗文件的目的是为了统计词频和关键词的抽取 然后为了完成这个目的 文件的形式以一个文件存储所有的论文文本最为合适 省去了对文件的逐个打开操作 而且加快了运 阅读全文
posted @ 2021-05-21 20:57 帅超007 阅读(310) 评论(0) 推荐(0)