2019年5月7日

19-09 【github 自动提取项目的topic】

摘要: 【github-提取项目的topic】1,获取reademe,并清理(移除不想要的block,文本分词);2,生成candidate topic(定义了stop word来切分词组单元);3,消除noisy topic(使用逻辑斯蒂回归来剔除bad topic,移除不满足最小频度约束的topic)4 阅读全文

posted @ 2019-05-07 10:16 awildfish 阅读(400) 评论(0) 推荐(0) 编辑

导航