01 2021 档案

摘要:作者信息关联 5.1 任务说明 学习主题:作者关联(数据建模任务),对论文作者关系进行建模,统计最常出现的作者关系; 学习内容:构建作者关系图,挖掘作者关系 学习成果:论文作者知识图谱、图关系挖掘 5.2 数据处理步骤 将作者列表进行处理,并完成统计。具体步骤如下: 将论文第一作者与其他作者(论文非 阅读全文
posted @ 2021-01-26 00:42 Zfancy 阅读(192) 评论(0) 推荐(0)
摘要:论文种类分类 4.1 任务说明 学习主题:论文分类(数据建模任务),利用已有数据建模,对新论文进行类别分类; 学习任务:使用论文标题完成类别分类; 学习成果:学会文本分类的基本方法(IF-IDF、Fastext、WordVec、Bert) 4.2 数据处理步骤 在原始arxiv论文中论文都有对应的类 阅读全文
posted @ 2021-01-22 22:49 Zfancy 阅读(701) 评论(0) 推荐(0)
摘要:论文代码统计 3.1 任务说明 任务主题:论文代码统计,统计所有论文出现代码的相关统计 任务内容:使用正则表达式统计代码链接、页数和图表数据 任务成果:学习正则表达式 3.2 数据处理步骤 在原始arxiv数据集中作者经常会在论文的 comments 或 abstract 字段中给出具体的代码链接, 阅读全文
posted @ 2021-01-20 00:57 Zfancy 阅读(164) 评论(0) 推荐(0)
摘要:task02: 论文作者统计 https://github.com/datawhalechina/team-learning-data-mining/tree/master/AcademicTrends 任务说明 任务主题:论⽂文作者统计,统计所有论⽂文作者出现评率 Top10的姓名; 任务内容:论 阅读全文
posted @ 2021-01-17 00:24 Zfancy 阅读(116) 评论(0) 推荐(0)
摘要:task01: 论文数据统计 https://github.com/datawhalechina/team-learning-data-mining/tree/master/AcademicTrends 任务说明 任务主题:论文数量统计,即统计2019年全年计算机各个方向论文数量; 任务内容:赛题的 阅读全文
posted @ 2021-01-13 12:13 Zfancy 阅读(271) 评论(0) 推荐(0)