01 2021 档案
摘要:作者信息关联 5.1 任务说明 学习主题:作者关联(数据建模任务),对论文作者关系进行建模,统计最常出现的作者关系; 学习内容:构建作者关系图,挖掘作者关系 学习成果:论文作者知识图谱、图关系挖掘 5.2 数据处理步骤 将作者列表进行处理,并完成统计。具体步骤如下: 将论文第一作者与其他作者(论文非
阅读全文
摘要:论文种类分类 4.1 任务说明 学习主题:论文分类(数据建模任务),利用已有数据建模,对新论文进行类别分类; 学习任务:使用论文标题完成类别分类; 学习成果:学会文本分类的基本方法(IF-IDF、Fastext、WordVec、Bert) 4.2 数据处理步骤 在原始arxiv论文中论文都有对应的类
阅读全文
摘要:论文代码统计 3.1 任务说明 任务主题:论文代码统计,统计所有论文出现代码的相关统计 任务内容:使用正则表达式统计代码链接、页数和图表数据 任务成果:学习正则表达式 3.2 数据处理步骤 在原始arxiv数据集中作者经常会在论文的 comments 或 abstract 字段中给出具体的代码链接,
阅读全文
摘要:task02: 论文作者统计 https://github.com/datawhalechina/team-learning-data-mining/tree/master/AcademicTrends 任务说明 任务主题:论⽂文作者统计,统计所有论⽂文作者出现评率 Top10的姓名; 任务内容:论
阅读全文
摘要:task01: 论文数据统计 https://github.com/datawhalechina/team-learning-data-mining/tree/master/AcademicTrends 任务说明 任务主题:论文数量统计,即统计2019年全年计算机各个方向论文数量; 任务内容:赛题的
阅读全文

浙公网安备 33010602011771号