摘要:
一、 概述 定义 MaxCompute(原ODPS,Open Data Processing Service)是阿里云提供的一款大数据产品。根据阿里云官网文档[1]定义,MaxCompute是适用于数据分析场景的企业级SaaS模式云数据仓库,提供了大数据计算和存储服务。MaxCompute提供海量数 阅读全文
摘要:
作者信息关联 5.1 任务说明 学习主题:作者关联(数据建模任务),对论文作者关系进行建模,统计最常出现的作者关系; 学习内容:构建作者关系图,挖掘作者关系 学习成果:论文作者知识图谱、图关系挖掘 5.2 数据处理步骤 将作者列表进行处理,并完成统计。具体步骤如下: 将论文第一作者与其他作者(论文非 阅读全文
摘要:
论文种类分类 4.1 任务说明 学习主题:论文分类(数据建模任务),利用已有数据建模,对新论文进行类别分类; 学习任务:使用论文标题完成类别分类; 学习成果:学会文本分类的基本方法(IF-IDF、Fastext、WordVec、Bert) 4.2 数据处理步骤 在原始arxiv论文中论文都有对应的类 阅读全文
摘要:
论文代码统计 3.1 任务说明 任务主题:论文代码统计,统计所有论文出现代码的相关统计 任务内容:使用正则表达式统计代码链接、页数和图表数据 任务成果:学习正则表达式 3.2 数据处理步骤 在原始arxiv数据集中作者经常会在论文的 comments 或 abstract 字段中给出具体的代码链接, 阅读全文
摘要:
task02: 论文作者统计 https://github.com/datawhalechina/team-learning-data-mining/tree/master/AcademicTrends 任务说明 任务主题:论⽂文作者统计,统计所有论⽂文作者出现评率 Top10的姓名; 任务内容:论 阅读全文
摘要:
task01: 论文数据统计 https://github.com/datawhalechina/team-learning-data-mining/tree/master/AcademicTrends 任务说明 任务主题:论文数量统计,即统计2019年全年计算机各个方向论文数量; 任务内容:赛题的 阅读全文
摘要:
[TOC] 参考链接: "吴恩达老师机器学习第二周资源" 1.什么是Octave Wikipedia GNU Octave是一种采用高级编程语言的主要用于数值分析的软件。 Zfancy Octave是一种开源软件,Matlab的有效替代。在实现机器学习算法过程中,可先用Octave初步实现,后再用其 阅读全文
摘要:
[TOC] 1.什么是markdown 维基百科 Markdown是一种轻量级标记语言,创始人为约翰·格鲁伯(英语:John Gruber)。它允许人们使用易读易写的纯文本格式编写文档,然后转换成有效的XHTML(或者HTML)文档。这种语言吸收了很多在电子邮件中已有的纯文本标记的特性。由于Mark 阅读全文
摘要:
一直觉得,拥有自己的园地是一件很酷的事! 大概细细培育是一件很需要耐心的事,也是一个很容易获得成就感的过程! 这是一个开始,不知道会栽种些什么花草,也不知道能否成活,但希望枯萎得不会太早! 喜欢Richard Feynman一句话: “What you can't create, you can't 阅读全文