摘要: 一、 概述 定义 MaxCompute(原ODPS,Open Data Processing Service)是阿里云提供的一款大数据产品。根据阿里云官网文档[1]定义,MaxCompute是适用于数据分析场景的企业级SaaS模式云数据仓库,提供了大数据计算和存储服务。MaxCompute提供海量数 阅读全文
posted @ 2023-02-04 15:48 Zfancy 阅读(1917) 评论(0) 推荐(2) 编辑
摘要: 作者信息关联 5.1 任务说明 学习主题:作者关联(数据建模任务),对论文作者关系进行建模,统计最常出现的作者关系; 学习内容:构建作者关系图,挖掘作者关系 学习成果:论文作者知识图谱、图关系挖掘 5.2 数据处理步骤 将作者列表进行处理,并完成统计。具体步骤如下: 将论文第一作者与其他作者(论文非 阅读全文
posted @ 2021-01-26 00:42 Zfancy 阅读(120) 评论(0) 推荐(0) 编辑
摘要: 论文种类分类 4.1 任务说明 学习主题:论文分类(数据建模任务),利用已有数据建模,对新论文进行类别分类; 学习任务:使用论文标题完成类别分类; 学习成果:学会文本分类的基本方法(IF-IDF、Fastext、WordVec、Bert) 4.2 数据处理步骤 在原始arxiv论文中论文都有对应的类 阅读全文
posted @ 2021-01-22 22:49 Zfancy 阅读(529) 评论(0) 推荐(0) 编辑
摘要: 论文代码统计 3.1 任务说明 任务主题:论文代码统计,统计所有论文出现代码的相关统计 任务内容:使用正则表达式统计代码链接、页数和图表数据 任务成果:学习正则表达式 3.2 数据处理步骤 在原始arxiv数据集中作者经常会在论文的 comments 或 abstract 字段中给出具体的代码链接, 阅读全文
posted @ 2021-01-20 00:57 Zfancy 阅读(76) 评论(0) 推荐(0) 编辑
摘要: task02: 论文作者统计 https://github.com/datawhalechina/team-learning-data-mining/tree/master/AcademicTrends 任务说明 任务主题:论⽂文作者统计,统计所有论⽂文作者出现评率 Top10的姓名; 任务内容:论 阅读全文
posted @ 2021-01-17 00:24 Zfancy 阅读(72) 评论(0) 推荐(0) 编辑
摘要: task01: 论文数据统计 https://github.com/datawhalechina/team-learning-data-mining/tree/master/AcademicTrends 任务说明 任务主题:论文数量统计,即统计2019年全年计算机各个方向论文数量; 任务内容:赛题的 阅读全文
posted @ 2021-01-13 12:13 Zfancy 阅读(106) 评论(0) 推荐(0) 编辑
摘要: [TOC] 参考链接: "吴恩达老师机器学习第二周资源" 1.什么是Octave Wikipedia GNU Octave是一种采用高级编程语言的主要用于数值分析的软件。 Zfancy Octave是一种开源软件,Matlab的有效替代。在实现机器学习算法过程中,可先用Octave初步实现,后再用其 阅读全文
posted @ 2020-05-07 22:41 Zfancy 阅读(224) 评论(0) 推荐(0) 编辑
摘要: [TOC] 1.什么是markdown 维基百科 Markdown是一种轻量级标记语言,创始人为约翰·格鲁伯(英语:John Gruber)。它允许人们使用易读易写的纯文本格式编写文档,然后转换成有效的XHTML(或者HTML)文档。这种语言吸收了很多在电子邮件中已有的纯文本标记的特性。由于Mark 阅读全文
posted @ 2020-04-25 01:28 Zfancy 阅读(241) 评论(0) 推荐(0) 编辑
摘要: 一直觉得,拥有自己的园地是一件很酷的事! 大概细细培育是一件很需要耐心的事,也是一个很容易获得成就感的过程! 这是一个开始,不知道会栽种些什么花草,也不知道能否成活,但希望枯萎得不会太早! 喜欢Richard Feynman一句话: “What you can't create, you can't 阅读全文
posted @ 2020-04-21 18:44 Zfancy 阅读(154) 评论(0) 推荐(0) 编辑