摘要:本文对应脚本及数据已上传至我的 仓库 "https://github.com/CNFeffery/DataScienceStudyNotes" 1 简介 毫无疑问 已经成为基于 的数据分析领域最重要的包,而就在最近, 终于迎来了 1.0.0 版本,对于 来说这是一次更新是里程碑式的,删除了很多旧版本 阅读全文
posted @ 2020-01-22 19:09 费弗里 阅读 (116) 评论 (0) 编辑
摘要:本文对应脚本及数据已上传至我的 仓库 "https://github.com/CNFeffery/DataScienceStudyNotes" 1 简介 在数据分析任务中,从原始数据读入,到最后分析结果出炉,中间绝大部分时间都是在对数据进行一步又一步的加工规整,以流水线(pipeline)的方式完成 阅读全文
posted @ 2020-01-12 16:48 费弗里 阅读 (241) 评论 (0) 编辑
摘要:本文对应脚本及数据已上传至我的 仓库 "https://github.com/CNFeffery/DataScienceStudyNotes" 1 简介 是文本挖掘中用来表征词频的数据可视化图像,通过它可以很直观地展现文本数据中地高频词: 图1 词云图示例 在 中有很多可视化框架可以用来制作词云图, 阅读全文
posted @ 2019-11-17 17:57 费弗里 阅读 (387) 评论 (2) 编辑
摘要:本文对应脚本已上传至我的 仓库 "https://github.com/CNFeffery/DataScienceStudyNotes" 一、简介 进程是计算机系统中资源分配的最小单位,也是操作系统可以控制的最小单位,在数据科学中很多涉及大量计算、CPU密集型的任务都可以通过多进程并行运算的方式大幅 阅读全文
posted @ 2019-11-08 19:40 费弗里 阅读 (121) 评论 (0) 编辑
摘要:*从本篇开始所有文章的数据和代码都已上传至我的github仓库:https://github.com/CNFeffery/DataScienceStudyNotes 一、简介 pandas提供了很多方便简洁的方法,用于对单列、多列数据进行批量运算或分组聚合运算,熟悉这些方法后可极大地提升数据分析的效 阅读全文
posted @ 2019-09-05 21:59 费弗里 阅读 (913) 评论 (0) 编辑
摘要:一、简介 categorical是pandas中对应分类变量的一种数据类型,与R中的因子型变量比较相似,例如性别、血型等等用于表征类别的变量都可以用其来表示,本文就将针对categorical的相关内容及应用进行介绍。 二、创建与应用 2.1 基本特性和适用场景 在介绍具体方法之前,我们需要对pan 阅读全文
posted @ 2019-09-03 19:27 费弗里 阅读 (612) 评论 (0) 编辑
摘要:一、简介 Git是目前使用最广泛的分布式版本控制系统,通过Git可以方便高效地管理掌握工作过程中项目内容文件的更新变化情况,通过Git我们可以以命令行的形式完成对Github上开源仓库的clone,以及对自己仓库的管理,本文就将针对使用Git管理Github远程仓库的基本方法进行介绍。 二、通过Gi 阅读全文
posted @ 2019-09-02 16:14 费弗里 阅读 (98) 评论 (0) 编辑
摘要:一、简介 shiny是R中专门用于开发轻量级web应用的框架,在本地写一个shiny应用并调用非常方便,但如果你希望你的shiny应用能够以远程的方式提供给更多人来使用,就需要将写好的shiny应用部署到服务器上,主要有两种方式,第一种是将shiny应用发布在shinyapps上,第二种是将你的sh 阅读全文
posted @ 2019-08-09 16:43 费弗里 阅读 (230) 评论 (0) 编辑
摘要:一、简介 moviepy是一个专门用于视频剪辑制作的模块,可以自动化完成很多繁琐的视频剪辑处理工作,除了处理视频数据之外,moviepy中还内置了可以制作gif动图的功能,通过使用moviepy.editor中的ImageSequenceClip,可以以自动化的方式批量生成指定参数要求的gif动图, 阅读全文
posted @ 2019-08-06 21:17 费弗里 阅读 (822) 评论 (0) 编辑
摘要:一、简介 Shp格式是GIS中非常重要的数据格式,主要在Arcgis中使用,但在进行很多基于网页的空间数据可视化时,通常只接受GeoJSON格式的数据,众所周知JSON(JavaScript Object Nonation)是利用键值对+嵌套来表示数据的一种格式,以其轻量、易解析的优点,被广泛使用与 阅读全文
posted @ 2019-07-09 12:16 费弗里 阅读 (450) 评论 (0) 编辑