会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
费弗里
数据科学玩家
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
15
16
17
18
19
20
21
22
23
···
26
下一页
2019年11月8日
(数据科学学习手札70)面向数据科学的Python多进程简介及应用
摘要: 本文对应脚本已上传至我的 仓库 "https://github.com/CNFeffery/DataScienceStudyNotes" 一、简介 进程是计算机系统中资源分配的最小单位,也是操作系统可以控制的最小单位,在数据科学中很多涉及大量计算、CPU密集型的任务都可以通过多进程并行运算的方式大幅
阅读全文
posted @ 2019-11-08 19:40 费弗里
阅读(1148)
评论(0)
推荐(0)
2019年9月5日
(数据科学学习手札69)详解pandas中的map、apply、applymap、groupby、agg
摘要: *从本篇开始所有文章的数据和代码都已上传至我的github仓库:https://github.com/CNFeffery/DataScienceStudyNotes 一、简介 pandas提供了很多方便简洁的方法,用于对单列、多列数据进行批量运算或分组聚合运算,熟悉这些方法后可极大地提升数据分析的效
阅读全文
posted @ 2019-09-05 21:59 费弗里
阅读(9830)
评论(0)
推荐(5)
2019年9月3日
(数据科学学习手札68)pandas中的categorical类型及应用
摘要: 一、简介 categorical是pandas中对应分类变量的一种数据类型,与R中的因子型变量比较相似,例如性别、血型等等用于表征类别的变量都可以用其来表示,本文就将针对categorical的相关内容及应用进行介绍。 二、创建与应用 2.1 基本特性和适用场景 在介绍具体方法之前,我们需要对pan
阅读全文
posted @ 2019-09-03 19:27 费弗里
阅读(8340)
评论(0)
推荐(4)
2019年9月2日
(数据科学学习手札67)使用Git管理Github仓库
摘要: 一、简介 Git是目前使用最广泛的分布式版本控制系统,通过Git可以方便高效地管理掌握工作过程中项目内容文件的更新变化情况,通过Git我们可以以命令行的形式完成对Github上开源仓库的clone,以及对自己仓库的管理,本文就将针对使用Git管理Github远程仓库的基本方法进行介绍。 二、通过Gi
阅读全文
posted @ 2019-09-02 16:14 费弗里
阅读(530)
评论(0)
推荐(1)
2019年8月9日
(数据科学学习手札66)在ubuntu服务器上部署shiny
摘要: 一、简介 shiny是R中专门用于开发轻量级web应用的框架,在本地写一个shiny应用并调用非常方便,但如果你希望你的shiny应用能够以远程的方式提供给更多人来使用,就需要将写好的shiny应用部署到服务器上,主要有两种方式,第一种是将shiny应用发布在shinyapps上,第二种是将你的sh
阅读全文
posted @ 2019-08-09 16:43 费弗里
阅读(1850)
评论(0)
推荐(0)
2019年8月6日
实用的Python(2)利用Python制作gif动图
摘要: 一、简介 moviepy是一个专门用于视频剪辑制作的模块,可以自动化完成很多繁琐的视频剪辑处理工作,除了处理视频数据之外,moviepy中还内置了可以制作gif动图的功能,通过使用moviepy.editor中的ImageSequenceClip,可以以自动化的方式批量生成指定参数要求的gif动图,
阅读全文
posted @ 2019-08-06 21:17 费弗里
阅读(6486)
评论(0)
推荐(1)
2019年7月9日
(数据科学学习手札65)利用Python实现Shp格式向GeoJSON的转换
摘要: 一、简介 Shp格式是GIS中非常重要的数据格式,主要在Arcgis中使用,但在进行很多基于网页的空间数据可视化时,通常只接受GeoJSON格式的数据,众所周知JSON(JavaScript Object Nonation)是利用键值对+嵌套来表示数据的一种格式,以其轻量、易解析的优点,被广泛使用与
阅读全文
posted @ 2019-07-09 12:16 费弗里
阅读(3471)
评论(3)
推荐(2)
2019年7月6日
(数据科学学习手札64)在jupyter notebook中利用kepler.gl进行空间数据可视化
摘要: 一、简介 kepler.gl是由Uber开发的进行空间数据可视化的开源工具,是Uber内部进行空间数据可视化的默认工具,通过其面向Python开放的接口包keplergl,我们可以在jupyter notebook中通过书写Python代码的方式传入多种格式的数据,在其嵌入notebook的交互窗口
阅读全文
posted @ 2019-07-06 20:34 费弗里
阅读(7742)
评论(20)
推荐(3)
2019年7月5日
(数据科学学习手札63)利用pandas读写HDF5文件
摘要: 一、简介 HDF5(Hierarchical Data Formal)是用于存储大规模数值数据的较为理想的存储格式,文件后缀名为h5,存储读取速度非常快,且可在文件内部按照明确的层次存储数据,同一个HDF5可以看做一个高度整合的文件夹,其内部可存放不同类型的数据。在Python中操纵HDF5文件的方
阅读全文
posted @ 2019-07-05 20:59 费弗里
阅读(16490)
评论(3)
推荐(5)
2019年7月3日
(数据科学学习手札62)详解seaborn中的kdeplot、rugplot、distplot与jointplot
摘要: 一、简介 seaborn是Python中基于matplotlib的具有更多可视化功能和更优美绘图风格的绘图模块,当我们想要探索单个或一对数据分布上的特征时,可以使用到seaborn中内置的若干函数对数据的分布进行多种多样的可视化,本文以jupyter notebook为编辑工具,针对seaborn中
阅读全文
posted @ 2019-07-03 22:15 费弗里
阅读(44983)
评论(17)
推荐(14)
上一页
1
···
15
16
17
18
19
20
21
22
23
···
26
下一页
公告