摘要: 2.3 Python语言基础 1 语言语义(Language Semantics) 缩进,而不是括号 Python使用空格(tabs or spaces)来组织代码结构,而不是像R,C++,Java那样用括号。 建议使用四个空格来作为默认的缩进,设置tab键为四个空格 另外可以用分号隔开多个语句: 阅读全文
posted @ 2018-11-11 17:59 hank-li 阅读(233) 评论(0) 推荐(0)
摘要: 2.2 IPython基础 1 Running the IPython Shell (运行IPython Shell) 可以通过命令行启动IPython,就像启动标准的Python解释器一样,直接在terminal中键入ipython,回车即可。因为这里我用的是Jupyter Notebook,默认 阅读全文
posted @ 2018-11-11 17:25 hank-li 阅读(434) 评论(0) 推荐(0)
摘要: 2.1 The Python Interpreter(Python解释器) Python是一门解释性语言。Python的解释器一次只能运行一个命令。标准的Python解释器环境可以用通过输入python进入(在终端输入python后,就能进入解释器): 是提示符(prompt),告诉你可以输入指令。 阅读全文
posted @ 2018-11-11 16:32 hank-li 阅读(4056) 评论(0) 推荐(0)
摘要: 1.6 Navigating This Book(本书导航) 如果之前没有接触过Python,那么你应该在第2章和第3章多花一些时间。这两章介绍了Python语言的特性和IPython shell以及Jupyter notebooks。这些东西是本书的基本知识。如果已经有了相关经验,可以直接跳过这些 阅读全文
posted @ 2018-11-11 16:27 hank-li 阅读(273) 评论(0) 推荐(0)
摘要: 1.5 Community and Conferences(社区和讨论组)+ 私货 下面是一些和科学计算,数据处理相关的Python社群和讨论组,如果有什么问题可以进行提问: pydata: A Google Group list for questions related to Python fo 阅读全文
posted @ 2018-11-11 16:26 hank-li 阅读(218) 评论(0) 推荐(0)
摘要: 1.4 Installation and Setup(安装和设置) 这里我们用Anaconda发行版作为Python的使用环境,推荐安装Python3.6,本书就是用Python3.6代码写成的。(译者:我使用的也是Anaconda,Python版本是3.5,与3.6没有任何使用上的差别) 译者:针 阅读全文
posted @ 2018-11-11 16:24 hank-li 阅读(437) 评论(0) 推荐(0)
摘要: 1.3 Essential Python Libraries(一些重要的Python库) 如果不了解Python的数据生态,以及本书中即将用到的一些库,这里会做一个简单的介绍: Numpy 这里就不过多介绍了,下面给出一些链接可以参考。这个库太重要了,Python之所以能在科学计算上独领风骚很大程度 阅读全文
posted @ 2018-11-11 16:22 hank-li 阅读(1162) 评论(0) 推荐(0)
摘要: 1.2 Why Python for Data Analysis?(为什么使用Python做数据分析) 这节我就不进行过多介绍了,Python近几年的发展势头是有目共睹的,尤其是在科学计算,数据处理,AI方面,否则大家也不会来看这本书了。 使用Python的一些优点 1. Python是一门胶水语言 阅读全文
posted @ 2018-11-11 16:20 hank-li 阅读(263) 评论(0) 推荐(0)
摘要: CHAPTER 1 Preliminaries(预备知识) 1.1 What Is This Book About?(这本书是关于什么的) 这本书关心的是如何用Python对数据进行处理和清洗等操作。本书的目的是作为一个指南,讲解使用Python语言和它的一些处理数据的库和工具,这能让我们成为一个有 阅读全文
posted @ 2018-11-11 16:18 hank-li 阅读(1030) 评论(0) 推荐(0)
摘要: ``` > head(airquality,10) Ozone Solar.R Wind Temp Month Day 1 41 190 7.4 67 5 1 2 36 118 8.0 72 5 2 3 12 149 12.6 74 5 3 4 18 313 11.5 62... 阅读全文
posted @ 2018-11-11 16:02 hank-li 阅读(166) 评论(0) 推荐(0)
摘要: ``` #sort:对向量进行排序;返回排好序的内容 #order:返回排好序的内容的下标/多个排序标准 > x sort(x$v2) [1] 6 7 8 9 10 > sort(x$v2,decreasing = TRUE) [1] 10 9 8 7 6 > order(x$v2) [1] 4 2 5 3 1 > x[order(x$v2),] v1 v2 v3 v... 阅读全文
posted @ 2018-11-11 16:00 hank-li 阅读(245) 评论(0) 推荐(0)
摘要: ``` split根据因子或因子列表将 向量或其他对象分组 通常与lapply一起使用 split(参数):split(向量/列表/数据框,因子/因子列表) x x [1] 0.61008707 0.81746169 1.09859969 1.78134612 1.94262725 0.997605 阅读全文
posted @ 2018-11-11 15:57 hank-li 阅读(3152) 评论(0) 推荐(0)
摘要: ``` 对向量的子集进行操作 tapply(参数):tapply(向量,因子/因子列表,函数/函数名) x f f [1] 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 Levels: 1 2 3 tapply(x,f,mean) 1 2 3 0.5004154 0.4044779 0 阅读全文
posted @ 2018-11-11 15:56 hank-li 阅读(5299) 评论(0) 推荐(0)
摘要: ``` #mapply(函数/函数名,数据,函数相关的函数) > list(rep(1,4),rep(2,3),rep(3,2),rep(4,1)) [[1]] [1] 1 1 1 1 [[2]] [1] 2 2 2 [[3]] [1] 3 3 [[4]] [1] 4 > mapply(rep,1:4,4:1) [[1]] [1] 1 1 1 1 [[2]] [1] 2 2 2 [[... 阅读全文
posted @ 2018-11-11 15:53 hank-li 阅读(2101) 评论(0) 推荐(0)
摘要: ``` #apply函数,沿着数组的某一维度处理数据 #例如将函数用于矩阵的行或列 #与for/while循环的效率相似,但只用一句话可以完成 #apply(参数):apply(数组,维度,函数/函数名) > x x [,1] [,2] [,3] [,4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 ... 阅读全文
posted @ 2018-11-11 15:51 hank-li 阅读(553) 评论(0) 推荐(0)
摘要: ``` lapply函数 可以循环处理列表中的每一个元素 lapply(参数):lapply(列表,函数/函数名,其他参数) 总是返回一个列表 sapply:简化结果 结果列表元素长度均为1,返回向量 结果列表元素长度相同且大于1,返回矩阵 str(lapply) function (X, FUN, 阅读全文
posted @ 2018-11-11 15:44 hank-li 阅读(14024) 评论(0) 推荐(0)
摘要: ``` > x y x+y [1] 7 9 11 13 15 > x*y [1] 6 14 24 36 50 > x/y [1] 0.1666667 0.2857143 0.3750000 0.4444444 0.5000000 > x y x [,1] [,2] [1,] 1 3 [2,] 2 4 > y [,1] [,2] [1... 阅读全文
posted @ 2018-11-11 15:41 hank-li 阅读(273) 评论(0) 推荐(0)
摘要: ``` > x is.na(x) [1] FALSE TRUE FALSE TRUE FALSE > x[!is.na(x)] #找出不是缺失值 [1] 1 2 3 > x y z x[z] [1] 1 > y[z] [1] "a" > library(datasets) #import datasets > head(airquality) Ozone Solar.R... 阅读全文
posted @ 2018-11-11 15:39 hank-li 阅读(209) 评论(0) 推荐(0)
摘要: ``` 列表的子集 Subsetting List [[]] / $ / [[]][] / [[]][[]] 嵌套列表 /不完全匹配(partial matching) x x[1] 找第1列的元素 $ [1] 1 2 3 4 x["id"] 两个函数作用相同 $ [1] 1 2 3 4 x[[1] 阅读全文
posted @ 2018-11-11 15:36 hank-li 阅读(236) 评论(0) 推荐(0)
摘要: ``` > x x v1 v2 v3 1 1 6 11 2 2 7 12 3 3 8 13 4 4 9 14 5 5 10 15 > x$v3[c(2,4)] x v1 v2 v3 1 1 6 11 2 2 7 NA 3 3 8 13 4 4 9 NA 5 5 10 15 > #找出第2列 > x[,2] [1] 6 7 8 9 10 > x[,"v2"] [1] 6 7 8... 阅读全文
posted @ 2018-11-11 15:31 hank-li 阅读(195) 评论(0) 推荐(0)