R 语言数据结构 --1 向量和因子②因子-vector

Posted on 2018-06-08 10:46  桐枳凤凰  阅读(757)  评论(0)    收藏  举报

2018年6月8日 今天是学习R的第二天 感觉进度有些缓慢,需要加速一下了。另外昨天貌似写的不是特别好,所以今天打算对整体编辑研究一下。

今天来学习一下 因子,首先:什么是因子?因为我们知道了R中的向量,另外因为学习过一段时间的python 所以对字典,数组什么的有理解力。那么,对于因子 我可以看成一个有一点字典味道的向量。(个人理解)

百度的定义是这样的: 因子用来存储类别变量(categorical variables)和有序变量,这类变量不能用来计算而只能用来分类或者计数。因子表示分类变量,有序因子表示有序变量。

也就是说因子就是有类别并且有序的变量,相当于把变量分成离散的还有连续的,因子就是离散的那些向量。

for example:!!!

> a=c('a','a','b','o','ab','ab');a
[1] "a" "a" "b" "o" "ab" "ab"

> x=factor(c('a','a','b','o','ab','ab'));x
[1] a a b o ab ab
Levels: a ab b o

注意的是 在因子中输出的时候会按照二进制表的顺序输出,所以会是先a 然后ab 然后a的没有了才会是b

 在网上看到一个很有意思的讨论帖例子:https://blog.csdn.net/Alina666666/article/details/51049974、

大致意思就是:

> a=c('涛'=100,'航'=95,'李'=80,'鱼'=75,'狗'=56)
> a
涛 航 李 鱼 狗
100 95 80 75 56

但是他加了level就发现不对劲了变了样子了

其实不需要特意研究level只要知道有个叫table()的函数就好了,因子是R特有的 是帮助我们分组而不是一定要分组。所以稍微了解一下就行了。同时我们在平时使用的时候也可以这样用

两组数据分开处理较为稳妥。

 

博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3