03 2019 档案

摘要:重命名全部的列是 name(data) <- c("NO","name") 但是数据集有点长的时候用name,没办法对单个列 查了一下 colnames(data)[2] <- 'newname' 可行 阅读全文
posted @ 2019-03-20 11:08 Shilo 阅读(9555) 评论(0) 推荐(1)
摘要:整理一下目前在工作和学习中用到的分类模型效果,也就是俗称的“准确率”的各种表达形式。避免以后忘记,查一下又要给某论坛交记忆税。 (一)准确率accuracy 准确率=分类正确的样本数目/总样本量 大众通常意义上的准确率,一般客户会默认我们所说的准确率是这个定义。 在实际工作中该指标基本没有实际意义( 阅读全文
posted @ 2019-03-11 17:13 Shilo 阅读(1905) 评论(0) 推荐(0)
摘要:python的数据类型和R差不多,但是需要注意的是字符访问方式与R不一样,另外,python中的“真”和“假”是True False(首字母大写)。 1、字符串 字符串和R的定义差不多比如: 就是字符串。 而且python的字符串既可以用单引号也可以用双引号来表示,当然它们必须是成对的。 BUT!访 阅读全文
posted @ 2019-03-07 20:28 Shilo 阅读(272) 评论(0) 推荐(0)
摘要:Python实现机器学习依赖于两个类库——SciPy和scikit-learn 一)SciPy SciPy是数学运算的基本类库,在机器学习的过程中,主要运用NumPy、Matplotlib和Pandas三个类库。具体来说,NumPy是用来准备数据的工具,Matplotlib则用来创建图表和实现可视化 阅读全文
posted @ 2019-03-06 21:56 Shilo 阅读(179) 评论(0) 推荐(0)