摘要:https://www.svds.com/learning-imbalanced-classes/ 下采样即 从大类负类中随机取一部分,跟正类(小类)个数相同,优点就是降低了内存大小,速度快! http://www.tuicool.com/articles/r2ee2ie Learn more ab 阅读全文
docker 介绍
2017-05-24 11:29 by xplorerthik, 1100 阅读, 0 推荐, 收藏,
摘要:docker服务介绍: http://gitlab.qiyi.domain/docker/docker/blob/master/docs/userguide_ZH-CN/sample.mdhttp://gitlab.qiyi.domain/docker/docker/blob/master/docs 阅读全文
anacondas 下 安装xgboost & keras
2017-05-24 11:27 by xplorerthik, 840 阅读, 0 推荐, 收藏,
摘要:mac : 安装anaconda, cd到anaconda 目录下 pip install xgboost 测试: 在当前的¥ python , 进入python 环境 import xgboost 不报错就ok :) Windows环境测试ok 1.anaconda2 下载:https://www 阅读全文
SparkR 读取数据& Spark运行的配置
2017-05-24 11:12 by xplorerthik, 662 阅读, 0 推荐, 收藏,
摘要:1.本地LOCAL环境安装Spark并试运行配置(在Ubuntu系统下例子) # 打开文件配置环境变量: JAVA,SCALA,SPARK,HADOOP,SBT gedit /etc/profile # 在文件中加入以下行 export JAVA_HOME=/usr/java/jdk1.8.0_51 阅读全文
R语言读取MySQL数据表
2017-05-24 11:10 by xplorerthik, 2415 阅读, 0 推荐, 收藏,
摘要:1.R中安装RODBC包 install.packages("RODBC") 2.在Windows系统下安装MySQL的ODBC驱动 注意区分32位和64位版本; http://dev.mysql.com/downloads/connector/odbc 3.ODBC的系统配置 在Windows操作 阅读全文
R语言读取Hive数据表
2017-05-24 11:08 by xplorerthik, 4364 阅读, 0 推荐, 收藏,
摘要:R通过RJDBC包连接Hive 目前Hive集群是可以通过跳板机来访问 HiveServer, 将Hive 中的批量数据读入R环境,并进行后续的模型和算法运算。 1. 登录跳板机后需要首先在Linux下进行配置 从root权限切换到bzsys用户,才能够通过验证读取Hive。首先需要配置Hadoop 阅读全文
R语言的并行运算(CPU多核)
2017-05-24 11:06 by xplorerthik, 19764 阅读, 0 推荐, 收藏,
摘要:通常R语言运行都是在CPU单个核上的单线程程序。有时我们会有需求对一个向量里的元素应用相同的函数,最终再将结果合并,并行计算可以大幅节约时间。 为了支持R的并行运算, parallel包已经被纳入了R的BASE库中,可以被直接调用,来实现在同一个CPU上利用多个核Core同时运算相同的函数。 版本一 阅读全文
Installing R under Unix-alikes
2017-05-24 11:05 by xplorerthik, 304 阅读, 0 推荐, 收藏,
摘要:Linux上R的安装 可参考https://cran.r-project.org/doc/manuals/r-release/R-admin.html#Installing-R-under-Unix_002dalike 1) 下载R-3.2.1.tar.gz https://cran.r-proje 阅读全文
logistic growth model . 求解方法 (高斯牛顿法)
2017-05-17 15:23 by xplorerthik, 915 阅读, 0 推荐, 收藏,
摘要:https://www.stat.tamu.edu/~jnewton/604/chap4.pdf http://www.metla.fi/silvafennica/full/sf33/sf334327.pdf 在求二阶导时, fi 和 偏fi/偏theta 都是是theta的函数, 所以要用乘法求导 阅读全文
git 的使用方法
2017-05-17 10:10 by xplorerthik, 380 阅读, 0 推荐, 收藏,
摘要:git 的使用有3个主要步骤: 1.1 工作区域操作: 在自己的git账号下构建一个工作目录, 并往工作目录里添加文件内容(cp /root/data/VIP_Amount_prediction/* ./)。 cd 当前工作目录, git init, 初始化git仓库, 用于监视当前工作目录下的内容 阅读全文
浙公网安备 33010602011771号