摘要: 2016年1月~2016年2月 迟子建 《额尔古纳河右岸》 2016年3月~2016年4月 王小平 《本领恐慌》 2016年5月~2016年6月 埃里克·霍弗 《狂热分子 群众运动圣经》 失意者的失意感很可能主要源于缺乏行动的机会,而失意感最深重的就是那些才具与性情都足以过一种行动性生活,却为环境所 阅读全文
posted @ 2016-07-15 09:13 li_volleyball 阅读(211) 评论(0) 推荐(0) 编辑
摘要: 大数据比赛 赛事公告 "优易数据杯 中国气象数据分析" R语言 基石 The R Project for Statistical Computing Rstudio r bloggers 汇总R语言 (这一个够用一年的) Awesome R 转载于 " " A curated list of awe 阅读全文
posted @ 2016-05-24 19:19 li_volleyball 阅读(1585) 评论(0) 推荐(0) 编辑
摘要: MySQL命令行操作技巧 MySQL是最重要的开源数据库之一,大部分网站都采用LAMP或LNMP架构作为后台系统架构,而其中的M就代表MySQL。由于在很多情况下,MySQL都是在Linux上使用,没有图形界面,所以本文就介绍一些MySQL在命令行下使用的技巧。 添加用户 在命令行窗口下输入: 上述 阅读全文
posted @ 2017-09-03 21:47 li_volleyball 阅读(275) 评论(0) 推荐(0) 编辑
摘要: 生成临时表 DROP TABLE IF EXISTS temp1; CREATE TEMPORARY TABLE temp1 SELECT userId,createTime FROM ; SELECT FROM temp1 ALTER TABLE temp1 ADD INDEX id_userId 阅读全文
posted @ 2017-08-16 14:36 li_volleyball 阅读(1336) 评论(0) 推荐(0) 编辑
摘要: 新建多选选项表types 以及 选择结果表 user_MultiSelect DROP TABLE IF EXISTS ; CREATE TABLE ( int(11) NOT NULL AUTO_INCREMENT, smallint(6) NOT NULL, varchar(10) NOT NU 阅读全文
posted @ 2017-08-03 17:16 li_volleyball 阅读(910) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2016-09-01 23:28 li_volleyball 阅读(158) 评论(0) 推荐(0) 编辑
摘要: # 大纲: * 认识 HBase * HBase 架构 * HBase读写流程 定义: * HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用Hbase 技术可在廉价PC Server 上搭建起大规模集群。它是一个可以随机访问的存储和检索数据的平台。他不加以数据的类型。允许动态的 阅读全文
posted @ 2016-08-08 07:29 li_volleyball 阅读(152) 评论(0) 推荐(0) 编辑
摘要: R语言作为BI中ETL的工具,增删改 R语言提供了强大的R_package与各种数据库进行数据交互。 外加其强大数据变换清洗函数,为ETL提供一条方便快捷的道路。 RODBC ROracal RMysql Rmongodb http://mirrors.ustc.edu.cn/CRAN/web/pa 阅读全文
posted @ 2016-08-01 14:43 li_volleyball 阅读(910) 评论(0) 推荐(0) 编辑
摘要: Yarn 原理介绍 大纲: Hadoop 架构介绍 YARN 产生的背景 YARN 基础架构及原理 Hadoop的1.X架构的介绍 在1.x中的NameNodes只可能有一个,虽然可以通过SecondaryNameNode与NameNode进行数据同步备份,但是总会存在一定的时延,如果NameNod 阅读全文
posted @ 2016-08-01 07:26 li_volleyball 阅读(263) 评论(0) 推荐(0) 编辑
摘要: 大数据实战(上) # MapReduce原理介绍 大纲: * Mapreduce介绍 * MapReduce2运行原理 * shuffle及排序 定义 * Mapreduce 最早是由google公司研究提出的一种免息nag大规模数据处理的并行计算模型和方法。是hadoop面向大数据并行处理的计算模 阅读全文
posted @ 2016-08-01 06:51 li_volleyball 阅读(308) 评论(0) 推荐(0) 编辑
摘要: lend_club 全球最大的P2P平台。 此文章基于R语言做简单分析。 step1 考虑到后续分析 将数据导入sqlserver,用到SSIS 如图 **此处有坑 step2 连接sqlserver,并将数据读入R。 step3 折线图 分面 阅读全文
posted @ 2016-07-31 06:53 li_volleyball 阅读(171) 评论(0) 推荐(0) 编辑
摘要: lend_club 全球最大的P2P平台2007~2012年贷款数据 "百度云下载" 。 此文章基于R语言做简单分析。 step1 考虑到后续分析 将数据导入sqlserver,用到SSIS 如图 此处有坑 step2 连接sqlserver,并将数据读入R。 折线图 分面 p 阅读全文
posted @ 2016-07-30 23:13 li_volleyball 阅读(548) 评论(0) 推荐(0) 编辑