06 2016 档案

摘要:日前,Rstudio公司发布了sparklyr包。该包具有以下几个功能: 实现R与Spark的连接—sparklyr包提供了一个完整的dplyr后端 筛选并聚合Spark数据集,接着在R中实现分析与可视化 利用Spark的MLlib机器学习库在R中实现分布式机器学习算法 可以创建一个扩展,用于调用S 阅读全文
posted @ 2016-06-30 16:38 payton数据之旅 阅读(5948) 评论(0) 推荐(0)
摘要:Feature selection is a process of extracting valuable features that have significant influence ondependent variable. This is still an active field of 阅读全文
posted @ 2016-06-21 16:32 payton数据之旅 阅读(555) 评论(0) 推荐(0)
摘要:@theboysmithy did a great piece on coming up with an alternate view for a timeline for an FT piece. Here’s an excerpt (read the whole piece, though, i 阅读全文
posted @ 2016-06-17 11:17 payton数据之旅 阅读(317) 评论(0) 推荐(0)
摘要:A couple of weeks or so ago, I picked up an inlink from an OCLC blog post about Visualizing Network Flows: Library Inter-lending. The post made use of 阅读全文
posted @ 2016-06-08 11:06 payton数据之旅 阅读(743) 评论(0) 推荐(0)
摘要:上周在中国R语言大会北京会场上,给大家分享了如何利用R语言交互数据可视化。现场同学对这块内容颇有兴趣,故今天把一些常用的交互可视化的R包搬出来与大家分享。 rCharts包 说起R语言的交互包,第一个想到的应该就是rCharts包。该包直接在R中生成基于D3的Web界面。 rCharts包的安装 r 阅读全文
posted @ 2016-06-07 17:46 payton数据之旅 阅读(8809) 评论(2) 推荐(0)
摘要:摘要:自建国以来我国的气象系统已经十分完备,2015年中国气象局发布27号令后使得气象数据迈向开放数据(Open Data)新阶段,行业与公众可以使用海量气象数据助力企业,目前行业数据和海量气象数据还没有得到完全应用。本文主要研究气象数据对销售的影响,进而利用气象数据特性完成天气驱动行业销售的预测。 阅读全文
posted @ 2016-06-07 17:44 payton数据之旅 阅读(1232) 评论(0) 推荐(0)
摘要:摘要: 买家的评论文本数据是电子商务领域一种重要的数据形式,通过对其分析,电商卖家可以直接了解顾客对产品的态度与建议,提取顾客关注的热点问题,也可以进行顾客分类,实现精准营销,改进和提高生产和服务等;买家可以提取所关注属性的相关评价,了解舆论情感倾向,提高购物决策效率。但是大数据环境下海量文本的出现 阅读全文
posted @ 2016-06-07 17:41 payton数据之旅 阅读(1612) 评论(0) 推荐(0)
摘要:摘要:面向小微商户以及个人消费的小微信贷是当前互联网金融的重要发展方向,并且正在经历爆发式增长。在这个增长过程中,如何在没有实物抵押的情况下,通过互联网大数据分析实现快速准确征信是一个非常重要的问题。为此,不同的数据来源将各显神通地为信用评估提供依据。本文将通过一个真实的案例出发,进行分析和探讨,针 阅读全文
posted @ 2016-06-07 17:37 payton数据之旅 阅读(865) 评论(0) 推荐(0)
摘要:Open-source software is awesome. If I found that a piece of closed-source software was missing a feature that I wanted, well, bad luck. I probably cou 阅读全文
posted @ 2016-06-03 11:37 payton数据之旅 阅读(280) 评论(0) 推荐(0)
摘要:In my last article, I stated that for practitioners (as opposed to theorists), the real prerequisite for machine learning is data analysis, not math. 阅读全文
posted @ 2016-06-01 10:39 payton数据之旅 阅读(320) 评论(0) 推荐(0)