文章分类 -  数据挖掘

摘要:I have been playing around with spatial modelling in the R INLA package. This blog just records a few thoughts I have had about using INLA for kriging 阅读全文
posted @ 2017-09-08 10:14 payton数据之旅 阅读(253) 评论(0) 推荐(0)
摘要:1、背景 CTR预估,广告点击率(Click-Through Rate Prediction)是互联网计算广告中的关键环节,预估准确性直接影响公司广告收入。CTR预估中用的最多的模型是LR(Logistic Regression)[1],LR是广义线性模型,与传统线性模型相比,LR使用了Logit变 阅读全文
posted @ 2017-09-05 10:07 payton数据之旅 阅读(309) 评论(0) 推荐(0)
摘要:Many introductions to Bayesian analysis use relatively simple didactic examples (e.g. making inference about the probability of success given bernoull 阅读全文
posted @ 2017-08-09 13:40 payton数据之旅 阅读(328) 评论(0) 推荐(0)
摘要:In my last posts ([here](http://flovv.github.io/Logo_detection_deep_learning/ and here, I described how one can detect logos in images with R. The fir 阅读全文
posted @ 2017-08-03 10:38 payton数据之旅 阅读(310) 评论(0) 推荐(0)
摘要:In this post, I'd like to focus on data munging, e.g. the process of acquiring and arranging data (typically in a tidymanner) prior to data analysis. 阅读全文
posted @ 2017-08-02 14:36 payton数据之旅 阅读(186) 评论(0) 推荐(0)
摘要:In the third part in a series on Tidy Time Series Analysis, we’ll use the runCor function from TTRto investigate rolling (dynamic) correlations. We’ll 阅读全文
posted @ 2017-07-31 10:04 payton数据之旅 阅读(424) 评论(0) 推荐(0)
摘要:For R users, there hasn’t been a production grade solution for deep learning (sorryMXNET). This post introduces the Keras interface for R and how it c 阅读全文
posted @ 2017-06-09 15:51 payton数据之旅 阅读(378) 评论(0) 推荐(0)
摘要:推荐系统里面有两个经典问题:EE和冷启动。前者涉及到平衡准确和多样,后者涉及到产品算法运营等一系列。Bandit算法是一种简单的在线学习算法,常常用于尝试解决这两个问题,本文为你介绍基础的Bandit算法及一系列升级版,以及对推荐系统这两个经典问题的思考。 什么是Bandit算法 为选择而生 我们会 阅读全文
posted @ 2017-06-06 11:40 payton数据之旅 阅读(595) 评论(0) 推荐(0)
摘要:本文要介绍的这一篇paper是ICML2016上一篇关于 CNN 在图(graph)上的应用。ICML 是机器学习方面的顶级会议,这篇文章--<< Learning CNNs for Graphs>>--所研究的内容也具有非常好的理论和实用的价值。如果您对于图的数据结构并不是很熟悉建议您先参考本文末 阅读全文
posted @ 2017-06-05 12:57 payton数据之旅 阅读(3023) 评论(0) 推荐(0)
摘要:1. 引言 偶尔遇到了这样一个问题,如何进行图片分类。最近deep learning很火,我们就试着用了一把,效果不错。Mxnet里面有很多训练的例子,可是如何拿训练好的模型去预测,如何生成训练数据,都没有实际的例子。这个就做一个实际的例子,来看看mxnet如何在我们工作中被使用。这个应用可以用来分 阅读全文
posted @ 2017-05-09 19:01 payton数据之旅 阅读(1488) 评论(0) 推荐(0)
摘要:卷积神经网络原理浅析 卷积神经网络(Convolutional Neural Network,CNN)最初是为解决图像识别等问题设计的,当然其现在的应用不仅限于图像和视频,也可用于时间序列信号,比如音频信号、文本数据等。在早期的图像识别研究中,最大的挑战是如何组织特征,因为图像数据不像其他类型的数据 阅读全文
posted @ 2017-04-19 10:41 payton数据之旅 阅读(2247) 评论(0) 推荐(1)
摘要:亚马逊将MXNet指定为官方深度学习平台,1月23日MXNet成为Apache的卵化项目。 无疑,这些将MXNet推向深度学习的热潮中,成为热捧的项目。当然,学习MXNet也是很有必要的。哈哈,加油深度学习。 目前支持以下的语言: Python R C++ Julia Scala Python R 阅读全文
posted @ 2017-04-12 15:38 payton数据之旅 阅读(1198) 评论(0) 推荐(0)
摘要:Increasing amount of data is available on the web. Web scraping is a technique developed to extract data from web pages automatically and transforming 阅读全文
posted @ 2017-04-11 09:58 payton数据之旅 阅读(396) 评论(0) 推荐(0)
摘要:Introduction If you ask any experienced analytics or data science professional, what differentiates a good model from a bad model – chances are that y 阅读全文
posted @ 2017-04-10 09:47 payton数据之旅 阅读(205) 评论(0) 推荐(0)
摘要:Introduction Reinforcement learning has recently gained a great deal of traction in studies that call for human-like learning. In settings where an ex 阅读全文
posted @ 2017-04-10 09:45 payton数据之旅 阅读(180) 评论(0) 推荐(0)
摘要:Machine learning uses so called features (i.e. variables or attributes) to generate predictive models. Using a suitable combination of features is ess 阅读全文
posted @ 2017-03-17 10:46 payton数据之旅 阅读(291) 评论(0) 推荐(0)
摘要:Introduction Over the last 12 months, I have been participating in a number of machine learning hackathons on Analytics Vidhya and Kaggle competitions 阅读全文
posted @ 2017-02-15 14:53 payton数据之旅 阅读(465) 评论(0) 推荐(0)
摘要:互动演讲版本请点这里 # dir <- 'F:/Projects/Rpackage/streamlineR' dir <- 'C:/Users/Jianhua/Dropbox/work_doc/Rpackage/streamlineR' knitr::opts_chunk$set(echo = TR 阅读全文
posted @ 2017-01-20 14:03 payton数据之旅 阅读(785) 评论(0) 推荐(0)
摘要:分类模型是数据挖掘中应用非常广泛的算法之一,常用的分类算法有Logistic模型、决策树、随机森林、神经网络、Boosting等。针对同一个数据集,可以有这么多的算法进行分析,那如何评估什么样的模型比较合理呢?本文就讲讲常用的模型验证武器,主要包括混淆矩阵、ROC曲线、提升度、增益法和KS统计量。 阅读全文
posted @ 2016-12-20 20:09 payton数据之旅 阅读(711) 评论(0) 推荐(0)
摘要:我们有一期的文章讲述了如何使用caret包进行数据的预处理,其中内容包括哑变量的创建、近零方差变了的筛选、数据标准化、缺失值处理、数据分割等。可以在教你使用caret包(一)--数据预处理获取更详细的内容介绍。下面我们接着讲讲如何使用caret包实现特征选择的任务。 特征选择的实质就是在已有的变量基 阅读全文
posted @ 2016-12-20 20:07 payton数据之旅 阅读(1094) 评论(0) 推荐(0)